起因: 测试yolov5在本地电脑上的速度,输入640*640的图像,推理时间需要100ms左右,不正常

切换到conda环境下,发现安装了onnxruntime 以及onnxruntime-gpu

 self.net = ort.InferenceSession(model_pb_path, providers=['CUDAExecutionProvider'])

首先是直接

pip uninstall onnxruntime

提示:AttributeError: module ‘onnxruntime’ has no attribute ‘InferenceSession’

需要把onnxruntime-gpu卸载掉

最后重新安装

pip install onnxruntime-gpu

运行发现时间只有30ms

GitHub 加速计划 / on / onnxruntime
13.76 K
2.79 K
下载
microsoft/onnxruntime: 是一个用于运行各种机器学习模型的开源库。适合对机器学习和深度学习有兴趣的人,特别是在开发和部署机器学习模型时需要处理各种不同框架和算子的人。特点是支持多种机器学习框架和算子,包括 TensorFlow、PyTorch、Caffe 等,具有高性能和广泛的兼容性。
最近提交(Master分支:2 个月前 )
120cb5a8 ### Description Add I/O binding example using onnx data type in python API summary. The API is available since 1.20 release. ### Motivation and Context Follow up of https://github.com/microsoft/onnxruntime/pull/22306 to add some documentation. 5 天前
4ffc1ff3 ### Description Fixes: (1) cpu kernel: applying scale before bias and mask like other MHA ops (2) cpu kernel: correct offset during appending past to present. (3) cuda kernel: apply mask if provided; fix output_qk offset. Add DMMHA unit tests 6 天前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐