6 月 4 日消息,OpenCV 是一款跨平台的计算机视觉和机器学习软件平台,在计算机视觉领域广泛使用,是目前人工智能应用中的重要基础平台。
OpenCV 4.10.0 版本更新于昨日发布(点此查看),对其深度神经网络(DNN) 模块进行了许多改进、实验性 NumPy 2.0 支持、Android 改进、NVIDIA CUDA 12.4+ 平台支持、RISC-V 和 ARM 改进、oneAPI 2024 支持、实验性 Windows ARM64 支持、实验性苹果 VisionOS 支持,以及 Linux 上的本机 Wayland 后端。
附 OpenCV 4.10.0 更新内容如下:
Core Module:
-
为 cv::Mat 添加了 CV_FP16 数据类型 #24892, #24918。弃用了 convertFp16 函数,添加了对 cv::Mat::convertTo 及其类似函数的 FP16 支持。
-
修复了一些与 FP16 算术相关的未定义行为 #25598
-
扩展了 HAL API,用于 minMaxIdx #25563, LUT #25554, meanStdDev #25483, moments 25490, normHamming #25491。为 transpose #25342 和一些算术函数 #25574, #25506 添加了 HAL 条目。
-
持久性:将实数输出为用户友好的表达方式。#25351
-
为并行框架添加了 cgroups v2 支持 #25285
-
添加了对 cartToPolar 和 polarToCart 的就地支持 #24893
Imgproc Module:
-
为 cv::remap 添加了相对位移场选项 #24621
-
添加了新的 findContours 实现 #25146, #25680, #25385
-
修复了 EMD 分配问题 #25583
-
修复了大内核情况下 stackBlur 的错误 #25513
-
扩展了 HAL 支持 projectPoints #25511, equalizeHist #25565, Otsu threshold #25509。为 gaussianBlur #25397, remap #25399, bilaterialFilter #25343 添加了新的 HAL 条目。
Calib3d Module:
-
修复了手眼校准方法中的几个错误 #24897, #25423
-
修复了 findHomography 实现中的几个错误 #25308, #25665
-
在 findChessboardCorners 实现中进行了多项改进:#25365, 25195, 25177, 25182, 25145, 24779, 24710, 24833, 25090
-
改进了对称圆点网格图案检测 #25258
-
修复了 USAC 中可能的无限循环 #24987
-
改变了鱼眼校准中焦距初步估计的方法 #25030
-
添加了 Fisheye 相机模型的 solvePnP 实现 #25028
DNN Module:
-
显著改进了 DNN 的内存消耗 #25181, 25163
-
添加了 Net::dumpToPbtxt 方法,以使用 Netron 审查优化后的图 #25582
-
添加了对多个 TFLite 层的支持:Global_Pool_2D #25613, Transpose #25297, HardSwishInt8 #24985, split, fully connected, SoftMax, Cast #25273。
-
修复了多个 ONNX 层中的错误:Slice #25660, Range #25414, Clip #25319, ReduceMean #25120, Einsum #25100, Norm #24808, Concat 中负轴支持 #24865。
-
添加了新的 ONNX 层:Mod #24765, GroupNorm 层 #24610。
-
添加了更多与 OpenVINO 兼容的 DNN 层 #25524, #25291, 25518。
-
优化了 RISC-V RVV 扩展的 fastDepthwiseConv #25361 和 int8 层 25230
-
优化了 RISC-V P Packed SIMD Extension v0.5.2 的 fastDepthwiseConv #24556
-
优化了 Attention #24476, #25271, #25238, #24613, 25076。
-
为 scatter 和 scatterND 添加了并行版本 #24813
-
在 CuDNN 后端中添加了广播支持(如果 a.rank() != b.rank())#24834
-
调整了卷积的 Winograd 算法使用 #24709
-
添加了 Raft 模型支持和示例 #24913
-
为 DNN 模块中的 NaryEltwiseLayer 添加了 Vulkan 后端 #24768
-
改进了现代 Yolo 检测器的支持。添加了示例和文档 #24898, #24611
-
添加了 CuDNN 9+ 支持 #25412
-
添加了 OpenVINO 2024 支持 #25199
G-API Module:
-
将 G-API ONNXRT 后端移植到 V2 API #25662
-
实现了并发执行器 #24845
-
为 GMat 添加了快速值初始化支持 #25055
-
修复了 OV 后端对非实数类型的均值 / 尺度预处理支持 #24704
Objdetect Module:
-
修复了某些情况下 Charuco 棋盘生成的不准确问题 (.generateImage ()) #24873, #25673
-
修复了 Aruco 检测器的线程安全问题 #24807,使 Aruco 检测器更加确定性 #24829
-
添加了 QR 码结构化附加解码模式 #24548
-
修复了 QR 码检测器和解码器中的多个错误 #25026
-
修复了条形码 detectAndDecode #25035
-
将剩余的 Aruco 和 Charuco 文档和示例移植到现代 API #23018
VideoIO:
-
修复了 InternalFFMpegRegister 初始化中的竞争条件。#25419
-
Orbbec 相机支持 MacOS,Gemini2 和 Gemini2L 支持 Y16 格式 #24877
-
为 V4L2 后端添加了 V4L2_PIX_FMT_SGRBG8 像素格式支持 #25249
-
修复了当 CAP_PROP_FORMAT == -1 时,VideoCapture 返回的不正确时间戳 #24828
Python Bindings:
-
实验性 NumPy 2.0 支持
-
为 Rect2f 和 Point3i 添加了 Python 绑定 #24919
-
将 MatLike 的 dtype 切换为数值类型,而不是通用类型 #25406
-
在文件名预期的地方添加了路径对象支持 #24773:
-
为 JavaCameraView 添加了任何屏幕方向支持 #24827,在安卓示例中添加了 avaCamera2View 和 NativeCameraView 支持 #24869。修复了 JavaCamera2View 中的双预览初始化错误 #24869。
-
从构建脚本和教程中移除了 Android AIDL,因为自 4.9.0 起不再需要 #24843
-
启用 Emscripten 文件系统 #24949
-
为现代 Android Studio 更新了安卓示例。添加了从 Maven 支持 OpenCV 的功能。#24473
-
向 AAR 添加了 kotlin 类 #24884
-
为 ARM v8 和 v9 处理器添加了 KleidiCV 作为 HAL(CMake 选项 -DWITH_KLEIDICV=ON)#25443, #25618
平台支持:
-
CUDA 12.4+ 支持 #25658
-
Linux 的 Wayland 后端 #25551, #25510, #25502
-
MacOS 及其衍生产品的新 LAPACK 接口支持 #24804, #25625
-
为带有 P 扩展的 RISC-V 处理器添加了初始 HAL 版本 #25167
-
为 ARM v8 和 v9 处理器添加了 KleidiCV 作为 HAL(CMake 选项 -DWITH_KLEIDICV=ON)#25443, #25618
-
添加了 zlib-ng 作为经典 zlib 的替代品(CMake 选项 -DWITH_ZLIB_NG=ON)#24782
-
OneAPI 2024 支持(IPP, TBB)
-
实验性 Apple VisionOS 支持
-
实验性 Windows ARM64 支持