2D+3D捕获策略
如果您的应用同时需要2D和3D数据,那么您可以参考本教程。
我们解释并强调了不同的2D-3D捕获方法的优缺点,阐明了一些限制,并解释了它们如何影响循环时间。我们也谈到了使用外部光源和使用内部投影仪来拍摄2D图像的区别。
- 2D数据
RGB图像
- 3D数据
获取2D数据有两种不同的方式:
单独通过
camera.capture(Zivid::Settings2D).imageRGBA()
获取,请参阅 2D图像捕获流程 。作为3D捕获的一部分
camera.capture(Zivid::Settings).pointCloud.copyImageRGBA()
,请参阅 点云捕获过程 。
使用哪一种方式来获取2D数据取决于您的要求。
不同的场景会导致不同的权衡。我们首先根据您需要的数据对其进行细分。然后我们将讨论不同场景下捕获速度与图像质量的权衡。
关于外部光源
在我们讨论不同的策略之前,我们需要讨论外部光源。2D捕获的理想光源是强漫射光,因为这会限制 光晕效果 。使用内部投影仪作为光源时,光晕效果几乎是不可避免的。 以一定角度安装相机 可显着降低这种影响,但外部漫射光源仍然会提供更好的效果。外部光源会导致3D数据中出现额外噪声,因此最好在3D采集期间关闭外部光源。
In addition to the reduction in blooming effects, strong external light can smooth out variations in exposure due to variations in ambient light. Typical sources for variations in ambient light:
日光变化(白天/黑夜、云等)
开门和关门
顶灯打开和关闭
Such variations in exposure impact 3D and 2D data differently. The impact of exposure variations in the 2D data depends on the detection algorithm used. If segmentation is performed in 2D, then these variations may or may not impact segmentation performance. For the point cloud, you may find variations in point cloud completeness due to variations in noise.
这就引出了一个问题:我们是否应该使用相机的投影仪来捕获2D图像?
查看 优化彩色图像 了解有关该主题的更多信息。
对于Zivid One+,一个重要的问题是要注意在2D捕获期间投影仪打开时发生的切换限制。具体请参阅 在2D和3D捕获调用之间切换时按顺序执行捕获的限制 。
如果每个捕获周期之间有足够的时间预算,则可以减轻切换限制。我们可以在系统做其他事情时进行该切换动作。例如,当机器人在相机前方移动时。在本教程中,我们将其称为虚拟捕获(dummy capture)。
2D数据先于3D数据
如果您在2D中执行分割,然后确定您的抓取位姿,那么您需要在获取3D之前得到2D数据。获取2D数据的最快方法是使用单独的2D捕获。因此,如果您在使用3D数据之前就需要使用2D数据,那么您应该先执行单独的2D捕获。
以下代码示例展示了您可以如何:
捕获2D图像
使用2D数据和并行执行3D捕获
如果工作周期允许:可以在不影响整体表现的情况下执行虚拟捕获,避免切换带来的时间损失。
auto camera = zivid.connectCamera();
dummyCapture2D(camera, settings2D);
const auto frame2dAndCaptureTime = captureAndMeasure<Zivid::Frame2D>(camera, settings2D);
std::cout
<< "Starting 3D capture in current thread and using 2D data in separate thread, such that the two happen in parallel"
<< std::endl;
std::future<void> userThread =
std::async(std::launch::async, useFrame<Zivid::Frame2D>, std::ref(frame2dAndCaptureTime.frame));
const auto frameAndCaptureTime = captureAndMeasure<Zivid::Frame>(camera, settings);
useFrame(frameAndCaptureTime.frame);
std::cout << "Wait for usage of 2D frame to finish" << std::endl;
userThread.get();
printCaptureFunctionReturnTime(frame2dAndCaptureTime.captureTime, frameAndCaptureTime.captureTime);
Following is a table with the expected performance for the different scenarios.
3D捕获后立即执行2D捕获,背靠背执行捕获 |
3D捕获后执行2D捕获,有延迟 [1] |
||||
---|---|---|---|---|---|
使用投影仪进行2D采集 |
不使用投影仪进行2D采集 |
使用投影仪进行2D采集 |
不使用投影仪进行2D采集 |
||
One+ |
2D |
~420 ms [3] |
~70 ms |
~30 毫秒 |
~30 毫秒 |
3D |
~870 ms [2] |
~320 ms |
~870 ms [2] |
~320 ms |
|
Two |
2D |
~50 毫秒 |
~35 毫秒 |
~30 毫秒 |
~25 毫秒 |
3D |
~140 毫秒 |
~130 ms |
~140 毫秒 |
~130 ms |
备注
在同一相机上任何正在进行的捕获(2D 或 3D)的所有处理完成之前,不会开始新的捕获。当使用同一台相机连续调用两个捕获时,这会影响事件的进程。如需了解更多相关信息,请参阅 使用同一台相机进行连续拍照的性能限制 。
2D数据作为如何使用3D数据的一部分
在这种情况下,我们不必在使用3D数据之前获取2D数据。作为3D采集的一部分,您始终会获得2D数据。因此,我们只需要关心整体捕获速度和图像质量。
速度
为了获得最佳速度,我们仅依靠3D采集来获取良好的2D数据。2D数据无需额外采集或单独采集。
2D图像质量
为获得最佳的2D图像质量,建议使用一个单独的采集项。这可以通过上一节中讨论的单独的2D捕获来实现,也可以通过 使用UseFirstAcquisition的HDR捕获 来实现。为了获取更好的颜色数据而在3D HDR捕获中添加一个单独的采集项,在速度方面可能代价高昂。这是因为曝光需要乘以投影数量,投影数量由 Vision Engine(视觉引擎) 决定。该限制可能会在未来的SDK更新中移除。
Following is a table that shows what you can expect from the different configurations.
At the end you will find a table showing actual measurements on different hardware with the Fast Consumer Goods settings for Zivid Two M70 (Z2 M70 Fast
).
- 快速
使用来自3D捕获中的2D数据。无需特殊的2D采集或设置。
- 较快速
单独的2D捕获,紧接着执行3D捕获。
- 慢速
添加了一个专为获得最佳2D数据而进行特殊设置的额外采集项的3D捕获。
快速 |
较快速 |
慢速 |
|||
---|---|---|---|---|---|
3D [4] |
2D使用投影仪 + 3D |
2D不使用投影仪 + 3D |
3D (+1 for 2D) [5] |
||
One+ |
2D |
N/A |
~420 ms |
~30 毫秒 |
N/A |
3D |
~340 ms |
~870 ms |
~320 ms |
~910 ms |
|
Two |
2D |
N/A |
~40 ms |
~40 ms |
N/A |
3D |
~280 ms |
~330 ms |
~290 ms |
~370 ms |
These are Fast Consumer Goods settings for Zivid Two M70 (Z2 M70 Fast
).
These are Fast Consumer Goods settings for Zivid Two M70 (Z2 M70 Fast
) with one additional acquisition for 2D with or without projector. The 2D acquisition is placed as the first acquisition and we set UseFirstAcquisition
.
2D数据在使用3D数据之后
作为3D采集的一部分,您总是能够获得2D数据。下表展示了3D捕获时间的示例。
Consumer Goods Settings |
Zivid One+ |
Zivid Two |
||||
---|---|---|---|---|---|---|
Intel UHD 750 |
Intel UHD G1 |
NVIDIA 3070 |
Intel UHD 750 |
Intel UHD G1 |
NVIDIA 3070 |
|
High-end [6] |
Low-end [7] |
High-end [8] |
High-end [6] |
Low-end [7] |
High-end [8] |
|
N/A |
N/A |
N/A |
556 (±9) ms |
947 (±379) ms |
280 (±4) ms |
|
N/A |
N/A |
N/A |
558 (±9) ms |
949 (±394) ms |
281 (±5) ms |
|
586 (±2) ms |
903 (±4) ms |
342 (±1) ms |
N/A |
N/A |
N/A |
|
586 (±2) ms |
901 (±4) ms |
342 (±1) ms |
N/A |
N/A |
N/A |
搭载了GPU:Intel UHD Graphics 750 (ID:0x4C8A) 和 CPU:11th Gen Intel(R) Core(TM) i9-11900K @ 3.50GHz, 10GbE 的高端机器
搭载了GPU:Intel UHD Graphics G1 (ID:0x8A56) 和 CPU:Intel(R) Core(TM) i3-1005G1 CPU @ 1.20GHz, 1GbE 的低端机器
搭载了GPU:NVIDIA GeForce RTX 3070 和 CPU:11th Gen Intel(R) Core(TM) i9-11900K @ 3.50GHz, 10GbE 的高端机器
然而,对3D图像质量进行的设置优化并不总是对2D图像质量有效。因此,在3D捕获之后进行单独的2D捕获可能是个好主意。下表列出了对于不同场景的预期表现。
3D捕获后立即执行2D捕获,背靠背执行捕获 |
3D捕获后执行2D捕获,有延迟 [9] |
||||
---|---|---|---|---|---|
使用投影仪进行2D采集 |
不使用投影仪进行2D采集 |
使用投影仪进行2D采集 |
不使用投影仪进行2D采集 |
||
One+ |
3D |
~680 ms [10] |
~120 毫秒 |
~120 毫秒 |
~120 毫秒 |
2D |
~380 ms [11] |
~30 毫秒 |
~380 ms [11] |
~30 毫秒 |
|
Two |
3D |
~140 毫秒 |
~140 毫秒 |
~130 ms |
~110 ms |
2D |
~40 ms |
~40 ms |
~40 ms |
~40 ms |
占空比低(工作周期足够长),我们有时间执行虚拟捕获。
当使用投影仪进行2D捕获时,对于One+相机有350毫秒的2D➞3D切换时间延迟,具体请参阅 在2D和3D捕获调用之间切换时按顺序执行捕获的限制 。
当使用投影仪进行2D捕获时,对于One+相机有650毫秒的3D➞2D切换时间延迟,具体请参阅 在2D和3D捕获调用之间切换时按顺序执行捕获的限制 。
备注
在同一相机上任何正在进行的捕获(2D 或 3D)的所有处理完成之前,不会开始新的捕获。当使用同一台相机连续调用两个捕获时,这会影响事件的进程。如需了解更多相关信息,请参阅 使用同一台相机进行连续拍照的性能限制 。
总结
下表列出了不同的2D+3D捕获的配置,并列出了这些不同配置在速度和图像质量方面的相对表现。我们将应用分为两种情况:
循环时间非常快,每个捕获循环都需要紧接着上一个捕获循环发生。
循环时间足够慢,允许在每个捕获循环之间进行额外的虚拟捕获。在最坏的情况下,额外的捕获最多可能需要800毫秒。从经验来看,对于循环时间大于2秒的应用,虚拟捕获可以节省时间。
背靠背捕获
捕获循环(循环之间无等待时间) |
速度 |
2D质量 |
|
---|---|---|---|
One+ |
Two |
||
3D ➞ 2D [13] |
最慢 |
快速 |
最好 |
2D ➞ 3D [12] |
慢速 |
较快 |
最好 |
3D (w/2D [15]) |
快速 |
快速 |
较好 |
3D |
最快 |
最快 |
良好 |
对于背靠背捕获的场景,除非投影仪亮度的设置相同,否则无法避免切换带来的延迟。在这种情况下,最好将颜色模式设置为 UseFirstAcquisition
,请参阅 Color Mode 。
低占空比捕获
捕获循环(等待下一个循环的时间) |
速度 |
2D质量 |
|
---|---|---|---|
One+ |
Two |
||
慢速 |
快速 |
最好 |
|
良好 |
较快 |
最好 |
|
快速 |
快速 |
最好 |
|
3D ➞ 3D |
最快 |
最快 |
良好 |
当使用投影仪进行2D捕获时,对于One+相机有350毫秒的2D➞3D切换时间延迟,具体请参阅 在2D和3D捕获调用之间切换时按顺序执行捕获的限制 。
当使用投影仪进行2D捕获时,对于One+相机有650毫秒的3D➞2D切换时间延迟,具体请参阅 在2D和3D捕获调用之间切换时按顺序执行捕获的限制 。
(适用于 One+)对于低占空比的应用,我们可以附加一个虚拟2D/3D捕获,以将3D➞2D/2D➞3D切换带来的延迟从关键环节移除。
将2D采集置于第一项的3D捕获,并将颜色模式设置为 UseFirstAcquisition
,请参阅 Color Mode 。
Following is a table showing actual measurements on different hardware with the Fast Consumer Goods settings for Zivid Two M70 (Z2 M70 Fast
).
备注
We use the Fast Consumer Goods settings for Zivid Two (Z2 M70 Fast
) and Zivid One+ (Z1+ M Fast
).
2D+3D 捕获 |
Zivid One+ |
Zivid Two |
||||||
---|---|---|---|---|---|---|---|---|
Intel UHD 750 |
Intel UHD G1 |
NVIDIA 3070 |
Intel UHD 750 |
Intel UHD G1 |
NVIDIA 3070 |
|||
High-end [18] |
Low-end [19] |
High-end [20] |
High-end [18] |
Low-end [19] |
High-end [20] |
|||
先捕获2D图像,再捕获3D图像 |
||||||||
✓ |
✓ |
2D |
418 (±0.7) ms |
420 (±0.8) ms |
419 (±0.6) ms |
51 (±1) ms |
52 (±7) ms |
50 (±1) ms |
3D |
1110 (±7) ms |
1439 (±6) ms |
865 (±9) ms |
607 (±3) ms |
1024 (±426) ms |
325 (±2) ms |
||
✓ |
2D |
23 (±0.4) ms |
24 (±0.4) ms |
26 (±1) ms |
23 (±0.3) ms |
25 (±1) ms |
24 (±0.3) ms |
|
3D |
1104 (±8) ms |
1438 (±9) ms |
861 (±5) ms |
608 (±3) ms |
1030 (±456) ms |
328 (±1) ms |
||
✓ |
2D |
73 (±0.5) ms |
74 (±0.7) ms |
73 (±0.5) ms |
50 (±1) ms |
51 (±0.5) ms |
49 (±1) ms |
|
3D |
566 (±5) ms |
893 (±3) ms |
319 (±4) ms |
607 (±3) ms |
1024 (±426) ms |
326 (±0.5) ms |
||
2D |
23 (±0.6) ms |
23 (±0.4) ms |
26 (±1) ms |
12 (±0.2) ms |
14 (±10) ms |
13 (±0.3) ms |
||
3D |
563 (±2) ms |
897 (±5) ms |
318 (±1) ms |
610 (±3) ms |
1027 (±407) ms |
329 (±2) ms |
||
先捕获3D图像,再捕获2D图像 |
||||||||
✓ |
✓ |
2D |
418 (±0.7) ms |
420 (±0.7) ms |
419 (±0.6) ms |
51 (±1) ms |
52 (±10) ms |
50 (±1) ms |
3D |
1105 (±6) ms |
1436 (±10) ms |
864 (±6) ms |
604 (±3) ms |
1010 (±393) ms |
324 (±1) ms |
||
✓ |
2D |
418 (±0.8) ms |
420 (±0.7) ms |
419 (±0.6) ms |
43 (±0.2) ms |
43 (±7) ms |
43 (±0.3) ms |
|
3D |
593 (±3) ms |
889 (±17) ms |
352 (±2) ms |
592 (±3) ms |
981 (±456) ms |
323 (±0.9) ms |
||
✓ |
2D |
73 (±0.5) ms |
74 (±0.6) ms |
73 (±0.5) ms |
50 (±1) ms |
51 (±14) ms |
49 (±1) ms |
|
3D |
562 (±2) ms |
891 (±3) ms |
319 (±3) ms |
604 (±3) ms |
1008 (±338) ms |
325 (±3) ms |
||
2D |
73 (±0.6) ms |
74 (±0.6) ms |
73 (±0.5) ms |
40 (±0.4) ms |
40 (±12) ms |
40 (±0.3) ms |
||
3D |
593 (±3) ms |
889 (±15) ms |
352 (±2) ms |
557 (±3) ms |
945 (±408) ms |
287 (±3) ms |
||
捕获包含2D数据的3D图像 |
||||||||
✓ |
✓ |
2D |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
3D |
1108 (±41) ms |
1403 (±44) ms |
910 (±43) ms |
622 (±3) ms |
1108 (±503) ms |
370 (±1) ms |
||
✓ |
2D |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
0 (±0.0) 毫秒 |
|
3D |
1111 (±41) ms |
1403 (±42) ms |
911 (±42) ms |
627 (±5) ms |
1106 (±471) ms |
373 (±4) ms |
使用了投影仪进行2D捕获。
背靠背捕获或者捕获循环之间存在延迟。这允许消除潜在的初始切换的时间损失。
搭载了GPU:Intel UHD Graphics 750 (ID:0x4C8A) 和 CPU:11th Gen Intel(R) Core(TM) i9-11900K @ 3.50GHz, 10GbE 的高端机器
搭载了GPU:Intel UHD Graphics G1 (ID:0x8A56) 和 CPU:Intel(R) Core(TM) i3-1005G1 CPU @ 1.20GHz, 1GbE 的低端机器
搭载了GPU:NVIDIA GeForce RTX 3070 和 CPU:11th Gen Intel(R) Core(TM) i9-11900K @ 3.50GHz, 10GbE 的高端机器
小技巧
如果您想在您的PC上测试不同的2D-3D策略,您可以从YML文件加载设置并运行 Capture2D+3D.cpp 示例。您可以打开 示例 页面,然后选择C++标题来阅读相关说明。