“没错!这正是目前传统办法的一大问题!图像上的内容只要一多一杂乱,就很容易分析不明白。例如在纷繁的十字路口,行人、车辆、建筑、红绿灯、交通指示牌。有太多的东西需要检测分割。”孟繁岐说着,展示了一张交通要道的复杂场景图,其中信息量很大。
本小章还未完,请点击下一页继续阅读后面精彩内容!
他心里也在嘀咕,不知道这主持人是懂还是不懂,这捧哏的气口和内容选择的相当不错。
传统式视觉技术一直存在这样的缺陷,其中一大原因也是因为能够处理的分辨率有限,如果相同的分辨率内塞入了太多的内容,较小的目标就很难被分析清楚。
这是因为目前的深度神经网络会下采样数据,在分辨率仅有原本八分之一乃至十六分之一大小的【特征图】上进行运算,如此一来,小的目标和物体在特征图上可能只能够分到一两个像素点的大小。
在这样的情况下,指望对单张平面图像做到详尽的内容分析,当然是不现实的。
“神经辐射场能够以任意精度来渲染场景。此外,所有的信息都嵌入到神经网络的权重中,所以内存使用量主要取决于网络的大小,而不是场景的复杂度或分辨率。这是一次彻底的改变,从根本上克服了传统3D重建方法的一些主要限制。”
“只要算力足够强大,就能够以夸张的精细程度重建实时的行车场景。相对于非常表面的2D图像分析方式,我想基于神经辐射场的自动驾驶系统,它的准确性和安全性,是不言而喻的。”
一个是在平面上检测不同位置的东西是什么,另一个则是直接在空间中感知什么位置的空间被占据了。
后者的安全性当然要强太多。
此时的自动驾驶技术,几乎全部都停留在如何把相机拍到的东西给识别明白的阶段,有胆子像孟繁岐这样,直接重构三维世界去分析应该如何自动驱使车辆的,那是少之又少。
“孟同学,我看旁边的教授们都还在相互讨论着里面的原理问题,可能一会才会提问。我不是搞技术的,就先问一问我比较关心的问题,跟你刚才所说的内容角度不是特别一样。”
台下第一排,一位相貌稳重庄严,身着白衬衫加西裤的领导人拿起麦克风,提出了一个来自官方视角的问题:“人工智能不仅是一项新技术,同时也是一个新的行业新的产业,我想提问一下,你对就业和岗位方向的问题是如何看待的。”