19
2025
-
04
人形机器人感知革命!创新形态机器视觉传感器涌现
浏览:447
发布:2025-04-19 04:31:00
【导语】人形机器人的运动能力正进入激烈的“军备竞赛”阶段,但实现具身智能仍需AI、算力和感知技术的配(pèi)合(hé)。近(jìn)期(qī),速(sù)腾(téng)聚(jù)创(chuàng)和(hé)锐(ruì)思(sī)智(zhì)芯分别推出了创新的机器视觉传感器,为机器人行业带来了新的探索方向。这些创新产品不仅提升了机器人的感知能力,还为机器人在复杂环境下的应用提供了更多可能性,预示着人形机器人商业化进程中的又一重要进展。
电子发烧友网报道(文/梁浩斌)人形机器人的运动能力,已经进入了“军备竞赛”阶段,各家纷纷展出自家机器人的行走、跳舞,甚至空翻等能力,并不断用新的动作刷新人们对于人形机器人的能力理解。
然而运动能力归运动能力,人形机器人目前主要还是需要预设固定程序运行,离真正要实现具身智能还很远。要实现具身智能,还需要AI、算力、感知的配合。最近速腾聚创、锐思智芯分别推出了创新形态的机器视觉传感器。
速腾聚创AC1:姿态、深度、色彩信息三合一
今年年初的发布会上,速腾聚创发布了一个面向机器人视觉的全新传感器解决方案Active Camera,这个方案包含传感器硬件、运算核心、AI算法等的智能生态。在3月28日,速腾聚创终于发布了Active Camera的首款产品AC1,以及AI-Ready生态。
在传感器硬件上,AC1集成了IMU姿态传感(gǎn)器(qì)、深度传感器(固态激光雷达+CMOS)以及一个RGB相机,在单一模块中提供深度信息、图像色彩信息和运动姿态信息,并实现硬件级融合,将三大信息的时间和空间进行同步对齐。
AC1提供120°x60°超大融合视场角,较传统3D相机高出70%;色彩FOV达到144°×78°;测距能力达到70米,是传统3D相机的6倍;测距精度3cm@1σ测距精度稳定不随距离衰减,可精准还原远近物体形状大小,帮助机器人实现准确的路径规划。
同时AC1避免了传统3D相机存在的强光干扰问题,能够在100KLux阳光下工作,克服强光干扰问题,适应更丰富的场景。
面向机器人开发者用户,速腾聚创打造了AI-Ready生态,通过AC Studio为Active Camera用户提供包括驱动程序、数据标定、数据融合在内的开源工具包,以及SLAM、高阶多模态感知等开源算法,支持用户深度二次开发,并通过专用跨平台软件AC Viewer,提供最佳的数据融合、SLAM、目标检测等功能体验。
同时,AI-Ready生态将提供避障类目标数据集、认知识别类数据集,帮助开发者训练模型算法,快速完成场景功能化的二次开发,以及方案部署。
同时,WIKI以开发者文档方式全面收录Active Camera与AI-Ready生态的信息;数据集提供多种场景下的训练数据,将在后续逐步上线,供开发者免费使用。AI-Ready生态帮助行业升级机器人项目流程,让软件快速迭代的开发模式驱动机器人产品化商业化落地。
AC1通过融合多传感器,在硬件上实现了出厂的传感器标定,以及软件上实现了数据融合和对齐,实际上这在技术上也有一定的难点。
此前我们在《激光雷达+摄像头融合传感器,有没有搞头?》一文里介绍了京瓷展示的世界上第一个实现光轴对齐的摄像头+激光雷达融合传感器,通过对齐两种传感器的光轴,实现激光雷达和摄像头无视差的数据融合。
但在实际产品中,由于激光雷达通过发射激光束并接收反射回来的信号来测量距离,生成点云数据;而摄像头则捕捉环境的二维图像。这两种传感器的数据格式不同,坐标系也不同,使得直接对齐它们的光轴变得极为复杂。
从速腾聚创对AC1的描述中,同样是实现了固态激光雷达和相机数据的硬件级融合,这对于用户来说是体验上的跃升,无需再通过后端处理将数据进行融合,将大大提高开发效率。
同时,AC1也不仅适用于人形机器人,在无人机、仓储机器人、清洁机器人、配送机器人等领域都有很大的应用前景。
锐思智芯:全局曝光机器感知融合式图像传感器
锐思智芯在3月31日发布了全球首款将全局曝光图像技术与EVS事件感知技(jì)术(shù)实(shí)现(xiàn)像(xiàng)素(sù)级(jí)融(róng)合(hé)的(de)融(róng)合(hé)视(shì)觉(jué)传(chuán)感(gǎn)器(qì)——ALPIX-Pizol。
ALPIX-Pizol是(shì)一(yī)款(kuǎn)1/4英(yīng)寸(cùn)、由(yóu)1.3M GESP全局(jú)事(shì)件(jiàn)感(gǎn)知(zhī)像素组成的视觉传感器。这款传感器的特殊之处在于,在单个图像传感器中集成了图像、事件和融合三种工作模式,可以单独进行图像和事件模式,也可以同时输出图像和事件数据,以及模式间的快速切换。
在全局曝光图像传感模式中,ALPIX-Pizol可以输出1.3MP/120 fps图像,全局曝光的方式也避免了卷帘曝光带来的果冻效应。
事件感知模式中,ALPIX-Pizol能够(gòu)在(zài)全分(fēn)辨(biàn)率(lǜ)下(xià)最(zuì)高(gāo)1000fps的(de)事(shì)件(jiàn)信(xìn)号(hào),高(gāo)效(xiào)捕(bǔ)捉(zhuō)运(yùn)动(dòng)信(xìn)息(xi),在(zài)暗(àn)光(guāng)高(gāo)速(sù)环(huán)境(jìng)下(xià),可(kě)输(shū)出(chū)高(gāo)时间分辨率无模糊事件流,辅助提升影像质量。
而融合视觉模式中,支持同时输出图像和事件数据,也支持模式间快速切换,从而在各种光照环境下稳定地为视觉AI提供高质量图像数据和高时间分辨率的变化/运动数据。
同时针对AI视觉场景的低功耗需求,ALPIX-Pizol在三种模式中都提供低功耗的设置,比如低功耗事件感知模式中支持e.g. <1.5 mW @VGA 30 fps的感知,可以直接提取机器需要的特征数据,在传感器侧和处理器侧均可极大降低功耗和算力需求。
由于支持不同的模式,在实际应用中可以根据需求来快速切换模式,以减少数据冗余和算力消耗。比如在事件模式下,仅感知变化信息,单位时间生成的时间数据量仅为传统图像传感器的10%-20%,大大降低算力、传输带宽和存储压力,提高系统能效。
对于机器人应用而言,可以在完成不同工作时采用不同的模式,比如需要抓取运动物体时使用事件模式,在行走等需要避障的场景就需要开启融合模式,修正因运动造成的画质问题,实现复杂光照环境中的识别。
当然除了机器人应用,在手机和运动相机等应用中,ALPIX-Pizol可以提供影像增强能力,实现EVS AI-enhanced 图像/视频去模糊、视频插帧、AI-ISP等功能,利用多模态数据辅助生成AI-Motion运动感知应用。
在工业视觉中,ALPIX-Pizol提供无畸变全局曝光图像 + 高时间分辨率的事件数据,支持低光、暗光场景高速(sù)产(chǎn)线(xiàn)检测和快速3D扫描、建模等数据。
小结:
人形机器人要实现商业化,需要满足通用场景,在各种复杂环境(jìng)下(xià)的(de)感(gǎn)知(zhī)能(néng)力(lì)就(jiù)十(shí)分(fēn)关键。近期推出的这些创新的机器视觉传感产品,代表了当前市场需求的一些方向,以及传感器行业在机器人应用上的一些探索。但最终随着人形机器人行业的迭代和发展,相信也将会继续出现更多创新形态的传感器产品。
相关新闻