人形机器人感知革命！创新形态机器视觉传感器涌现

发布：2025-04-19 04:31:00

【导语】人形机器人的运动能力正进入激烈的“军备竞赛”阶段，但实现具身智能仍需AI、算力和感知技术的配(pèi)合(hé)。近(jìn)期(qī)，速(sù)腾(téng)聚(jù)创(chuàng)和(hé)锐(ruì)思(sī)智(zhì)芯分别推出了创新的机器视觉传感器，为机器人行业带来了新的探索方向。这些创新产品不仅提升了机器人的感知能力，还为机器人在复杂环境下的应用提供了更多可能性，预示着人形机器人商业化进程中的又一重要进展。

电子发烧友网报道（文/梁浩斌）人形机器人的运动能力，已经进入了“军备竞赛”阶段，各家纷纷展出自家机器人的行走、跳舞，甚至空翻等能力，并不断用新的动作刷新人们对于人形机器人的能力理解。

然而运动能力归运动能力，人形机器人目前主要还是需要预设固定程序运行，离真正要实现具身智能还很远。要实现具身智能，还需要AI、算力、感知的配合。最近速腾聚创、锐思智芯分别推出了创新形态的机器视觉传感器。

速腾聚创AC1：姿态、深度、色彩信息三合一

今年年初的发布会上，速腾聚创发布了一个面向机器人视觉的全新传感器解决方案Active Camera，这个方案包含传感器硬件、运算核心、AI算法等的智能生态。在3月28日，速腾聚创终于发布了Active Camera的首款产品AC1，以及AI-Ready生态。

在传感器硬件上，AC1集成了IMU姿态传感(gǎn)器(qì)、深度传感器（固态激光雷达+CMOS）以及一个RGB相机，在单一模块中提供深度信息、图像色彩信息和运动姿态信息，并实现硬件级融合，将三大信息的时间和空间进行同步对齐。

AC1提供120°x60°超大融合视场角，较传统3D相机高出70%；色彩FOV达到144°×78°；测距能力达到70米，是传统3D相机的6倍；测距精度3cm@1σ测距精度稳定不随距离衰减，可精准还原远近物体形状大小，帮助机器人实现准确的路径规划。

同时AC1避免了传统3D相机存在的强光干扰问题，能够在100KLux阳光下工作，克服强光干扰问题，适应更丰富的场景。

面向机器人开发者用户，速腾聚创打造了AI-Ready生态，通过AC Studio为Active Camera用户提供包括驱动程序、数据标定、数据融合在内的开源工具包，以及SLAM、高阶多模态感知等开源算法，支持用户深度二次开发，并通过专用跨平台软件AC Viewer，提供最佳的数据融合、SLAM、目标检测等功能体验。

同时，AI-Ready生态将提供避障类目标数据集、认知识别类数据集，帮助开发者训练模型算法，快速完成场景功能化的二次开发，以及方案部署。

同时，WIKI以开发者文档方式全面收录Active Camera与AI-Ready生态的信息；数据集提供多种场景下的训练数据，将在后续逐步上线，供开发者免费使用。AI-Ready生态帮助行业升级机器人项目流程，让软件快速迭代的开发模式驱动机器人产品化商业化落地。

AC1通过融合多传感器，在硬件上实现了出厂的传感器标定，以及软件上实现了数据融合和对齐，实际上这在技术上也有一定的难点。

此前我们在《激光雷达+摄像头融合传感器，有没有搞头？》一文里介绍了京瓷展示的世界上第一个实现光轴对齐的摄像头+激光雷达融合传感器，通过对齐两种传感器的光轴，实现激光雷达和摄像头无视差的数据融合。

但在实际产品中，由于激光雷达通过发射激光束并接收反射回来的信号来测量距离，生成点云数据；而摄像头则捕捉环境的二维图像。这两种传感器的数据格式不同，坐标系也不同，使得直接对齐它们的光轴变得极为复杂。

从速腾聚创对AC1的描述中，同样是实现了固态激光雷达和相机数据的硬件级融合，这对于用户来说是体验上的跃升，无需再通过后端处理将数据进行融合，将大大提高开发效率。

同时，AC1也不仅适用于人形机器人，在无人机、仓储机器人、清洁机器人、配送机器人等领域都有很大的应用前景。

锐思智芯：全局曝光机器感知融合式图像传感器

锐思智芯在3月31日发布了全球首款将全局曝光图像技术与EVS事件感知技(jì)术(shù)实(shí)现(xiàn)像(xiàng)素(sù)级(jí)融(róng)合(hé)的(de)融(róng)合(hé)视(shì)觉(jué)传(chuán)感(gǎn)器(qì)——ALPIX-Pizol。

ALPIX-Pizol是(shì)一(yī)款(kuǎn)1/4英(yīng)寸(cùn)、由(yóu)1.3M GESP全局(jú)事(shì)件(jiàn)感(gǎn)知(zhī)像素组成的视觉传感器。这款传感器的特殊之处在于，在单个图像传感器中集成了图像、事件和融合三种工作模式，可以单独进行图像和事件模式，也可以同时输出图像和事件数据，以及模式间的快速切换。

在全局曝光图像传感模式中，ALPIX-Pizol可以输出1.3MP/120 fps图像，全局曝光的方式也避免了卷帘曝光带来的果冻效应。

事件感知模式中，ALPIX-Pizol能够(gòu)在(zài)全分(fēn)辨(biàn)率(lǜ)下(xià)最(zuì)高(gāo)1000fps的(de)事(shì)件(jiàn)信(xìn)号(hào)，高(gāo)效(xiào)捕(bǔ)捉(zhuō)运(yùn)动(dòng)信(xìn)息(xi)，在(zài)暗(àn)光(guāng)高(gāo)速(sù)环(huán)境(jìng)下(xià)，可(kě)输(shū)出(chū)高(gāo)时间分辨率无模糊事件流，辅助提升影像质量。

而融合视觉模式中，支持同时输出图像和事件数据，也支持模式间快速切换，从而在各种光照环境下稳定地为视觉AI提供高质量图像数据和高时间分辨率的变化/运动数据。

同时针对AI视觉场景的低功耗需求，ALPIX-Pizol在三种模式中都提供低功耗的设置，比如低功耗事件感知模式中支持e.g. <1.5 mW @VGA 30 fps的感知，可以直接提取机器需要的特征数据，在传感器侧和处理器侧均可极大降低功耗和算力需求。

由于支持不同的模式，在实际应用中可以根据需求来快速切换模式，以减少数据冗余和算力消耗。比如在事件模式下，仅感知变化信息，单位时间生成的时间数据量仅为传统图像传感器的10%-20%，大大降低算力、传输带宽和存储压力，提高系统能效。

对于机器人应用而言，可以在完成不同工作时采用不同的模式，比如需要抓取运动物体时使用事件模式，在行走等需要避障的场景就需要开启融合模式，修正因运动造成的画质问题，实现复杂光照环境中的识别。

当然除了机器人应用，在手机和运动相机等应用中，ALPIX-Pizol可以提供影像增强能力，实现EVS AI-enhanced 图像/视频去模糊、视频插帧、AI-ISP等功能，利用多模态数据辅助生成AI-Motion运动感知应用。

在工业视觉中，ALPIX-Pizol提供无畸变全局曝光图像 + 高时间分辨率的事件数据，支持低光、暗光场景高速(sù)产(chǎn)线(xiàn)检测和快速3D扫描、建模等数据。

小结：

人形机器人要实现商业化，需要满足通用场景，在各种复杂环境(jìng)下(xià)的(de)感(gǎn)知(zhī)能(néng)力(lì)就(jiù)十(shí)分(fēn)关键。近期推出的这些创新的机器视觉传感产品，代表了当前市场需求的一些方向，以及传感器行业在机器人应用上的一些探索。但最终随着人形机器人行业的迭代和发展，相信也将会继续出现更多创新形态的传感器产品。