人形机器人“论斤卖”

发布日期:2024-07-11 15:52    点击次数:61
5~10年将有大突破,商业落地蓄势待发。

图片

5~10年将有大突破,商业落地蓄势待发

作者|IT时报记者 沈毅斌

编辑|孙妍

“桌面有点乱,你帮忙清理一下。”

“好的,正在为您清理桌面。”

听到指令后,“青龙”一边回答一边缓缓抬起双臂,用双手缓慢且轻柔地抓起桌面上混合摆放的面包和水果,分类放进左右两个篮筐内,即使是柔软的面包,也不会变形。在人形机器人与具身智能发展论坛上展示的这款“青龙”人形智能机器人不仅拥有识别认知能力,185厘米的身高和80公斤的体重,放在机器人界也是妥妥的“型男”一枚。

从国内外众多机器人企业“大秀肌肉”展出的“十八金刚”,到各种论坛畅想着机器人的发展前景,人形机器人、具身智能成为2024世界人工智能大会(WAIC 2024)当之无愧的“顶流”。主办方数据显示,本届大会合计展出的人形机器人超过25款。火热的人形机器人赛道,正在迎来商业化蝶变的关键时刻。

但冷静下来思考,人形机器人的发展依旧面临诸多挑战,上海人形机器人制造业创新中心首席科学家江磊表示,人形机器人当前面临的问题可以总结为“一高五难”,硬件门槛高、软件算法难、软硬解耦难、知识积累难、人才聚集难、安全应用难。

人形机器人与具身智能目前发展现状如何?何时能够商业化落地?怎样让人形机器人遵循“机器人三大定律”?带着这些问题,走进WAIC 2024的人形机器人“世界”。

人形机器人应该“论斤卖”

人形机器人由控制器、传感器、精密减速器、交流伺服电机等核心零部件组成,每一个部件都需要不菲的成本。

根据Macquarie Research在2023年发布的报告,人形机器人的硬件总成本目前约为5万美元。其中,端到端AI软件大脑、传感器与芯片、伺服电机与电机驱动器都各需要1万美元,惯性测量单元与扭矩传感器需要5000美元,精密减速器需要8000美元,电池与电池控制系统需要2000美元,其他部件约5000美元。

以色列智能机器人中心主席Yosi Lahad在人形机器人前沿论坛上表示,为了让人形机器人能够得到大规模采用,其成本需要降到2万美元以下,是现在成本的一半以下,甚至可能需要对机器人的外型进行一些改变,例如重新考虑模仿人类腿部的底座设计。而特斯拉预计明年量产的Optimus,预计成本控制在1万美元左右,预计售价2万美元。

相比之下,国内人形机器人已经将售价降至10万元以下,今年5月,宇树科技发布的最新的人形机器人产品Unitree G1,市场售价仅9.9万元起。“我们一直认为,人形机器人未来应该像猪肉一样论斤卖。”宇树科技联合创始人陈立在“国际人形机器人技术与应用发展论坛”上表示,抛开研发成本,人形机器人其实是铁、钢、铜等材料的堆叠,随着零部件的量产,成本自然也会随之降低。

根据《2024年中国人形机器人行业研究报告》,人形机器人按量产规模不同,降本大致可划分为三个阶段:小批量千台量级生产,降本20%~30%至约10万美元;万台级别降本50%至5万美元;数十万至百万台大规模量产,降本70%~80%至2万~3万美元。一时间,人们感到人形机器人商业落地近在咫尺。

但需要注意的是,Unitree G1与Optimus的区别在于没有搭载大模型,若按照智能标准来看,特斯拉的Optimus依旧可以作为行业的风向标之一。

成本不仅来自硬件

硬件是人形机器人最直观的成本,但在降低成本方面不能只依赖于硬件的量产。

“硬件成本降低我认为已经不是主要难题,而是时间问题,设计和研发环节的成本才是人形机器人目前需要突破的成本问题。”聚焦国讯芯微董事长方婷婷在论坛上表示,国内人形机器人领域有许多核心技术依赖国外进口,如人形机器人仿真工具平台。

从人形机器人软件形态来说,大量的跨学科内容都需要软件来融合,需要更多的相关产业企业来抱团。而人形机器人本体厂商也要从设计之初就考虑软硬件成本。

鑫精诚传感器董事长吴浩认为集成化也是降低人形机器人成本的方式之一,比如在灵巧手方面,人类的手指可以感受温度、力度等,人形机器人的传感器也可以借鉴,将多模态的感受集成在同一零部件上,这样既能降低成本,也能减少体积。

人形机器人会在哪些应用场景爆发?B端场景下,开普勒CEO胡德波认为,第一类是工业场景,尤其是重工业,工人的安全得不到保障,用人成本高,适合用人形机器人替代;第二类是仓储物流场景,可能是最快实现落地的场景之一;第三类是制造业,如3C制造、汽车制造等。业内人士对C端场景的应用已经达成共识,人形机器人将走进千家万户,赋能养老育儿场景。

据高盛最新预测,人形机器人到2035年将呈爆发式增长,出货量将达到140万台,全球市场总规模(TAM)达380亿美元。全球从事物流和制造业的人形机器人将在2030年左右达到100万台,人形机器人有望在十年内走入服务、家庭护理、健康和教育产业。

5~10年迎来大突破

如今的人工智能如同一颗封在瓶子中的“大脑”,虽然会计算、思考,却不能付诸行动。具身智能是一种智能系统或机器通过感知交互与环境进行实时互动的能力,通俗的理解是为人工智能打造一款可操控的身体,包括四足机器狗、工业机器人、动物仿生机器人、自动驾驶汽车等多种形态,但人形机器人的类人形态,可以更贴合人们的互动需求,无疑是具身智能的最佳载体。

中国工程院外籍院士张建伟在人形机器人与具身智能发展论坛上表示,实现具身智能需要完成三个维度的突破,即空间维度,在开放式、复杂、动态的空间环境下,实现二维、三维动态语义建模;时间维度,除了简单移动外,还要同时具备操作和使用工具的能力;交互能力,让机器人基于知识和人、环境做出正确的交互行为。这其中依赖的便是AI大模型。

仅靠大模型进行感知、策划还不能让具身实现真正智能,加入“小脑”才能进行动作执行。

以“青龙”为例,名为“朱雀”的具身大脑以多模态大模型为核心,通过文字信息、图像信息作为输入,输出语音交互以及任务决策信息。“玄武”小脑模型则是具体任务执行模型,轨迹规划模块由端到端模仿学习所驱动,以人类的作业作为模仿对象,进行机载视觉输入,并输出人们所期待的行动轨迹。运动控制器则基于强化学习的智能运动控制方法和全身动力学的模型预测控制方法两条技术路径,通过环境信息以及机器人的状态,完成任务执行。

尽管AI大模型开始“移植”到具身智能上,但效果并不算理想。“青龙”机器人平台技术负责人梁振杰坦言,目前,模型还处于发展的初期阶段,功能尚不完善,能力仍需提升。

宇树科技CEO王兴兴在论坛中表示,目前大语言模型、多模态模型对整个世界的理解其实是非常糟糕的,包括时间、时空、物理定律等方面的理解。世界模型+具身智能才是通向AGI的最佳路径。

上海人工智能实验室主任、首席科学家周伯文也认为,具身智能不只是大模型加机器人的应用,而是需要根据物理世界的反馈及时进化的大模型。

不过,对于人形机器人和具身智能未来的发展,业内依旧持积极开放态度。“未来5年肯定有很大的技术突破,绝对不会超过10年。”王兴兴预测道。国家地方共建人形机器人创新中心总经理许彬也表示,会把相关的人形机器人的全栈技术,包括大脑、小脑、肢体的相关技术全部开源。通过5年~10年,在人类的家政服务、交流陪护领域进行更多应用。

规模化数据是最大痛点

数据无论是对人工智能,还是具身智能而言,都是灵魂般的存在。目前,人形机器人主要数据来源是国外的开源数据,以及研发机构通过动作捕捉、视觉捕捉等方式自行采集。

但自行采集往往需要大量的人力成本,去不断模拟演示。北京大学助理教授、银河具身智能联合实验室主任王鹤在人形机器人与具身智能发展论坛上举例道,把电池放到盒子里这样一个对于人类而言十分简单的动作,特斯拉靠40人的采集团队进行遥操实现,每一个倾斜、横倒、错位等所有失效案例都要采集。

“人形机器人规模化数据是整个行业目前最大的痛点。”国家地方共建人形机器人创新中心研发体系总监邢伯阳也同样表示。

面对这一行业痛点,王鹤认为当下可以真正实现规模化量产的数据就是合成数据。所谓合成数据,是一种通过算法生成的数据,虽与真实数据相似,却并不直接来源于真实世界。

靠合成数据具身智能实现了从0到1的突破。在银河通用机器人训练时发现,二维传感器存在泛化问题,跳脱出训练数据便不会处理;三维传感器又无法识别玻璃等透明物体。最终,靠合成数据进行千万场景十亿抓取的大规模训练,才实现银河通用机器人对各种物体的任意抓取。

邢伯阳代表的国家地方共建人形机器人创新中心则主张通过数据开源的方式来共享海量数据。为此打造出Openloong开源社区,通过社区和训练场创新的机制加速人形机器人、具身智能训练和数据集构建的工作。

不发展是最大的不安全

人形机器人已不再是科幻小说中的幻想,而是融入日常生活的现实。试想一下,未来人形机器人穿梭于繁华都市的大街小巷,在工厂、医院等地按照系统指令按部就班,这将改变人们的生活方式和社会结构。而与这一科技进步相伴而来的,是关于人形机器人治理的思考与挑战。

“高铁刚进入中国时,许多人担心电磁波辐射;早期飞机、电话等发明同样被人们所担忧。可以说人类的进步史就是对科技发展的担忧史。我们应该制定一部促进人工智能发展的法律,而不是一部规范人工智能行为的法律。”在人形机器人法治与伦理论坛上中国政法大学副校长时建中表示,面对担忧不应过度焦虑,要对人工智能采取包容和审慎态度,这体现在训练数据易获取、算力与算法鼓励合作、生成内容容错并及时纠错等方面。

联合国人工智能高级别咨询机构成员、中国政法大学数据法治研究院教授张凌寒同样表示,不发展是最大的不安全,要全力促进人工智能的发展。

“它就像一岁半大的孩子,需要我们的正确引导。”华东师范大学人工智能金融学院院长、教授邵怡蕾表示,目前,人形机器人在人工智能的加持下已经具备感知智能和认知智能,最后一座需要攻克的“堡垒”是行为智能。而当人形机器人行为出现在人类社会后,是对人类身份与法律的挑战,这不仅需要对人形机器人进行身份界定,更需要人类对其行为进行引导和约束。

如何协调机器人与人类之间的互动?阿西莫夫的“机器人三定律”曾经被视为基础规范。但是,当具身智能时代来临之际,这样的“约法三章”已经难以解决人机共生的复杂问题,需要一种新的法律治理架构。

中国海洋大学法学院教授李晟在《东方法学》人形机器人法治专刊中表示,治理架构需要立足于人形机器人与人的差距,考虑当前发展阶段的应用问题,而不是关注人形机器人替代人时所产生的未来问题。