大会上,英伟达宣布推出多模态人形机器人通用基础模型Project GR00T,作为机器人大脑,支撑机器人学习技能、完成任务。同时,英伟达还发布了新款机器人SoC(系统级芯片)Jetson Thor,以支持包括前述GR00T模型在内的生成式AI模型。
“开发通用人形机器人基础模型是当今AI领域中最令人兴奋的课题之一,”黄仁勋说道。
事实上,英伟达仅是众多进军人形机器人的科技巨头之一。特斯拉紧锣密鼓研发人形机器人“擎天柱”, OpenAI、微软、亚马逊创始人贝佐斯大手笔投资人形机器人初创公司Figure AI,亚马逊旗下的Agility Robotics专门为量产人形机器人打造超级工厂……
科技圈似乎释放出下一个风口的信号——机器人的变革时代,正在靠近。
豪赌“下一波浪潮”
过去几年,“前景一片光明,现实一地鸡毛”是全球不少机器人公司的真实写照。现代机器人之父Rodney Brooks创办的Rethink、家庭社交机器人鼻祖Jibo、AI机器人玩具明星公司Anki,都因为难以找到可持续的商业模式、研发投入过大资金链断裂而接连倒闭。即使能在行业的大浪淘沙中存活下来,也不时面临生存危机——全球机器人龙头波士顿动力,曾因经营困难三次卖身;有着中国“人形机器人第一股”之称的优必选,其创始人也一度陷入卖房卖车、刷卡透支来发工资的窘境。
自2012年掀起的一波机器人热潮,到2019年前后开始降温,科技故事回归商业本质。
但从去年开始,人形机器人又成为各大科技公司、资本圈竞相追逐的宠儿。美国人形机器人创企Figure,2023年5月和2024年2月先后完成两轮融资,一年时间不到融资总额已经达到7.54亿美元(折合约54.26亿人民币),背后更有微软、OpenAI、英伟达、英特尔等巨头的资金、技术“撑腰”。来自挪威的机器人制造商 1X technologies,在2023年5月完成由OpenAI领投的2350万美元A2轮融资,又在2024年1月完成金额达1亿美元的B轮融资。PitchBook数据显示,尽管2023年全球人形机器人领域的风投融资额仅相当于2018年的四分之一,但投资数量增长迅猛,基本和2018年持平。
清华大学交叉信息研究院助理教授许华哲也感受到了行业热度的变化。他告诉21世纪经济报道记者,自己从事研究的具身智能曾是人工智能里相对小众的领域,之前经常要和别人解释自己在做什么会很难,但现在他再遇到投资人朋友,对方已经和企业CEO、高校教师有过交流,他就不用再费时间科普一番。
在许华哲看来,近期人形机器人的热度走高,主要源于几大技术变量的推动:首先是底层硬件成本下降,以波士顿动力的机器狗spot为例,每台售价折合人民币要几十万,但国产品牌的机器狗价格已经降到8000多元;其次,模仿学习、强化学习等算法的成熟度提高,终于能应用到机器人领域;再者,大模型快速迭代,也在拓宽机器人的智能化边界。
因而,这两年兴起的人形机器人,能煮咖啡、会搬重物,甚至可以做家务,展现出和以往机器人只能重复单一操作不同的一面。“机器人的终极目标是通用化,但现在发展最成熟的工业机器人,就是为专门场景定制的,比如要把物料从工厂A点搬运到B点,机器人公司一般会设计轮式机器人和固定动线,但如果搬运完后还要执行安装、检查之类的操作,就需要机器人具备能执行多样化任务的通用能力。”国金证券通信行业首席分析师罗露向21世纪经济报道表示,而人形则是通用机器人的最佳载体,一方面人形机器人可以更好地“适应”人类已构建的物理世界,参与人类生活、生产,另一方面,就像大模型需要海量数据投喂才能达到涌现、顿悟,机器人同样需要海量数据训练才能“开窍”,人类过去产生的大量生产和生活数据也能反哺给机器人。
大模型等AI技术的加持下,人形机器人逐渐看到通用化的曙光。1X创建的EVE人形机器人,已经能执行巡逻、监控、搬运等多种任务;Figure AI成立不到两年,开发的Figure 01机器人,只通过10小时的端到端学习就掌握了制作咖啡的技能,瞬间出圈。
人工智能的赋能让机器人离通用化更进一步,而连接物理和虚拟世界的机器人,也被广泛认为是人工智能的下一个爆点。在2023年ITF世界大会上,黄仁勋曾表示,下一波人工智能浪潮将是一种被称为具身AI的新型人工智能,即能够理解、推理并与物理世界互动的智能系统。
知名人工智能科学家李飞飞也提出,与周围环境交互将为智能体提供一种全新的了解世界的方式,有了新的理解,想法就会付诸实践,更大的智慧也会随之而来。
“我们是在和这个世界交互的过程中,提升认知能力、智力水平的。例如,一个七个月大的小孩看到一个玩具,一旦你用布把它遮住,小孩就会以为这个玩具消失了,但只有他触摸到布底下的玩具时,他才意识到玩具一直在这里。”许华哲举例解释,人要交互才能真正理解世界的很多规律,训练人工智能也是一样。
给AI装上机器人的躯干,像人一样感受世界、作出决策并执行任务,科技圈苦苦探寻的通用人工智能(AGI)之路也在变得更清晰。
数据与商业化的“两座大山”
无疑,人形机器人打开了更广阔的想象空间,但那些像人一样灵活自如、聪明强大的人形机器人,大多存在于展示视频、实验室里,要突破商业关卡、进入量产阶段仍尚需时日。
波士顿动力2013年就公开亮相的人形机器人Atlas到今天都还是实验室产物;在科技圈已经大出风头的Figure AI、1X technologies都还没有明确的量产时间表;特斯拉有造“四个轮子的机器人”经验,今年1月擎天柱熟练叠衣服的视频广为流传,但很快马斯克回应“它还不能自主地叠衬衫”,预计最快的量产时间也要到2025年。
人形机器人量产之难,许华哲看来,最本质的问题出在数据上。ChatGPT等大语言模型可以在一两年内快速迭代,正是因为有大量文本数据的沉淀、投喂,甚至当下的时时刻刻,互联网还在不断产生新的信息、数据让大模型去学习强化。然而,机器人投入现实场景的应用有限,数据量少、采集难,具身智能并不能得到大语言模型一样庞大的数据集来训练学习。
而要让这波人形机器人的浪潮不再昙花一现,找到大规模应用的场景依然是商业化落地的关键。
近期,让人振奋的是不少人形机器人已经开始进厂“打工”, 亚马逊的人形机器人Digit进到仓库筛选、搬运物料,Figure 01被送入宝马的斯巴坦堡汽车工厂,优必选的Walker S也已经在蔚来汽车工厂“实训”。
但正如亚马逊机器人首席技术专家 Tye Brady 表示,测试还处于“非常早期的阶段”,现有的机器人进厂主要是为了实验测试、积累场景数据以便后续迭代。佛山市机器人产业创新协会秘书长高辉告诉21世纪经济报道记者,佛山市大部分机器人企业还是以做工业机器人为主,少数投入人形机器人研发的也是因为工业机器人赛道已经非常内卷,才会选择提前布局率先抢位。机器人要走向大规模进厂的“奇点”,要解决两个问题,一个是成本,另一个是找到明确的落地场景。
罗露看来,人形机器人在大范围的市场渗透之前,将在一些细分领域较快突破。一则是汽车制造、高端医疗等市场空间大、付费能力强的领域,二则是老龄化加深的趋势下,解决看护、陪伴、应急需求的机器人,都更有可能率先跑出来。
而罗露在项目调研中,也看到更多的商业模式正在涌现,降低用机器人成本高的壁垒。他提及北京一家为楼宇提供卫生间清洁服务的机器人企业,他们研发的机器人可以解决复杂的清洁任务,售价高昂,但企业对外提供的是机器人租用服务,每月工作强度不低于清洁工人但成本相当甚至更低,也就解决了无人买单的问题。
越来越多的声音在看多人形机器人这个并不新兴的领域,但入局玩家众多,罗露表示,从商业投资的角度看,他在评估机器人企业商业价值时,最直接的方法往往是看企业是否与行业龙头一起研发或进行商业应用合作,因为阿尔法客户对机器人企业来说是一种重要的背书。“但人形机器人要真正走向规模商用,目前还要解决安全性、智能化和制造成本的问题。”罗露总结道。
谁在率先卡位?
这些年,大型工厂基本被国际工业机器人四大巨头垄断,德国库卡在汽车行业拥有奔驰、宝马等核心客户,瑞士ABB的运动控制核心技术优势突出,日本发那科、安川在汽车制造业和电子电气行业布局广泛。
卡内基梅隆大学计算机科学学院教授马夏尔·赫伯特曾表示,“日本擅长机器人的物理特性开发,而美国擅长机器人思维开发。”但这波人工智能赋能的人形机器人热潮,部分玩家正在拉开竞争优势。
“领跑人形机器人的国家,往往具有在智能化、机械化这两个领域的优势,这分别对应机器人的灵魂和躯干。”罗露表示。
高盛研究分析师、中国工业技术研究主管Jacqueline Du在今年2月份的一份报告中写道,到2035年,全球人形机器人的市场总额预计将达到380亿美元,比之前预测的60亿美元增长了六倍多。
现阶段,人形机器人还在摸索着走通商业化之路,高盛分析师预测,目前最好的投资机会可能在于构成供应链的组件制造商。高辉同样表示,目前在当地产业端,热度最高的不是人形机器人本体,而是传感器、电机、末端执行器夹爪等各类硬件。
随着人形机器人走向爆发的前夜,更多掘金机会将会崭露头角,谁都不想错失“通向星辰大海的列车”。不少受访专家看来,中国入局人形机器人,庞大的制造业基础、广阔的应用市场,都是可以把握和利用好的竞争优势。
“但中国要在人形机器人赛道领跑,还是要突破智能化的瓶颈,包括机器人的‘大脑’(大模型)和‘小脑’(环境感知、行为控制、人机交互能力)。”许华哲向记者说道,“对于这波热潮,我们还是应该以平常心看待。科幻作品里的瓦力机器人、大白很迷人,期待世界有一天能把这些理想的机器人做出来。”