专访达闼副总裁王恩玺:国产人形机器人已无技术瓶颈,但量产仍是噱头 – CPT Markets资讯
专访达闼副总裁王恩玺:国产人形机器人已无技术瓶颈,但量产仍是噱头 – CPT Markets资讯

专访达闼副总裁王恩玺:国产人形机器人已无技术瓶颈,但量产仍是噱头

人形机器人火了。

今年人工智能大会,以特斯拉的二代人形机器人Optimus为代表,宇树科技、傅利叶、达闼、乐聚、开普勒、天链等十数家人形机器人厂商均展出了自家的“得意之作”,狠狠秀了一轮“肌肉”。

虽然有机构预测,今年会成为人形机器人的量产元年。但达闼机器人(下称“达闼”)副总裁、广州公司总经理王恩玺在接受时代周报记者专访时却表示,目前“量产”只是一个噱头。人形机器人仅仅被造出来了,但还没到能解具体决问题的阶段。

而且他表示,在商业化落地过程中,人形机器人的价格也是厂商们需要考虑的一大问题。

达闼是人形机器人行业的头部公司之一,在2019年B轮融资后跻身为独角兽企业。在WAIC 2024会场,时代周报记者对达闼副总裁王恩玺进行了专访,对人形机器人的商业化进展和落地难题等相关问题进行探讨。

王恩玺。图源:受访者供图

为什么非“人形”不可?

时代周报:机器人并不是一个新鲜的概念。在很久之前,工厂中就利用机械臂完成重复单一的任务。为何我们还要发展人形机器人?

王恩玺:机器人的概念确实存在很长时间了。从整个机器人的分类来看,大概包括工业机器人、服务机器人和特种机器人。某些机器人是为特定场景而服务的,如工业机械臂、爬虫机器人、清洁机器人等。

但是,人类创造机器人的最终目标,是为了将人类从肮脏、复杂、繁琐的功能中解脱出来,最直接的方法就是能完全代替这个人,首先外形设计要像人。在人类的生产生活中,各种工具的发明、流程的制定都是以人为核心的,当你使用一个人形机器人去替代人的时候,它对周围环境的影响是最小的,也无需对现有的生产场景和工具做出较大变动。

另一方面,从新物种的角度来看,人类对特异的物种有天生的排斥感。那么当人形机器人未来应用于居家、服务、养老行业,从而进入到千家万户,人类一定更能接受和自己外形相似的机器人一起生活。如果机器人长着三条手臂,即使技术上不存在问题,工作起来也更高效,但人类可能还是很难接受该物种。

时代周报:目前,有哪些场景比较适合人形机器人应用?

王恩玺:对此问题,业内如今其实有一定共识。2023年11月,工业和信息化部印发《人形机器人创新发展指导意见》,里面提到了两类场景。一类是面向民爆、救援等等特殊环境,强化人形机器人本体安全防护能力、复杂任务智慧生成与高精度操作能力,降低作业人员危险性。

另一类场景是聚焦3C、汽车等制造业重点领域,打造人形机器人示范产线和工厂。这也是为何如今汽车制造变成了人形机器人行业较为重要的发力点,汽车的整个生产制造流程较为清晰,也相对容易定义出哪些可替代人类工作的场景。当企业把汽车制造“玩”明白后,下一步就可以做3C了。

例如去年比亚迪就投资人形机器人公司智元机器人,上汽在今年同样投资了该公司;去年小米、优必选等成立北京人形机器人创新中心;我们达闼也正在和广汽谈合作。

而当人形机器人ToB场景打磨成熟后,就能够逐步进入到家庭,服务居家养老,技术是一步步演进的。

图源:时代周报记者摄

大模型如何上机?

时代周报:这届人工智能大会,“大模型+机器人”对机器人泛化能力的提升是大家较为关注的热点。达闼的人形机器人上是否也搭载了大模型?是如何部署的?

王恩玺:达闼成立之初就是从云端大脑开发起的,我们认为机器人的算力、智力一定是运行在云端,配合5G低延迟的网络。大模型出现之前,2017年我们利用多模态算法,训练人形机器人的视觉、语音、动作和运动。大模型出现后,我们就基于原有算法技术的积累做了针对性的模型微调和优化,并通过我们自己的机器人收集的各类型数据做了大量训练,在2023年发布了RobotGPT。

我认为人形机器人想在复杂的场景完成任务的话,光靠端侧的算力是不够的。虽然如今部分设备如手机、PC等,能够植入经过充分训练后的、参数较小的模型,并在端侧做推理。但是当面临复杂的场景或如居家服务中的开放性场景,人形机器人需要很泛化的能力,光靠端侧大模型的能力是不足的,需要云端大脑来支撑训练和推理。

时代周报:但是,当人形机器人居家使用时候,将家庭私人的数据上传到云端,是否会存在隐私泄露的问题?

王恩玺:数据安全是一个永恒的话题。保证数据安全的方法通常有两种,一是通过各种先进技术保证数据不被窃取和泄露。当然,在这方面有时存在“道高一尺魔高一丈”的情况,没有什么技术是永远奏效的。所以我认为数据安全不完全是一个技术问题,而是一个管理问题。

二是建立保障或信任机制。我们的策略是跟运营商合作,将云端大脑部署在运营商,如中国移动的云平台上,通过国企背书来确保数据隐私安全。

未来,我们设计的商业模式是通过运营商的渠道向每个家庭租赁人形机器人,就好比每家使用机顶盒上网,一千兆宽带每月200块钱,未来可能租赁一台人形机器人每月花1500-3000元。机器人收集的数据将保存在运营商的云平台上,就如同手机电话数据存储在运营商的数据库中。

“量产”还是一个噱头

时代周报:有机构预测,今年会成为人形机器人的量产元年,你同意这种看法吗?

王恩玺:对于“量产”这个词我是有疑义的。量产的前提是,一个产品有非常具体的使用场景,能够解决该场景下的问题,而且有非常明确的产品功能说明书,这和我们购买任何一件消费类产品是一致的。这个时候的量产才是有意义的。

那么现在人形机器人所谓的“量产”,我认为只是声明人形机器人被造出来了。人形机器人还没有到具体能解决什么问题的阶段,例如在ToB场景下,是否能在生产线帮忙拧螺丝、打胶、搬东西等,都没有明确。所以我认为现在谈“量产”,还只是一个噱头。

包括从这次人工智能大会会场,你会看到大家比拼的不是人形机器人在哪个场景做了什么工作,从端到端实现场景闭环等,而是展示机器人能走路,能挥手等功能,这是人形机器人的基本功能要求。从原型机的推出,到具体能解决什么场景问题,是目前整个业界都在努力攻破的。

时代周报:现在人形机器人的发展还存在哪些技术难点?

王恩玺:硬件上,人形机器人关节的发展,架构设计,是否更加灵活,能够实现抓取、翻转等类人的更精准的操作等,这是在运动控制领域需要持续迭代的。

另外一个难点体现在利用大模型技术对人形机器人做各种场景的训练。自大模型技术出现后,人形机器人在某些场景下能够做出的动作已经超出了原有的训练模式。例如通过视频学习、人工示教、强化学习等,能够让机器人快速掌握在该场景下应该做出的动作,并且泛化到其他场景,这就是大模型所具备的优势,大模型的发展与人形机器人息息相关。

其实,我更倾向于认为人形机器人的发展没有卡脖子的技术,没有不可攻克的难题,但它需要时间迭代,变得更加成熟、更加精细、也更加精准。

时代周报:价格高昂也是人形机器人实现商业化落地的阻碍之一。能否举例说明,怎样定价一台人形机器人才能使其更具购买力?

王恩玺:我跟一些汽车制造厂商交流过,如果人形机器人真的能替代人工,他们希望产品的定价最高限制不超过20万。因为现在生产线上的工人的工资大概在8000-1万左右,一年开支大概是10-15万块钱,人形机器人不知疲惫,可以24小时持续干活,所以价格可以稍高,但超过20万也不划算了。

但如今人形机器人的造价基本上是百万级别的。这是因为目前人形机器人的造价还没有考虑到未来销量。公司们刚刚把人形机器人造出来,更多考虑其功能的实现,还没开始重视成本的优化。如果对销量没有合理预期的话,就无法从供应链的维度降低成本。

时代周报:从商业逻辑来看,你认为人形机器人企业如何能加速商业化落地的进程?

王恩玺:现在人形机器人需要更多场景开放去推进其发展。市场上对人形机器人的使用是持开放态度的,无论是老龄化社会的到来,还是制造业降低成本的需求催化下,社会对于人形机器人的期望值很高。

对于人形机器人公司而言,目前最大的成本是时间成本。因为打开和解决一个具体场景的问题,需要研发、测试,迭代等反复过程,如果企业无法在短时间内找到落地场景,可能会导致其生存都难以为继。

现在整个产业界也在争先恐后、优胜劣汰的赛马进程中。我特别认同马斯克的一句话:创新的速度比创新更重要。