央广网北京8月19日消息(记者黄昂瑾)每年的世界机器人大会都是观察机器人行业的重要窗口之一,吸引着不少业界内外的关注。作为近年来机器人领域的热议话题,人形机器人也成为本届大会中的重点内容。
据中国电子学会副秘书长梁靓介绍,本届大会以“共育新质生产力共享智能新未来”为主题,聚焦产业动向、未来发展、前沿技术风向和创新成果,深入研讨机器人与人工智能等技术融合带来的新应用和新机遇,以及以机器人技术创新加快发展新质生产力的路径。将有来自北京具身智能机器人创新中心、宇树科技、优必选、智元、星动纪元等领先企业的27款人形机器人整机将在博览会亮相,创历届之最。
随着多款人形机器人整机频频亮相,人形机器人距离参与人类生活还有多远?业界对于人形机器人的研发路径有哪些思考和预测?2024世界机器人大会开幕前夕,央广网记者采访了多位业界人士。
如何让机器人更像人?
机械臂、机器狗、外骨骼;做咖啡、下围棋、写书法……如今,机器人的身影越来越多地出现在各大科技行业展会和日常生活中。从这些形态各异、功能不一的轮式机器人、四足机器人到人形机器人,实现了哪些方面的“进化”?机器人是不是更像人了?
北京具身智能机器人创新中心(原北京人形机器人创新中心)今年4月27日发布的自主研发的通用人形机器人母平台“天工”,身高163厘米,轻量化体重为43千克,实现了全球首例纯电驱全尺寸人形机器人的拟人奔跑。自首次亮相以来,“天工”机器人经历了多个版本的升级,主要体现在从简单臂到灵巧手的升级,以及运动控制能力的提升等。记者近日在走访中看到,“天工”机器人正在进行日常测试。
“我们会在2024WRC上展示‘天工’更多的运动能力。”北京具身智能机器人创新中心人形机器人算法专家张强向央广网记者介绍,从平地行走奔跑到上坡、上楼梯,再到在草、沙、丘、石等复杂路面行走,看似变化不大的场景,对于机器人来说都是运动控制系统的一次迭代升级,“需要不断提升机器人的动态平衡能力、感知能力。”在张强看来,解决运动控制问题是实现机器人更像人的关键一步。
工信部2023年10月印发的《人形机器人创新发展指导意见》(以下简称《指导意见》),明确提出了“到2025年,人形机器人创新体系初步建立,‘大脑、小脑、肢体’等一批关键技术取得突破,确保核心部组件安全有效供给”的阶段性目标。
“机器人最终会是人类肢体和大脑的延伸。”国家地方共建人形机器人创新中心市场体系总监杨正叶对央广网记者指出,算力和模型相当于我们的大脑,主要是控制整个的决策系统;小脑解决的是行动控制,数据集相当于知识库,还有传感器系统就是我们的眼睛、鼻子、耳朵、皮肤。
国家地方共建人形机器人创新中心是人形机器人领域国家首个公共平台。今年5月在上海浦东揭牌,正在建设一个可容纳100个人形机器人同时进行智能训练的场地。“建设训练场也是为了采集数据,相当于帮机器人收集教学素材,让它能在某些场景里面有相关的数据可以调用。就像我们人通过学习有了知识储备,在处理问题时调用知识储备来解决问题。”
人形机器人商用条件日渐成熟
人形机器人被认为是最容易适应世界的机器人,业界人士认为,2024年有望成为人形机器人商用元年。
对此,北京他山科技有限公司CEO马扬对央广网记者表示十分认同。马扬告诉记者,一方面是人工智能大模型技术的出现,为人形机器人学习训练提供了有力支持;另一方面,随着产业链的不断完善,人形机器人的成本也大大降低。“去年、前年我们估计人形机器人(售价)的时候,预计一个机器人最低的成本应该是一个6位数,今年市面上已经有(定价)5位数的人形机器人本体在做商业的推广。”
降低成本是推进商用落地的关键一环。杨正叶对记者指出,很重要的一点就是批量化的运用。“一旦形成批量化,可以缩减很多环节的成本,比如零部件开模的成本、使用电机的成本等等。同时,还要从设计端寻求突破,对人形机器人的神经网络、控制系统的优化,从而大大促进结构创新,从根本上降低设计成本。”
张强认为,“一个好的商业闭环是,在收集(机器人训练)数据的同时,也能产生商业价值。如果形成了良好的闭环,我相信在未来2-3年内,(人形机器人)能达到较好的通用程度。”
马扬指出,“预计明年国内人形机器人将达到6位数左右的商用推广(量级)。如果人形机器人在业内有一个6位数的应用,对整个行业来讲就已经是一个百亿级的市场了。”他表示,随着足够多的标准机器人实现商用,再基于大模型支持机器人快速学习迭代,将加速推动机器人达到人所需要机器人具备的能力水平。
开发基于人工智能大模型的人形机器人“大脑”
《指导意见》提出,开发基于人工智能大模型的人形机器人“大脑”,增强环境感知、行为控制、人机交互能力,推动云端和边缘端智能协同部署。
如何让机器人拥有更接近人类的“大脑”,拥有智能?杨正叶表示,智能形成主要包括两方面,一是规模化数据集的形成,二是自我决策算法层的完善。“未来机器人必须实现智能化。现在的工业机器人也在做智能化升级。比如在其上面加载机器视觉、更高级的探测工具,从而打造柔性生产线。”
马扬指出,“人工智能大模型的应用迭代,可以很好地支撑人形机器人的学习训练。我们早期做触觉传感器开发的时候,我们需要半年的时间把一个触觉传感器开发到类似于人类3-6岁的触觉抓取能力。而在大模型的支持下,只要做出标准的触觉传感器,让它获得足够多的触觉感知的维度,用1万个这样的触觉传感器同时训练,相当于在脑端同时做这些训练,可能用一周到两周的时间就达到了我们原来需要半年时间训练达到的程度。”
以北京具身智能机器人创新中心为例,在打造人形机器人本体的同时,同时聚焦具身智能的研发。张强告诉记者,针对通用型人形机器人,需要打造通用大模型。“对此我们提出了‘一体多能’‘一脑多能’的愿景。简单来说,就是把运动、语言、文字、视觉等多模态放在一个模型中,让机器人通过一个大模型,能实现多任务决策执行。”