界面新闻记者 |
界面新闻编辑 | 文姝琪
“能够造出和人类一样,灵活和智能的机器人一直是我的梦想。 ”
3月11日 ,B站断更两年的百大UP主“稚晖君”更新视频,带来了他的最新作品灵犀X2 。稚晖君本名彭志辉,除了UP主 ,他还有一个身份是智元机器人创始人,灵犀X2也是智元机器人在人形机器人领域的最新产品。
在视频里,灵犀X2能行走跑跳 ,还能“跳点小舞”,并且能够使用人类的各种工具,比如踩滑板车 、玩平衡车 ,甚至自主驾驶自行车。除了拥有更强的运动智能水平,灵犀X2还具备与人复杂交互的能力,是一款更类人的机器人 。截至目前,该条视频播放量已经突破264万。
有“人味儿 ”的机器人
智元机器人产品家族中 ,人形机器人分为两个系列:主打量产应用的远征家族和推动技术创新的全栈开源机器人系列灵犀。
灵犀系列集成了智元机器人的最新技术,本次展示的灵犀X2支持高自由度运动能力,搭载情感计算引擎 ,并初步具备通用任务执行能力,按照智元的构想,这是一款有“人味儿 ”的机器人 。
灵犀X2全身一共28个自由度 ,体重为33.8千克,身高1.3米左右。从视频中可以看到,X2在具备常规的行走跑跳能力上 ,还拥有更强的运动智能水平,能够使用人类的各种工具,比如踩滑板车、玩平衡车 ,甚至自主驾驶自行车,较同类产品拥有更高的运动灵活性。
在灵犀X2的本体设计中,智元团队把机器人的硬件系统抽象出了一系列可复用的核心组件,如小脑控制控制器Xyber-Edge ,域控制器Xyber-DCU,智能电源管理系统Xyber-MS以及迭代了多版本的核心关节模组Powerflow等等 。彭志辉表示,通过这些可拆分、复用组件 ,智元能够像用飞控去传一套无人机航模一样,快速搭建起一套灵活 、完整、可靠的人形机器人系统。
在运动控制算法层面的突破则来自于强化学习。他介绍,灵犀X2的运动控制已经全面从传统的model-base转向learning驱动的强化学习(RL)。通过结合深度强化学习(DRL)和模仿学习算法的优势 ,X2的动作可以做到像人一样自然 。
此外,X2的本体支持很好的柔性阻抗控制,可以装配包括灵巧手在内的各种末端 ,使得其具备精细操作的能力,比如“针线缝葡萄 ”。
除了像人一样的运动能力,借助大语言模型技术 ,智元还为X2训练了定制的多模态交互大模型,硅光动语。
彭志辉称,“X2是第一台真正具备复杂交互能力的灵动机器人”,能够实现毫秒级的交互反应 ,通过人类的面部表情和语音语调精准判断情感状态,并做出相应的回应 。研发团队还将动作模态集成到了模型当中,赋予了灵犀X2更加鲜活的“生命力 ” ,比如模仿人类的呼吸韵律、会“暗中观察”,还有各类细小动作和肢体语言,让机器人拥有更多情绪表达的能力。
彭志辉在视频中展示了和X2的对话 ,可以看到比起同类机器人,X2的反应速度很快,可以做到即问即答 ,并且回答流畅,有一定情商,比如当被问到“如果给你看《银翼杀手》你会不会哭到短路?”时 ,X2回答:“不会哭但会感慨万千。 ”
语言能力之外,多模态模型还赋予了X2通过视觉理解和认知世界的能力,可以和人类通过视觉互动,比如识别对方手中的物体 ,结合视觉信息做出判断和回复 。
在机器人的模型训练方面,智元开源了业界最大之一的机器人真机和仿真数据集,并提出了RoboDual的大小脑系统架构 ,以及昨天刚刚发布的基于ViLLA架构的具身基座大模型“启元”。 基于该模型,X2初步具备了简单任务中对操作物体的零样本泛化能力,可在某些任务中实现多机协作 ,如相互充电。
彭志辉称,这种能力可外溢到日常生活的方方面面,有望实现机器人的“吉祥三保”:保安 、保姆、保洁 ,对通用机器人进化进行探索 。
成立两年量产千台
2021年,彭志辉在B站发布的“改造自动驾驶自行车 ”视频走红出圈,播放量突破500万 ,让这个年轻的“技术咖”走进大众视野。除了知名UP主,他还有一个标签是“华为天才少年”,2020年,彭志辉曾通过“天才少年计划 ”加入华为 ,从事昇腾AI芯片和AI算法相关研究工作。
2023年,彭志辉再次转换身份,这一次 ,他选择和合伙人创办机器人公司 。智元机器人一经成立就成为了资本的“宠儿”,两年来累计完成7轮融资,最新一轮融资为去年9月公布的A+++++轮 ,投资方包含高瓴、经纬 、鼎晖、高榕、蓝驰、红杉中国等头部投资机构,还有比亚迪 、上汽创投、百度风投等产业资本。
在此前接受界面新闻采访时,彭志辉解答了为什么会选择在机器人行业创业。在他的考虑中 ,一方面,AI大语言模型和一些通用人工智能技术的成熟,让行业走到了拐点;另一方面 ,AI和机器人技术的深度结合,也一直是他个人最感兴趣和理想的研究方向。
实际上,他也考虑过其他领域,比如自动驾驶 。他解释称 ,在选择赛道时,第一个考虑的因素是市场逻辑,他认为 ,在国内环境下单做软件,商业逻辑很难成立。而软硬件结合的产品,最合适的就是自动驾驶和机器人。
和创始人一样 ,智元的团队也相当年轻,据界面新闻了解,目前该公司的研发团队成员平均年龄在30岁以下 。目前 ,市面上的具身智能公司不乏有八九年历史的“老选手”,智元机器人研究院执行院长、具身业务部总裁姚卯青在采访中告诉界面新闻,他认为“老公司 ”可能有历史包袱 ,战略调整难且相对保守,智元成立时间虽短,但发展速度非常快。
今年1月6日,智元机器人宣布其量产的第1000台通用具身机器人正式下线 ,共量产双足人形机器人731套 、轮式通用机器人269套。
在路线上,智元集中于对人形机器人的开发 。彭志辉曾向界面新闻解读智元为什么要设计人形机器人,他表示 ,“我们人类习惯于在人形的环境中生活,人形机器人更加符合人类熟悉的生活、生产场景。”
同样是人形机器人,智元的机器人与最近爆红出圈的宇树机器人也有不同。宇树作为以四足机器人(机器狗)起家的公司 ,以打造机器人的运动能力见长,更侧重于强调机器人的“身体”对于提升“大脑”能力、实现AGI的重要性 。
宇树的G1人形机器人可以实现单腿跳跃 、原地起跳360度转身、上下楼梯等动作,在最近发布的视频中 ,G1还展现了左右出拳、转身空中回旋踢等中国功夫。
从这次的发布来看,智元的人形机器人虽然也强调其在运动上的灵活度,但整体而言展示的动作更加“精巧 ” ,同时加注了许多更类人的细节,装备了与人类的复杂交互能力。在战略上,智元也更突出公司对于大模型的研究成果 。
“对机器人公司来说,如果不做大模型 ,是没有未来的。”姚卯青对界面新闻表示。日前,智元发布了首个通用具身基座模型,并提出了ViLLA架构 ,在多模态大模型上也有投入。
这样的路线与彭志辉本人对于机器人的追求和公司战略有关 。在视频中,他提到,他希望能够造出和人类一样 ,灵活和智能的机器人。
从公司战略上来讲,短期内,智元表示将聚焦工业 、服务业和商业场景 ,比如POC项目已在工厂落地,但最终的长期目标是走进家庭,协助家庭成员完成各种任务。
彭志辉曾对界面新闻坦言 ,必须承认的是,在部分技术层面,智元达到了国内第一梯队的水平,但和国外领先技术还是有差距 。不过 ,国内市场的优势是制造很强,供应链较为成熟。
据界面新闻了解,智元今年机器人出货量计划保持在数千台 ,营收数预期保持数倍规模增长。公司仍在快速发展中 。
“大家总会高估一个技术的短期价值,而往往低估他的长期价值”,彭志辉在视频中表示 ,作为一个理想主义者,他坚信,随着AGI的加速到来 ,机器人会充分理解这个世界的物理法则,会梦到属于他们的电子羊,也会成为人类的得力伙伴 ,出现在我们生活的各个角落。
独角兽企业达闼机器人陷停摆危机:3月刚签新合作总部就人去楼空|界面新闻 · 科技
科技早报|小米辟谣“年底裁员”传闻;OpenAI讨论开发人形机器人|界面新闻 · 科技
宇树科技申请春晚机器人商标,预计未来机器人成本将大幅下降|界面新闻 · 科技
科技早报 | 蚂蚁集团回应自研大模型训练降本20%;腾讯领投智元机器人|界面新闻 · 科技
湖南在线:吃瓜中国黑料-在线吃瓜黑料反差黑料爆料-高通投诉Arm“损害竞争”,双方博弈或加速RISC-V等替代架构崛起|界面新闻 · 科技
苹果开放多个研发岗位招聘,推动家用机器人布局|界面新闻 · 科技
中共中央、国务院:加快养老科技和信息化发展应用,重点推动人形机器人、脑机接口、人工智能等技术产品研发应用|界面新闻 · 快讯
还没有评论,来说两句吧...