李瑞:通过视触觉和手眼协同平台打造真正心灵手巧的类人智能机器人
“2025世界机器人大会”于8月8日至12日在北京经济技术开发区开幕。“AI 大模型赋能机器人与具身智能产业新范式交流活动”作为2025世界机器人大会的专题活动于8月8日同期召开。纬钛机器人创始人兼CEO李瑞出席并演讲。

以下为演讲实录:
尊敬的各位领导、各位嘉宾,大家下午好!我是上海纬钛科技有限公司的创始人兼CEO李瑞。今天给大家带来的演讲,主要是围绕着机器人的触觉和手眼协同。
让我们设想一下,有一天机器人能够真正进入到家庭和生产很多场景中。比如家庭场景中,机器人能帮我们完成洗衣做饭扫地等家务。又比如在工厂生产线上,机器人帮我们生产各种各样的产品,让它能够实现类人的操作。要达到这些的操作,内在核心需要的能力底层基座可以总结为四个字“心灵手巧”。心灵代表有一颗聪明的大脑,各类大模型能够赋予机器人通用泛化的能力以及聪明的大脑,也带来更多的可能性,现在是正在快速发展的阶段。手巧也是非常核心的环节,一方面需要有比较多的自由度,但是更重要的是一定要有触觉反馈的能力。触觉是人和机器人感知环境和实现操作闭环非常核心的环节,当我们说具身智能的时候,为什么说具身?因为要跟现实世界进行一个交互,通过手来交互。手上很关键的部分就是要具备触觉。
人手可以获得哪些触觉的信息呢?一方面可以获取物体本身的性质,比如说表面的纹理、大小、形状、软硬程度、重量等等。另外一方面是接触的状态,我们跟这个物体交互的过程中它产生的一些力的信息,比如说法向力、切向力、相对滑动、物体位姿等等这些信息。
人在做90%以上甚至95%以上的操作的时候,都需要手和眼同时的参与和配合,我们叫手眼协同,这里触觉和视觉之间的关系属于相辅相成,是缺一不可得关系。一方面触觉作为视觉的延伸。另外一方面可以实现更加精细化的闭环,同时可以补充视觉信息并且实现实时的反馈。触觉本身也是我国35项“卡脖子”技术之一。
目前触觉相关的技术路线有不同的分类,比如电阻、电容、霍尔效应以及视触觉。其中视触觉是目前学术界研究最多也是最火的一个方向,同时也是业界公认最先进的触觉实验路径。全球最顶尖的高校、研究所基本上都在做相关的研究,比如国外的MIT、斯坦福、CMU、伯克利、国内的清华、北大、上交、复旦、中科大等等都在做相关的研究。
2024年《科学》杂志的机器人子刊封面照片其实就是视触觉。十几年前,我在美国麻省理工学院读博士的时候,跟我导师一起开创了这样一条技术路线。同时,我也率先做出了全球第一款分辨率可以超越人类手指的视触觉传感器,当时给它命名为GelSight指尖传感器,我们也发布了一系列的奠基性的论文。
时光荏苒,现在这个技术路线已经成为学术界里大家研究最广泛的一条技术路线。从2009年到2024年,视触觉的发展经历了三个阶段。
第一个阶段,技术起步期。
第二个阶段,发展期。
第三个阶段,爆发期。
2024年,我正式创办了纬钛机器人,把这项技术再进一步的完成从学术界到产业化的转型阶段,实现商业化落地,让它更快的在更多场景里实现落地应用。
迄今为止,我们实验室在整个全球人工智能顶会发表了70多篇相关的论文,其中有超过5篇的最佳论文奖以及十几年核心的know-how。前两周的世界人工智能大会上,我也有幸作为第一家机器人公司的代表向李强总理进行了汇报,介绍我们在视触觉以及手眼协同相关的工作,并进行了产品展示。总理给予了宝贵指导意见,并鼓励我们尽快将产品和智慧应用到千行百业。
视触觉为什么这么火?其实跟它的特性和优势是密切相关的。十几年前2014年当时的视触觉能做到什么程度,可以给大家简要介绍下。这个是全球第一款分辨率超越人类手指的视触觉传感器叫GelSight指尖传感器,右边是法向力信息,这个亮度代表压力的大小,分辨率可以达到10微米甚至微米级别,以及可以呈现出多维力的信息,我的手指在上面旋转按压等等可以呈现出多维力的信息。夹鸡蛋十几年前对我们来讲比较简单了,不仅仅可以让它夹鸡蛋,还可以让它抓易拉罐、薯片、草莓甚至是树叶,并且可以横着夹树叶。更重要的是在做操作的时候,我们是没有事先告诉它应该用多大的力,而是依靠传感器自身自适应调整。这个有点像人手做很多操作的时候,比如小朋友可以抓各种各样的食物、玩具、乐高等等。
这项技术和其它的触觉的技术路线比较起来有多方面的优势,比如传统的阵列式电阻、电容和霍尔效应的触觉传感器。我们可以总结为以下四个方面。
第一方面,分辨率超级高,是第一个分辨率可以超越人类手指的触觉传感器。传统阵列式的触觉传感器一平方厘米只有几个点或者小几十个触觉信息点,而我们的视触觉传感器可以达到几万个甚至几十万个点,可以是传统触觉传感器的分辨率的上万倍。
第二方面,进行多维力的测量,我们在说压力和触觉的时候,其实是有挺大的不同。压力通常是指某一个方向的力,但是触觉是多维信息的力,不仅仅有法向力还有切向力以及滑动的信息等等。切向力其实在机器人和人做很多操作的时候,往往是比法向力更加重要,法向力是垂直于物体表面的,切向力是接触表面平行的力。比如像摩擦力或者叫滑动力,人拿一瓶水,并不是说事先想好应该用一牛的力还是两牛的力把这瓶水拿起来,而是在拿的过程中通过切向力或者是摩擦力的感知,实时调整判断的,因此这里面切向力显的非常重要。
第三方面,可以操作软的物体,像衣服、线缆、鞋子等等。
第四方面,不容易受环境的影响,像温湿度、电磁场等等。
这是一部分的研究成果,可以自适应的抓各种各样不同的东西。更进一步的话不仅可以抓起来,还可以进行精细化的闭环控制的操作。比如说USB插拔,人在做插拔的时候,如果仅仅凭视觉能力,其实是非常难的。人做这个事情的时候通常是眼睛大致看一下USB的孔位在哪里,接下来更加进一步的闭环控制是靠手,靠触觉来完成的,人手可以感知到有没有插进去,如果没有的话再进行一些调整。
我们当时用视触觉传感器结合外部的视觉,实现手眼协同来做这样一个插拔的操作。其实也可以应用到很多不同的领域,很多的闭环控制都需要手和眼同时的配合,眼睛在很多时候是粗定位,触觉是进行更加精细化的闭环,可以说触觉是人或者机器人操作的最后一厘米。
我们的视触觉不仅仅可以做前面那些操作,甚至可以做材质识别。按压到不同的物体上,不同的布料之类的,可以识别出材质。当然我们要做的事情不仅仅是视触觉,这只是一个支点,我们希望通过视触觉和手眼协同的平台打造真正心灵手巧的类人智能机器人,真的让机器人像人一样进行很多的灵巧操作和实现心灵手巧的任务。分为三个阶段。
第一阶段,以视触觉和带触觉的手作为一个切入点。
第二阶段,结合机械臂可以实现垂直场景的落地。
第三阶段,结合大模型实现更加通用泛化的操作。
这是我们两指版本的视触觉传感器,在25×25毫米的面积内可以实现将近6万个触觉信息点。我们的产品拓展有带触觉的夹爪与带触觉的灵巧手,再结合机械臂,哪怕现在的协作臂,可以让它在一些场景里率先实现落地。不需要等到双臂或者说人形通用机器人的成熟手,已经可以这些场合里实现落地。
我们看一下它的效果展示,两指的版本可以在上面进行旋转、按压,可以看到整个力场的分布。当我在面按压的时候,整个反应是非常实时的,而且是多维力的。这边有另外一个视频展示更为全面的功能。
首先展示的是我们的视触觉传感器夹着一根非常尖的针然后去戳这个气球,这是非常有挑战的任务。传感器可以感知到很轻微的力,超级灵敏的切向力,并且不把气球戳破。
这个是展示了它的高分辨率的特性,同时可以实现自适应的抓取。各种各样的任务,包括纸团、面包、生鹌鹑蛋等等。可以无缝自适应的进行调整。这里不需要用非常高精度的摄像头,只是借助外部低精度摄像头进行粗定位。也可以进行USB插拔,并且还可以自己调整位姿。
同时在夹水杯的时候,可以根据水的多少自动调整夹紧的力度。刚刚展示的是两指的版本,现在也有一个五指的版本,现在在进行内测,今天只是给大家一个演示。这个用在灵巧手上,比如说气球可以根据力进行反馈。这是一个生鸡蛋,薯片其实比鸡蛋更难。我们公司买了很多薯片,不是给自己吃的,是给机器人用的。还有树叶,这个展示了非常灵敏的力,甚至用树叶稍微轻轻的碰一下都能感知到,而且感知到的是多维的力。甚至是柔软的嫩豆腐,都可以自适应抓取。
这个是非常普通的一个透明的水杯,五指的版本比两指的版本小很多,和人手的大小差不多,可以跟很多厂家的灵巧手进行无缝的适配,但是整个性能各方面来讲是非常类似的。这个可以让它应用在什么样的场景里呢?我们在说灵巧操作,现在的机器人为什么做不到,工厂里看到很多机械臂其实都是在重复执行一些轨迹,一旦操作的任务或者环境发生变化的话,没办法快速适应,这个其实也是大家一直想实现柔性生产的痛点,但是现在达不到。我们结合视触觉和手眼协同的算法,可以在很多场景里实现落地,无序的自适应抓取,什么东西都可以抓,用在拣选分类、上下料的场景等等。
不仅可以抓起来,还可以进行精准的放置,比如像小孩子可以把乐高块抓起来,并且可以精准的放到另一个乐高块上,这就是精准放置。还比如插拔、装配、上下料等应用。与此同时,我们还完美适用于柔性物体的操作,像衣服、鞋子、线缆、食物等等很多物体的操作。
我们也有跟很多家头部制造业客户形成了深度的合作,同时也在建立一个数据集,我们要把触觉信息放进去。其实当大家在说VLA大模型的时候,这里面欠缺了一个非常重要的模态就是触觉,这个机器人要跟世界交互,触觉肯定是离不开的。我们现在在打造一个VTLA的大模型,把这个T(触觉)结合进去,不仅有视觉还有触觉。这样可以让机器人做更通用、更泛化、更高成功率的一些操作。
我们的历史股东有很多来自产业界和头部的基金,这是我们的微信公众号,大家如果感兴趣可以关注我们,我们会定期的发布一些相关的信息。谢谢大家!
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
- • 山清水秀:大自然的画卷
- • 郑商所:关于征集丙烯期货指定交割仓(厂)库的公告
- • 空军地勤月薪揭秘:揭秘我国空军地勤人员的薪酬待遇
- • 司法漏洞纵容暴行,美国一消防急救员在救护车上遭保释犯刺杀身亡
- • 《重温经典,体验乐趣:锄大地游戏在线玩,畅享欢乐时光!》
- • 上报集团社长李芸:发挥媒体优势,让中非民心在数字时代更深层互联互通
- • “大而美”法案正式生效,多数美国民众认为会伤害中产
- • 乌拉圭前总统何塞·穆希卡去世
- • “Wu2198股市直播:洞悉市场脉搏,把握投资先机”
- • 绯色流星:夜空中最绚烂的奇迹
- • CBA战报:激情四溢的赛场,激情燃烧的篮球之夜
- • 界面晚报 | 央行:一季度末金融机构人民币各项贷款余额同比增长7.4%;端午假期全国铁路预计发送旅客8050万人次
- • 《Wu2198股市直播:实时解析,洞悉市场脉搏,助您投资无忧》
- • 周末要闻:特朗普称对墨西哥、欧盟征收30%关税 白宫欲借“装修门”解雇鲍威尔 欧盟推迟对美关税反制措施
- • 溃坝:自然灾害的警示与应对
- • 奥巴马和小布什罕见发声,批评特朗普政府
- • 这个夏天,我不想做「腋下管理」了
- • 豆神教育涉信披违规面临处罚,部分股民可索赔损失!
- • A股,迎来突破性制度!“长钱长投”背后,有何深意?
- • 南京航空航天大学启动扁平化改革:管理岗规模控制在20%,不再统一设科级机构
- • 韩雪爷爷:一位传奇老人的艺术人生
- • 中国邮政报刊订阅网:便捷生活,尽在一网之间
- • 开盘:美股周二高开 中东紧张局势降温
- • 地方新闻精选 | 浙江衢州一村干部不慎落水遇难 成都发布今年首个高温红色预警
- • 2020年度最受欢迎的电视剧盘点:最新电视剧盘点来袭!
- • 还来得及:把握当下,追逐梦想的脚步永不停止
- • 电子哨兵:智慧城市的安全守护者
- • 一周展讯|《女史箴图》伦敦展出,列宾名作来到国博
- • 公司管理制度红头文件:规范企业运营,提升管理效能
- • 一酒企在啤酒中添加类似“伟哥”物质,遭市场监管总局通报
- • 春日里的红情绿意:一场视觉与情感的盛宴
- • 《午夜寂寞:揭秘影片破解版背后的故事与情感》
- • 贝因美回应奶粉涨价:所有品项都没涨价、坚守5%利润底线
- • 侏儒火箭靴:探索宇宙的神秘步伐
- • 去势:从生物学到社会学的多重解读
- • 【追踪】密云太师屯镇灾后重建:路通了好走了,才能清理家中淤泥
- • 金庸作品电视剧:经典武侠的视觉盛宴
- • 英国电信老板柯克比预计人工智能将加剧该公司的裁员规模
- • 独家童话免费观看全集完整版高清,带你走进梦幻世界!
- • 分红保险:稳健投资与风险保障的双重保障
- • 墙地砖施工技术交底:确保施工质量的关键步骤
- • 探索酷乐设计网:创意无限的设计灵感聚集地
- • 光明日报:家门口的社区食堂,越来越“圈粉”?
- • 路遇交通事故镇干部冲进火海救人,已申报见义勇为
- • 雷军:小米汽车业务下半年将盈利,YU7定价不是23.59万元
- • 厄瓜多尔前交通部长:构建人类命运共同体是共同的目标
- • 人民日报评论员:把造福人民作为根本价值取向
- • 北师大珠海分校:培养未来教育精英的摇篮
- • 吉林省第八批援藏干部总领队曲玉祥履新青海省科技厅党组书记
- • 2020春节档电影盛宴:光影交织,欢乐无限
- • 《小林家龙女仆:治愈系动漫中的奇幻与温情》
- • 腰间盘突出最佳治疗中药:中医智慧,缓解病痛新选择
- • 保时捷考虑在华停售电动汽车,CEO称未将小米当对手
- • 轰炸机软件:未来战争的关键利器
- • 吴青峰歌曲:旋律中的青春记忆
- • 台湾成年妹妹导航:探索宝岛文化,领略青春风采
- • “姐姐”失踪了,南非摄影师以照片的方式延伸至社会问题
- • 河南消防网:守护河南消防安全的重要平台
- • 收盘:美股涨跌不一 标普500指数接近历史高位
- • 李东生:新型全球化是中国企业发展的主要驱动力,应构建全球经营和供应链体系
- • 探索“完美邮局网登录系统”:便捷高效的服务体验
- • 长沙银行官网下载:便捷金融服务,轻松开启您的理财之旅
- • 包凡确实回来了
- • 全球首次,中国摄影师一镜到底拍摄人类北坡登顶珠峰
- • 探寻“两廊一圈”的起点与终点:历史与现代的交融之旅
- • 尼摩船长与阿龙纳斯在海底环球旅行的奇幻航线
- • 改革开放再出发:新时代中国发展的新篇章
- • 人民日报头版聚焦:上海加速形成人工智能全链条体系
- • 南京网红店“兄弟龙虾”用酸臭溶液洗虾、多日不换水,市场监管部门已责令其停业整改
- • 研究生毕业论文答辩PPT制作技巧与要点解析
- • “妇委会活动方案:丰富女性职工生活,提升团队凝聚力”
- • 黄河大合唱八个乐章歌词:激荡人心的民族史诗
- • 金鹰核心资源混合:引领投资新潮流的明星基金
- • 美联储理事Barr:与关税相关的供应链中断可能推高通胀
- • 特朗普称印尼将根据贸易协议购买50架波音飞机
- • 《人民的名义》全体演员阵容大揭秘:实力派明星云集,演技与颜值并存
- • 美国“大而美”法案,引发铜价飙升,黄金大涨!有色龙头ETF(159876)冲击8连阳,再刷年内高点!
- • 欧美夫妻行房视频:揭秘西方性观念与婚姻生活的真实面貌
- • 深入理解与践行《中国共产党支部工作条例(试行)》——新时代党支部建设的行动指南
- • 沈剑平:AI赋能与数据驱动正成为检测机构未来发展的重要方向
- • 探索“Cometolive儿童网际学院”:培养未来数字公民的教育新模式
- • 酒吧857:探寻数字背后的神秘暗示
- • 金鹰核心资源混合:投资界的明星基金,揭秘其独特魅力
- • 2016年36号文:中国房地产市场调控的里程碑
本文 快租网 原创,转载保留链接!网址:https://www.kuaizu.me/post/25302.html