关闭广告

北京大学联合多所知名高校突破机器人视角转换技术

科技行者3461人阅读


这项由北京大学多媒体信息处理国家重点实验室的钱泽中、李雨明团队,联合香港科技大学的迟晓为、韩思瑞,新加坡国立大学的王世尊,以及北京人形机器人创新中心的秦志远、巨晓洲等研究人员共同完成的突破性研究,于2025年10月发表在arXiv预印本平台(论文编号:arXiv:2510.07313v1)。这项名为"WristWorld"的技术首次实现了让机器人通过外部摄像头的画面,自动生成手腕视角的操作画面,就像给机器人装上了"想象力",让它能从第三人称视角推测出第一人称的精确操作画面。

说起机器人学习操作技能,就好比教一个人学做菜。传统方法就像只让这个人站在厨房门口看别人做菜,虽然能看到大致流程,但很难掌握握刀、翻炒等精细动作的要领。而如果能让学习者直接从厨师的视角观看——也就是"第一人称视角",那学习效果就会大大提升。问题在于,要获得大量的第一人称视角录像非常困难和昂贵,就像要给每个厨师都装上头戴摄像设备一样麻烦。

这正是当前机器人学习面临的核心挑战。现有的大型机器人数据库虽然包含了数万小时的操作录像,但绝大部分都是从旁观者角度拍摄的第三人称视角,真正从机器人"手腕"角度拍摄的第一人称视角录像少之又少。这种数据不平衡就

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

还在磨合纽卡夏窗花近2.8亿欧,英超开局仅1胜3平1负排第13

直播吧 浏览 4422

俄称对乌实施大规模打击

极目新闻 浏览 2917

谢霆锋跟着遭殃!英皇力捧张敬轩回内地被抵制

可乐谈情感 浏览 765

世卫组织:6名苏丹医务人员被武装分子绑架

国际在线 浏览 3658

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者 浏览 3521

性压抑时代,搞黄色成了AI的第一生产力

虎嗅APP 浏览 2553

中信银行开年搅局!中信金租增资至120亿,杀进头部第八位

密探财经 浏览 2456

半个娱乐圈为肖战包场,《得闲谨制》票房走俏,侯鸿亮鞠躬致谢

娱乐圈笔娱君 浏览 3087

国内首个开放式机器人租赁平台在沪发布,已触达50个重点城市

澎湃新闻 浏览 2894

王一博发声,谈暂停拍戏原因

蕾爸退休日记 浏览 2915

如今,领导班子责任落实,成了老大难

识局 浏览 3411

斯基拉:马竞计划买断冈萨雷斯,费用为3200万欧+100万欧奖金

懂球帝 浏览 3868

泽连斯基:乌克兰将对非短缺武器实施受控出口

政知新媒体 浏览 4189

智谱正式发布并开源混合思考模型GLM-4.7-Flash,供免费调用

财闻 浏览 2525

《向往》口碑翻车!官方以嘉宾清闲为豪?

萌神木木 浏览 3793

今年秋冬最美的搭配:毛衣+裙子,减龄又气质!

LinkFashion 浏览 3636

千亿减肥药市场打响“地板价”争夺战

中国商报 浏览 2884

俄无人机救下一名正遭乌军性侵女子 顾不上提裤子拔腿就逃

大象新闻 浏览 3706

马龙社媒回复王楚钦生日祝福:还要靠你呢

懂球帝 浏览 3698

车展前的狂欢:4天30场发布会,谁在抢跑谁在焦虑?

车市红点 浏览 758

白宫黑手伸进委总统卧室!一场践踏国际规则的“黑夜绑架”

国是直通车 浏览 2804
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1