关闭广告

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者2729人阅读


当我们人类想学一项新技能时,最常见的方法就是看别人怎么做——看视频教程、观察师傅操作,然后模仿着练习。斯坦福大学的研究团队在2024年12月发表的一项研究中,成功地让机器人也掌握了这种"看视频学本领"的能力。这项名为"Dream2Flow"的研究由斯坦福大学的Karthik Dharmarajan、Wenlong Huang、Jiajun Wu、Li Fei-Fei和Ruohan Zhang等学者联合完成,论文编号为arXiv:2512.24766v1。

这个研究解决了一个令人头疼的问题:如何让机器人理解并执行那些看似简单的日常任务。比如说,当你告诉机器人"把面包放进碗里"时,它需要理解什么是面包、什么是碗,更重要的是要知道怎样抓取、移动和放置这些物品。传统的方法需要程序员为每个动作写出详细的指令,就像给机器人编写一本超级详细的操作手册。但现实世界太复杂了,物品的形状、位置、重量都千变万化,写不完的手册根本无法涵盖所有情况。

研究团队想到了一个巧妙的办法:既然现在的AI视频生成技术已经能够根据文字描述生成非常逼真的视频,那何不让机器人先"看"一段展示如何完成任务的视频,然后从中学习物体应该如何移动?这就好比你

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这一夜,龚俊不再吃香,被46岁的男配惊艳

温柔娱公子 浏览 3570

为何美军害怕伊朗布设水雷

澎湃新闻 浏览 1578

TA:曼联今夏额外借贷1.05亿镑用于引援,目前总债务6.37亿镑

直播吧 浏览 4452

77岁大爷孤身赴柬埔寨见网友流浪数日:互联网喊我来的

潇湘晨报 浏览 9367

斯凯奇门店清零,奥康国际失去第二曲线

斑马消费 浏览 512

但斌91亿元美股持仓出炉:大幅加仓谷歌至第一重仓股,英伟达退居次席

澎湃新闻 浏览 2457

OPPO Find X9 系列实拍:定位“旅拍神器”,口袋里的哈苏相机

IT之家 浏览 3595

兰博基尼 CEO 温科尔曼称至少十年内不会放弃内燃机

IT之家 浏览 3801

在都市里种下一颗自然的种子 欧拉5设计解析

网易汽车 浏览 4277

工银安盛迎来准80后总精算师,总经理尚未正式就任

财经众议院 浏览 2613

插混车纯电续航超过210km,增程车怎么办?

汽车公社 浏览 2690

说一个令很多人不安的事:比亚迪,越来越像理想了

小李车评李建红 浏览 3748

汽车图谱㉔|1月车市调整:上汽销量居首,吉利逆势增长

贝壳财经 浏览 2442

被演唱会上的叶倩文惊艳

喵喵娱乐团 浏览 3861

国资券商整合收官!新国盛证券承接所有业务,原主体完成工商注销

21金融圈 浏览 2397

美国4月服务业PMI不及预期,叠加价格压力高企,加剧滞胀担忧

华尔街见闻官方 浏览 308

U23国足防线多人有伤在身,后卫鲍世蒙开场不久伤退

懂球帝 浏览 2640

也门胡塞武装以间谍罪判处18名受雇于联合国人员死刑

北京日报 浏览 3322

美国想打造联合国替代机构 该机构章程透露关键信息

上观新闻 浏览 6929

逃离5A景区的中年人,正在涌向“差评最多”的小店

她刊 浏览 214

曹骏舒畅世纪同框,蓝盈莹自食恶果,高低立判!

情感大头说说 浏览 2357
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1