关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4081人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

詹姆斯谈保罗退役:希望他能好好享受最后的赛季,他已无遗憾

懂球帝 浏览 3732

网友称在按摩时遭51岁技师摸下体猥亵 门店:他才来3天

大风新闻 浏览 98080

金价暴跌 不少上海人跑外地买黄金:就像在抢大白菜

极目新闻 浏览 7149

美军多海域再现“航母真空”

环球网资讯 浏览 3846

看完《逐玉》我承认我还是喜欢长剧

时尚COSMO 浏览 2222

男子去理发结果给店家投40多万 自称不好意思拒绝别人

极目新闻 浏览 8921

对话Memories.ai:“人的记忆本质上是视觉,AI也该如此”

硅星人 浏览 3788

每体:多家俱乐部提出租借巴尔德吉,弗里克暂时希望他留队

懂球帝 浏览 4032

一文解读杨振宁的百年人生密码 曾与爱因斯坦做同事

北京日报客户端 浏览 6377

伊朗高级将领:若遭美国攻击 以色列将成为首要报复目标

极目新闻 浏览 2887

与欧洲领导人通话 特朗普“言辞强硬”

环球网资讯 浏览 3525

优质IPO企业站上资本C位

北京商报 浏览 3529

冬天穿衣要避免老气横秋!这些穿搭简单不过时,适合普通人

静儿时尚达人 浏览 2460

杰伦-约翰逊登顶老鹰队史三双榜 “新鹰王”已悄然诞生

仰卧撑FTUer 浏览 3578

今日热点:电影《震耳欲聋》定档1004;《惊天魔盗团3》发布新预告……

伊周潮流 浏览 6517

“虚胖”的高德,不像地图了

蓝鲸新闻 浏览 3298

英国教授来中国考察被震撼:堪称人类史上最伟大功绩

环球时报国际 浏览 12612

四名日本U17国脚在阿贾克斯试训,并与富安健洋、板仓滉合影

懂球帝 浏览 2582

消失5个月后泰禾黄其森“归来”

地产深度报道 浏览 3224

蔡英文近期动作频频 王鸿薇:她觉得赖清德"不行了"

海峡导报社 浏览 11691

或于2026年推出 比亚迪大汉谍照曝光

车质网 浏览 3487
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1