关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者3557人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

黄金、白银价格暴涨暴跌,投资者要警惕暴富“陷阱”,戒除豪赌心态

时代周报 浏览 2439

特朗普称将会见泽连斯基 讨论防空与远程导弹援助等

新京报 浏览 3103

工银安盛一年赚了25亿,三款“鑫如意”产品退保却达28亿

独角金融 浏览 1829

蓝箭航天冲刺商业火箭第一股 万亿赛道谁最受益?

21世纪经济报道 浏览 2683

UC圣地亚哥学者巧用树形搜索让AI画画训练快2.4倍

科技行者 浏览 2734

中兴驭风10 Air云电脑开售,售价2998元

IT之家 浏览 2418

日本自民党高官窜访台湾 外交部:"媚日谋独"令人不齿

澎湃新闻 浏览 8143

朱元璋变脸 研究学者:"鞋拔子脸"异像并非其真实面容

环球网资讯 浏览 20314

亚马逊CEO安迪·贾西:AWS到2027年底将实现电力容量翻倍

IT之家 浏览 1070

中经评论:“0糖”商标误导市场不能零处罚

中国经济网 浏览 476

松弛感穿搭太适合秋冬了,减龄又好看

LinkFashion 浏览 3453

若昂-内维斯卖便宜了?坎波斯:我们为他支付的价格很合理

懂球帝 浏览 2956

“恨海情天仙品CP”郭晓婷王天辰将合体拍杂志

手工制作阿歼 浏览 1978

奇瑞集团10月份销售汽车281161辆 同比增长3.3%

网易汽车 浏览 3587

江门中微子实验圆满完成工程建设任务

IT之家 浏览 2697

SpaceX:识别并切断缅甸电诈园区周边逾 2500 台“星链”设备

IT之家 浏览 3642

山东“入室抢婴案”一审宣判 4名被告人最高获死缓

环球网资讯 浏览 13975

被自称前女友的网友实名举报涉毒 短剧"顶流":别搞我

极目新闻 浏览 6896

23岁中国女导演在柬埔寨坠亡 头部与身体遭受严重撞击

红星新闻 浏览 6248

从顶层设计到产业落地 | 2026两会如何定义中国汽车未来五年?

观察者网 浏览 1639

3场3球,塞尔塔前锋斯韦德贝里当选西甲12月最佳U23球员

懂球帝 浏览 2682
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1