关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者876人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一小米SU7在行驶中突然失控:前轮车轴完全断裂

PChome电脑之家 浏览 956

NBA战报:凯尔特人146-101狂胜奇才取NBA3连胜,德里克-怀特30+7+9

懂球帝 浏览 198

以军缩小在拉法以东部队规模

新华社 浏览 10673

伊朗曝光核科学家遭暗杀细节,整个暗杀过程通过遥控远程武器完成

趣看热点 浏览 25890

特朗普呼吁美国促和:乌克兰或许得出让一些领土

看看新闻Knews 浏览 15406

上海海港官宣克甲联赛中卫加盟 本赛季欧联打进1球

网易体育 浏览 26215

美媒:中国达沃斯代表团阵容庞大 美国外交部很不安

直新闻 浏览 75942

建立互信和实现共赢,解读国有车企高层为何密集拜会任正非?

百姓评车 浏览 1539

布劳恩登全美热搜:创29年纪录被赞完美表演 NCAA+NBA冠军来了?

颜小白的篮球梦 浏览 16574

奶茶冲泡巨头香飘飘“突围”:首家线下茶饮店将开业,曾多次试水快闪店

红星资本局 浏览 874

弗格森:若中锋很快融入曼联会是强队,来这的球员必须要肩负责任

直播吧 浏览 14248

阿斯:琼阿梅尼因伤休战6至8周,莫德里奇在其缺阵时可发挥作用

直播吧 浏览 13590

以色列攻入加沙城 多国寻求将其逐出联合国

看看新闻Knews 浏览 1680

四足机器人首次同时「思考+走路」,北大提出链式推理MobileVLA-R1

新智元 浏览 200

最新流行烫发 短中长全都有!

镜子发型 浏览 15153

女大学生疑因考试作弊被抓纠缠监考官讨说法 校方回应

极目新闻 浏览 74027

以无人机黎巴嫩南部炸死真主党要员 爆炸瞬间腾起浓烟

新京报 浏览 885

大电池增程成风,车企在堆料自嗨?

帮宁工作室 浏览 556

打脸自己!特朗普持有上百万美元加密货币 曾大骂比特币是骗局

财联社 浏览 14629

SK海力士因环保问题被罚26.4万

雷达财经 浏览 982

向佐与郭碧婷游西湖贴脸自拍 首曝儿子高清正面照

叶公子 浏览 14464
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1