关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者3552人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特尔:定位球让英超观赏性变差了,看着很无聊

懂球帝 浏览 1798

杨振宁和她的53年婚姻,是这样的

Yuki女人故事 浏览 3669

45岁潘玮柏好福气!34岁老婆宣云温柔又独立

体育小柚 浏览 3357

东京车展首发 曝丰田世极轿跑SUV概念车官图

车质网 浏览 3238

苹果将在 2028 年款 MacBook Air 上采用 OLED 显示屏

威锋网 浏览 3494

伊朗总统:战争既不符合伊朗也不符合美国利益

国际在线 浏览 2393

被央媒怒批!目不识丁、脑子空空

东方不败然多多 浏览 3725

时尚启蒙必看片单,终于更新了

时尚COSMO 浏览 742

最高8.8分!盘点2025年评分最高的10部电影

林木体育解说 浏览 2711

三星被曝2026年发新款折叠屏手机,屏幕超7英寸、护照式设计,叫板苹果

智东西 浏览 3006

女佣自杀,最贵凶宅诞生!许家印好牌友要吐血

说财猫 浏览 3635

东升西降?拆解全球车企三季报,中国车企业绩更稳

大李说车 浏览 3234

高市早苗当选首相 日本史上首名"第一先生"信息披露

环球网资讯 浏览 7672

十五运会开幕式收视出炉!最高破3.9%,刘德华上场涨出小高峰

萌神木木 浏览 2821

法尔克:皇马和切尔西将争夺于帕,签字费是他与拜仁续约障碍

懂球帝 浏览 3664

国家级5G智慧工厂背书,全新深蓝S07上市交付

经济观察报 浏览 4484

俄军空袭乌克兰首都基辅 供电供暖大范围中断

界面新闻 浏览 2771

刘强东又要敲钟:京东工业冲刺港股,估值67亿美元

蓝鲸新闻 浏览 4075

左脚低射破门,加纳乔成为切尔西队史第6位进球的阿根廷球员

懂球帝 浏览 3592

独栋别墅被拆除业主原地偷建 城管局:他"打游击"施工

扬子晚报 浏览 12823

装腔鸭王长发男,民间小赛都在比什么?

Vista氢商业 浏览 1114
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1