关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者779人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

孙俪参加大提琴英皇初级考试 开心晒成绩单获高分

娱絮 浏览 18756

中年女人怎么选裤子 看完这3点就知道了

形象设计师飞飞 浏览 17236

DNA双螺旋结构发现者詹姆斯・沃森去世

第一财经资讯 浏览 650

比起颜值,气质更重要

LinkFashion 浏览 13188

关晓彤奶茶店再次陷入合同纠纷 被执行标8.1万元

网易娱乐 浏览 16090

续航达600km,路特斯EMEYA将于1月18日上市

天天汽车 浏览 13083

韩乔生谈梅西:接下来就等着梅老七变梅老八,金球奖实至名归

直播吧 浏览 15441

佩洛西要FBI调查"亲俄分子" 被批"诽谤"和"妄想"

环球网资讯 浏览 12617

又一个!郭源元自曝在范范孕期遭到陈建州性骚扰

网易娱乐 浏览 15800

罗马诺:曼联认为亚特兰大要价过高,因此还未报价霍伊伦德

直播吧 浏览 15587

法医谈货拉拉女孩跳车事件,从窗户跳下的可能性不大

趣看热点 浏览 184407

被Meta点醒,苹果砍掉廉价头显,押注智能眼镜

网易科技报道 浏览 965

香港闹市发现二战时期美军投射炸弹 耗时12个小时拆除

新民周刊 浏览 22636

未婚未育男子将遗产留给外甥遗嘱却写错名字 法院判了

环球网 浏览 6473

中年女人多穿“阔腿裤”显气质!不挑身材、不挑年龄,美极了

静儿时尚达人 浏览 13256

力源科技被证监会处罚拟落地 律师征集受损投资者维权

雷达财经 浏览 16219

巴黎人报:出于保险,恩里克半场就换下了努诺-门德斯

懂球帝 浏览 369

从“百模大战”到“百镜大战”,AI眼镜成新焦点丨一克商评

封面新闻 浏览 770

拜登为何卸任前如此“恶毒”?

浏览 22893

女生将没吃的菜"推销"给隔壁桌:原价48元便宜8元卖出

潇湘晨报 浏览 68123

马拉多纳尸检结果公布马拉多纳抢救最后细节曝光

趣看热点 浏览 26195
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1