关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3678人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

气场拉满:泰国改装厂让长城坦克300“变身”Brabus G63

IT之家 浏览 2762

何晴去世后续:儿子出生户口不能上自己家

古希腊掌管月桂的神 浏览 3069

摄影比赛第一名被指是AI生成图片 被取消成绩

封面新闻 浏览 7213

不满国安糟糕战绩,工体北看台球迷连唱三首歌表达抗议

懂球帝 浏览 3539

武契奇预测:48小时内伊朗遇袭

极目新闻 浏览 8976

四个月内两高管遭留置 富森美称与上市公司无关

中国经营报 浏览 3266

1-9月百万级豪车销量:奔驰3款入榜,奥迪出局,仰望U8苦苦支撑?

AGKC阿贵艺车 浏览 3501

国家级射击教练因走私武器罪获刑10年:多省射击队购买

中国新闻周刊 浏览 13193

程强:通胀数据反映的积极信号

首席经济学家论坛 浏览 3407

苹果预计今年不会发布标准版 iPhone 18 推迟到 2027 年

威锋网 浏览 2740

外媒:安世半导体已暂停向中国工厂供应晶圆

澎湃新闻 浏览 14439

媒体:高市早苗疯言台湾问题 中方对她没什么好客气的

新民晚报 浏览 7546

大鹏工业:外购标准件采购占比超七成 自研的被评奖项目背后现客户

金证研 浏览 3675

余承东任华为终端公司董事长,孟晚舟等卸任董事

蓝鲸新闻 浏览 2399

小将谢泼德与考文垂签下职业合同,球员受到曼联、阿森纳关注

懂球帝 浏览 3064

2025年双11来了!京东提前至10月9日开启:满300元减50元 活动玩法出炉

快科技 浏览 4252

偷鸡不成蚀把米!白百何疑开撕王传君,自己却先被骂了个底朝天

娱乐圈笔娱君 浏览 3541

美媒:特朗普发帖"禁止"以轰炸黎 内塔尼亚胡感震惊

新华社 浏览 730

斥资5.6亿,看完《惊蛰无声》预告片,我想说:张艺谋又赌赢了!

娱乐圈笔娱君 浏览 2527

与中国“交好”,拿盟友“开刀”,战略已明朗

浏览 26845

东南大学团队首次揭示:视觉欺骗如何让AI"看走眼"

科技行者 浏览 2585
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1