关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3685人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

40岁邓莎宣布离婚!直言无法改变路行,将告别过去追求新的人生

萌神木木 浏览 2577

审美倒退30年?舒淇却被全网夸爆了

Yuki女人故事 浏览 751

"震荡"之后中美传来好消息 李成钢的表态意味深长

中国新闻周刊 浏览 8982

每秒可传 1250 万部高清电影,亚马逊启动跨大西洋海底光缆项目

IT之家 浏览 3416

世体:对阵贝蒂斯卢克曼将直接首发,完成加盟马竞后的首秀

懂球帝 浏览 2367

希金斯晋级斯诺克北爱赛八强

体坛周报 浏览 3622

卢浮宫抢劫案两嫌疑人均30多岁 一人试图登机离境被抓

极目新闻 浏览 8620

马龙社媒回复王楚钦生日祝福:还要靠你呢

懂球帝 浏览 3695

李立群回应三个孩子都没结婚

大眼妹妹 浏览 3285

插混加持 新款捷途旅行者C-DM本月17日上市

车质网 浏览 3523

“大衣+运动鞋”才是冬天最时髦搭配,这样穿松弛又减龄!

LinkFashion 浏览 2672

泸州老窖前三季度营收净利双降 国窖1573等中高档酒销量同比下滑10%

YOUNG财经 浏览 3474

《镖人》是奔着武侠票房冠军去的

娱乐圈笔娱君 浏览 2621

没想到这3个小习惯,给我生活带来这么大的变化

黎贝卡的异想世界 浏览 3795

搭载V8混动系统 丰田全新跑车将12月5日发布

车质网 浏览 2438

高市内阁名单出炉 身材火辣的日本知名写真女星入选

红星新闻 浏览 9588

朝鲜举行盛大阅兵式 高清大图来了

新华社 浏览 3586

盲打!快船和掘金比赛连续出现计时器故障,裁判被迫手动计时

懂球帝 浏览 3692

NVIDIA推出ChronoEdit:让AI图像编辑拥有物理常识的革命性技术

科技行者 浏览 3400

浙江助教:尽全力去拿下胜利;对王钰栋和张瑷晖的缺阵有预案

懂球帝 浏览 3576

蓝宝石高管首度回应显卡16Pin烧毁:就算解决、名声也臭了

快科技 浏览 3082
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1