关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4177人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

巴沙尔倒台,土耳其成最大赢家,最大输家是谁

浏览 27235

青甘大环线有老外开敞篷老爷车行驶 有1955款劳斯莱斯

极目新闻 浏览 5747

终于有一部国产剧,不靠「爽感」博眼球了

独立鱼 浏览 3094

姚期智:我们建成了世界上最好的量子实验室之一

上观新闻 浏览 4835

免疫调节原研药赛能缺货致价格翻倍!已有药店限购,相关企业回应:涨价是市场行为

红星资本局 浏览 4110

迪丽热巴“扛剧女王”人设崩塌?

孟一宜 浏览 3768

华为广汽新车明年6月上!任正非建议品牌名,徐直军参与造型评审

车东西 浏览 3621

白色灵动岛:消息称努比亚手机也将“上岛”,可自行选择开关

IT之家 浏览 3477

石药集团185亿美元合作背后

YOUNG财经 浏览 2983

工业边缘AI计算赛道升温,设备与芯片厂商抢占风口

21世纪经济报道 浏览 4913

双片闪耀,北京跨年放映今日开票!

幕味儿 浏览 2860

美国务卿批准向中东国家出售价值258亿美元的武器

国际在线 浏览 856

神仙友谊!杨紫连续10年为张一山庆生

橙星文娱 浏览 970

全球最大稳定币遭质疑 标普将评级降至“最差一档”

财联社 浏览 3735

哈兰德:我对吕迪格一直很尊重;确实很想念贝林厄姆

懂球帝 浏览 3687

增程车市场凉了?4月没一款销量过万

正在说车 浏览 267

“1元买壳”10个月后,北大医药新老板徐晰人突遭刑拘!

野马财经 浏览 4122

京沪高铁:一道复杂的算术题

锦缎研究院 浏览 3373

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者 浏览 2971

西安突降暴雪航班大面积延误 旅客:被迫在机场跨年

封面新闻 浏览 18101

余承东展示鸿蒙智行门锁安全设计:安全是最大的豪华

三言科技 浏览 4224
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1