贝贝文学

字:
关灯 护眼
贝贝文学 > 重生08,豆包成了我的外挂 > 第649章 玉泉路扛把子登顶榜首

第649章 玉泉路扛把子登顶榜首


会议室里再次陷入了沉默。

一个没有任何机构背景,用着中国大众邮箱,名字极其随意的队伍,直接把当前计算机视觉的最高记录翻了一倍。

这听起来就像是一个拙劣的愚人节玩笑。

但数据偏偏是铁打的事实。

“有没有可能是我们自己团队的谁,不小心把内部测试的某个超前结果传上去了?”李飞飞抛出了第一个假设。

约翰直接摇头。

“不可能,李老师。”约翰苦笑,“我们团队现在最好的模型,昨天晚上刚跑完一轮,Top-1才刚过30%。连人家的尾灯都看不到。这结果跟我们完全不在一个量级上。”

“那会不会是测试集的标注答案泄露了?”大卫提出了第二个假设,“如果是有人拿到了标准答案,直接把答案改个名字上传,也能得到这个分数。甚至可以故意答错一些,控制在60%左右,避免百分之百太显眼。”

李飞飞立刻看向陈冉。

“陈冉,联系ImageNet项目的数据管理员,调取测试集所在的最高权限访问日志。我要看从发布到现在的所有记录。”

陈冉立刻拿起手机开始打电话。

会议室里的气氛压抑得让人喘不过气。

如果真的是测试集泄露,那整个ImageNet项目的公信力将遭到毁灭性的打击。

十分钟后,数据管理员把日志文件发了过来。

陈冉打开文件,快速浏览。

“没有泄露。”陈冉指着屏幕上的记录,“日志显示,测试集从发布到现在,只有三个经过授权的内部高级账号下载过。而且这三次下载记录,都是在项目启动初期为了做本地环境配置。最近三个月内,没有任何人访问过测试集原始数据所在的安全分区。”

“黑客攻击呢?”大卫追问。

“防火墙没有报警记录。”陈冉说,“而且我们的测试集服务器是不对公网开放的物理隔离节点,想要拿到数据,除非有人亲自跑到机房拔硬盘。”

假设再次被推翻。

“既然不是答案泄露,那这就见鬼了。”约翰双手抱头,“如果不是作弊,那这个正确率意味着什么?”

大卫看着电脑屏幕上的乱码发呆。

“意味着他们用的方法,已经跟我们不在同一个理论框架里了。”大卫说。

“陈冉,你最了解中国那边的情况。”

李飞飞问,“会不会是中国那边找了大量的人力,对着测试集一张一张标注出来的?重赏之下必有勇夫,为了那三万美元的奖金,这种人海战术在理论上是可行的。”

陈冉还没说话,约翰先反驳了。

“这绝对不可能。”约翰语气坚定。

“为什么?”陈冉问。

“ImageNet的分类不是区分猫和狗那么简单。”约翰语速飞快,“李老师,您忘了测试集的分类都是什么吗,一百二十种不同的狗!普通的数据标注工,哪能分得清诺威奇梗和凯恩梗?哪能分得清阿拉斯加雪橇犬和西伯利亚哈士奇在模糊背景下的区别?”

约翰指着屏幕上的一个分类标签。

“再看看植物类,普通标注工能看出一张带点反光的叶子到底是哪种蕨类植物吗?这需要专业的生物学知识!普通人盯着看一天也分不出个所以然。”

约翰越说越激动。

“要达到接近六成的Top-1准确率,他们不仅需要找人看,还需要找动物学家、植物学家、汽车型号鉴定专家一起来看!普通人根本做不到这种精度,更不用说还要保证几千张图片的一致性了。”

大卫在旁边跟着点头。

“我算一笔经济账。”大卫补充说,“如果他们真的用人力标注,要请这么多专家来会诊十五万张图片,还要保证绝对的保密不走漏风声,这个成本早就远远超过了三万美元的奖金。逻辑上完全说不通。没有人会花三十万美元去赚三万美元。”

人海战术的假设也被彻底推翻。

李飞飞深吸了一口气。

“参赛系统是允许参赛队伍提交论文和源码的,对吧?”李飞飞问。

“对,这是选填项。”陈冉点头。

“我们看一下他们的详情页。”李飞飞说。

四个人同时点进“玉泉路扛把子”这个ID的提交详情页。

页面加载出来。

论文栏,空着。

源码栏,空着。

算法架构说明栏,空着。

只有那一份预测结果的Excel表格,孤零零地挂在附件下载区里。

约翰靠向椅背,双手摊开。

“没有任何理论说明,没有任何代码实现,只有一个干巴巴的结果。”约翰盯着屏幕,“这怎么解释?魔法吗?”

大卫摸了摸下巴。

“就好像有人直接从未来把答案送过来了一样。”大卫说。

会议室里再次安静下来。

大卫这句无心的话,让陈冉觉得后背有些发凉。

李飞飞站起身,走到会议室的白板前。

她看着白板上之前画满的各种特征提取算法的流程图,觉得这些东西现在看起来就像是上个世纪的古董。

“不管我们能不能理解,不管他们用了什么方法。”李飞飞转过身,看着会议桌前的三个人,“这个结果是真实存在的,它通过了我们所有的验证机制。”

“那排行榜还更新吗?”约翰问。

“如果不更新,我们就是在否定我们自己建立的评测体系。”李飞飞毫不犹豫地说,“更新。”

“可是李老师,一旦这个数据放出去,北美这边的学术界可能就不只是炸锅那么简单了。”陈冉有些担忧,“大家会觉得我们这个榜单出了严重的漏洞。”

“那就让他们去查漏洞。”李飞飞语气坚定,“科学就是在不断打破认知中前进的。既然有人做到了,我们就必须承认。”

陈冉点头,手指放在了鼠标上。

“我马上操作。”

点击。

确认。

数据同步。

于是,在2010年1月的这个上午。

ImageNet挑战赛的官方排行榜,迎来了一次毫无预兆的刷新。

让原本的榜单显得有些菜鸡互啄。

顶替他们的,是一个全新的名字。

第一名:玉泉路扛把子。

Top-1正确率:59.8%。

Top-5正确率:76.3%。

原先排名第一的团队成绩是29%和69%。

这两个指标之间的巨大鸿沟,大到让所有刷新页面看到榜单的人,都会以为自己的显示器出了故障。

李飞飞合上自己的笔记本电脑。

“陈冉,一会记得发一封邮件给那个QQ邮箱,邀请他们提交一下预测使用的方法。语气客气一些,但是要表达出我们迫切的渴望。”

“不过我怀疑他们是有一些技术秘密不想透露,我们不一定能等得到他们的回信。”

“所以,从今天开始,你手头其他的杂活先放一放。”李飞飞看着自己的学生,“密切关注中国那边所有和计算机视觉相关的实验室动向。”

“中国那边的实验室?”陈冉问。

“对。”李飞飞点头,“能做出这种成绩的,绝对不是几个散兵游勇。背后一定有一支顶级的团队,甚至可能是国家级的算力支持。只要他们还在做研究,就一定会发论文。有任何新的论文,或者相关的技术博客发布,第一时间整理发给我。”

“明白。”陈冉说。

章节错误,点此报送,报送后维护人员会在两分钟内校正章节内容,请耐心等待。