零点看书

字:
关灯 护眼
零点看书 > 高二分科,我选校花也选亿万身家 > 第396章 我这有几千张GPU,你要吗?

第396章 我这有几千张GPU,你要吗?

第396章 我这有几千张GPU,你要吗? (第1/2页)

八月的西安,是能把人烤出油来的那种热。
  
  不像锦城那种阴湿的蒸笼感,西安的毒日头是直接劈下来的,混着秦川平原上吹来的干热风,把整座城市炙烤得像一块巨大的砖窑。
  
  任少卿拎着一个鼓囊囊的黑色双肩包,从西安交大东门的公交站一路走进校园,衬衫后背湿透了大半,贴在脊梁骨上,黏糊糊的,难受得很。
  
  他低着头,盯着脚下的花岗岩路面,脑子里反复过今天宣讲的那三十二页PPT。
  
  第七页的实验数据。
  
  第七页,是整个报告的命门。
  
  任少卿闭上眼睛,那张对比折线图像刻进脑子里一样挥不去。
  
  他基于AleXNet架构改进的卷积神经网络模型,用东拼西凑的四卡GPU服务器跑出来的结果,在PASCALVOC2012数据集上,目标检测精度比学界主流的DPM模型高出了将近十一个百分点。
  
  十一个百分点。
  
  在他看来,这不是一个数字。
  
  这是一次典范转移。
  
  他二十七岁,中科大和微软亚洲研究院联合培养的博士生。
  
  去年从合肥到了一趟北京,跟着导师的组看完了HintOn组在ILSVRC比赛上用AleXNet把传统方法打得落花流水的完整论文。
  
  他当时就坐在微软大厦十二层的组会室里,咖啡都顾不上喝,盯着屏幕上那个把所有传统方法甩开将近十个百分点的成绩,心里某个地方“咔哒”一声,被什么彻底撬开了。
  
  那种感觉,他后来想了很久——大概类似于在一片乌压压的普通人里,突然认出了另一个同类。
  
  然后他就扎进去了。
  
  整整八个月,几乎把所有能腾出来的时间全部押进去。
  
  他在自己的研究方向里开了条岔路,拐进了当时连导师都半信半疑的深度学习丛林,靠着微软亚研院借给他的一小块GPU算力,把那套模型一点一点搭起来,调参,再调参,处理过拟合,再处理,换框架,换数据增强方式……
  
  然后跑出了那个让他失眠了整整一夜的数字。
  
  但他没法训练更大的模型。
  
  算力不够。
  
  微软亚研院给他划的那块算力有上限,还要跟组里其他项目排队。
  
  他算过了,如果要把网络规模再扩大一倍、数据集再丰富三倍,按现在能用的算力,连续不间断地跑,需要将近四十七天。
  
  他等不起。
  
  不是技术上等不起,是赛道上等不起。
  
  他清楚地感觉到,全球跑在这个方向上的人越来越多。
  
  去年AleXNet一出,全世界顶级实验室就像被点着了一样,一股脑儿往这边涌。
  
  斯坦福、CMU、DeepMind……这些机构手里握着的算力,是他这种人做梦都摸不到的规模。
  
  他必须跑快一点。
  
  所以他来了西安。
  
  “2013年全国计算机视觉与模式识别暑期研讨会”,主办方是西安交大和西工大,协办方拉了一长串,里头有两个国家级的超算中心。
  
  这场会议在学界的分量不算最顶尖,但务实。
  
  任少卿要的也不是顶尖,他要的是那两个超算中心的挂名负责人,以及他提前查过的、挂在西工大计算机视觉重点实验室名下的那一批国防科工委拨款的H系服务器集群。
  
  他的如意算盘是:论文宣讲好,跟西部这边的大拿们混个脸熟,饭桌上开口“化缘”,借一批算力用三个月。
  
  道理上没问题。
  
  学术圈就是这么运转的。
  
  任少卿走进报告厅大楼,扑面而来一股凉气,把他半干不湿的衬衫一下子激透了,打了个哆嗦,稍微舒坦了点,抬头看了眼指示牌。
  
  计算机视觉分会场,三楼报告厅B。
  
  宣讲安排在下午两点,是下午场的第二个报告。
  
  现在是上午十点四十分。
  
  时间够。
  
  ……
  
  上午的大会主题报告,任少卿坐在后排,把论文草稿掏出来又过了一遍。
  
  台上是一位西工大的老先生,做人脸识别做了二十多年,满头白发,声音洪亮,PPT是黑底绿字的经典配色,一页一页往下翻,每一页都有至少三段话。
  
  老先生讲的是基于可形变模型的人脸特征点对齐,理论体系扎实、推导完备,是这个领域里毫无疑问的泰斗级工作。
  
  任少卿认认真真地听,认认真真地鼓掌。
  
  然后继续低头看自己的论文。
  
  ……
  
  下午两点整,任少卿走上讲台。
  
  报告厅里坐了大概七八十人,前排是几位头发花白的老教授,中间是一群年龄不一的副教授和研究员,后排是一大片跟他差不多大乃至更年轻的博士生和硕士生。
  
  任少卿把U盘插进去,屏幕上亮出报告封面:
  
  《基于改进卷积神经网络的目标检测:突破传统特征工程的范式》
  
  他扫了一眼台下,做了个深呼吸。
  
  “各位老师、各位同学,下午好。我叫任少卿,来自中科大与微软亚洲研究院的联合培养项目。今天我要跟大家分享的工作,核心出发点是一个我认为非常重要的问题——传统的手工特征,在目标检测任务上,是不是已经遇到了天花板?”
  
  后排有几个博士生坐直了一点。
  
  前排的老先生们,表情没什么变化。
  
  任少卿继续往下走。
  
  他讲架构,讲他对AleXNet的改进,讲数据增强,讲在PASCALVOC上跑出来的结果。
  
  讲得快,但逻辑清晰,每一步推进都有据可查。
  
  讲到第七页,他把那张对比折线图放到了最大。
  
  “……在相同的测试集上,我们的方法在mAP指标上比当前最优的DPM模型高出了11.3个百分点。这个差距,我认为不是调参层面的改进,而是底层特征提取范式的本质性跃迁。”
  
  

(本章未完,请点击下一页继续阅读)
『加入书签,方便阅读』
热门推荐
极品全能学生 凌天战尊 御用兵王 帝霸 开局奖励一亿条命 大融合系统 冷情帝少,轻轻亲 妖龙古帝 宠妃难为:皇上,娘娘今晚不侍寝 仙王的日常生活