475 目标世界第一。
475 目标世界第一。 (第2/2页)第一个电话打给赵宇。千问AI的资深算法工程师,陈凯在千问时期带出来的徒弟,国内少数几个真正懂MOE架构的人。电话响了三声就接了。
“赵宇,我是陈凯。”
“老师?您真的去苏总那边了?”赵宇的声音压得很低,像是在办公室偷偷接电话。
“来了。现在我这边缺人,你来不来?薪资翻倍。你负责盘古的算法架构。”
电话那头沉默了两秒。赵宇咬了咬牙:“老师,我跟你干。什么时候报到?”
“明天。”
挂了电话,陈凯在名单上划掉了赵宇的名字,写下“算法组负责人”。第二个电话打给林晓,百川的推理引擎专家。他在稀疏注意力方面的研究业内公认一流,但百川给他的资源不够,他的技术方案一直被搁置。陈凯知道,林晓等这个机会等了很久。
“林晓,我是陈凯。盘古需要你来做推理加速。条件你开。”
林晓没有犹豫:“陈老师,我今晚就把简历发给你。”
第三个电话打给陈默,智谱的训练框架负责人。他是分布式训练领域的老将,曾经在智谱主导过千卡集群的训练框架搭建。陈凯和他有过几次技术交流,互相欣赏。
“陈默,苏总这边要搭万卡集群,你来带训练框架组。”
“万卡?”陈默的声音明显提高了,“苏总真舍得?”
“真舍得。你来不来?”
“来。”
一个下午,陈凯打了二十多个电话。名单上的人,有的当场答应,有的说需要考虑,有的委婉拒绝。他不在乎。答应的人,他记下来;需要考虑的,他给三天时间;拒绝的,他划掉,换上备选。
很快,陈凯带着赵宇、林晓、陈默三个人,坐在幻神AI的会议室里。四个人,一台投影仪,一杯咖啡。陈凯站在白板前,画了一张架构图——底层是算力集群,中间是训练框架,上层是模型架构,旁边是数据pipeline和评测体系。
“盘古的目标,十二个月内上线。第一版模型,一万亿参数,一百万上下文,多模态。”他没有回头看,笔在白板上刷刷地写,“算力方面,苏总已经批了预算,第一期采购一万张H800。训练框架,陈默你负责。算法架构,赵宇你负责。推理引擎,林晓你负责。数据团队,我亲自带。”
赵宇举手问了一个问题:“老师,一万张H800,国内能调动的算力不超过五万张。苏总一次性拿一万张,其他厂商会不会有意见?”
陈凯转过身,看了他一眼,语气平淡:“这不是我们需要考虑的问题。苏总会搞定。”
会议室里安静了一秒。然后陈默笑了:“也是。”
消息传得比他们预想的快。
科技媒体就开始报道:“幻神AI组建盘古大模型团队,陈凯出任技术负责人,已从千问、百川、智谱等公司挖走核心算法和工程人才。”紧接着,又有媒体跟进:“据知情人士透露,幻神AI已采购一万张H800GPU,用于盘古大模型的训练,总投入超过二十亿元。”
热搜上,一个新词条冲了上来——“盘古大模型”。抖音上,科技博主们开始分析盘古的技术架构和商业前景。知乎上,问题“如何评价幻神AI的盘古大模型”浏览量突破百万。有人说苏阳是在烧钱,有人说陈凯是被高估了,有人说华夏AI终于有了真正的挑战者。但不管怎么说,所有人都在讨论盘古。