第29章 Accept
第29章 Accept (第1/2页)沈瑞在一旁连连点头。
周昀这已经是把饭塞到了自己嘴里,不像老师只会说:
这个方向论文很多的,你自己去找一下。
难道没有别的方法了?肯定有的,你再找找。
你不能老是等着我来帮你,我帮你做完了,你做什么?
说的全是废话,没有一点实质性的帮助,不过他也怪不了老师,毕竟没有哪个老师会像周昀这样细致。
“太谢谢你了,这样,这周你什么时候有时间,我请你吃饭。”
“如果有问题随时找我。”
“应该不会了,你都这样教我了,再不会弄,那就是真的蠢了。”
对周昀来说这是小问题,对他来说那就是救命稻草!
说完后,沈瑞抱着电脑回到自己位置上。
周昀摇了摇头,开始看起了论文。
两周的时间,他已经把大模型领域的相关技术看的都差不多了。
今天是他安排的最后十几篇论文,看完这些他就要着手准备设计模型架构。
模型的基础架构他已经有了,就是之前那个时序预测模型的架构,周昀给它起了一个自认为好听的名字——OracleNet,中文译为天机网络。
他希望OracleNet之后能够做到真正的算无遗策!
相比于其它的时序预测模型,OracleNet最大的不同就是,它能够在利用较低算力资源的情况下,接收各种不同形态的信息,最后将这些信息进行统一编码。
当然,之前周昀只用到了一些时序数据的信息,最多就是加上一些文本数据,对这个模型的开发甚至都不足四分之一,这也是为什么他认为,这个模型还远远没有达到它的极限。
如果把OracleNet看成一个积木,那么他接下来要做的就是思考,如何搭这些积木,能够最大限度利用算力资源并且能够达到非常高的准确率。
就像是一款叫做《我的世界》的游戏一样,总有些人能用一堆方块搭出一些非常逆天的东西。
不过两者之间还是有一些差别的,整体模型架构的设计需要解决的问题有很多,比如:不同时间段的数据该怎么让模型捕捉到?不同模态的信息该怎么让模型相互结合?......
还有多模态大模型最典型的灾难性遗忘,数据过拟合问题等等,这都需要他在设计模型架构的时候想好解决方案。
这么多的问题现在都要靠他一个人来解决,不过这也是没办法的事情,他现在手底下没人,就算有人那也就是几个同门师兄。
周昀并没有看不起他们的意思,实话实说,每个人都有自己擅长的领域,至少在科研领域上,他确实没发现几个师兄有什么过人的天赋,
工程性质的工作他们做做还可以,但是涉及到科研,他们真的帮不上什么忙。
不过这也能看得出来周昀现在的天赋属实是已经拉满了,这么高强度的科研工作,每天还能有时间健身休息,也并不觉得有多累。
“周昀,出来一下。”邓永华的声音打断了正在看论文的周昀。
“来了。”
门口的座位上,邓永华招了招手:“坐。”
(本章未完,请点击下一页继续阅读)