首页 > 都市言情 > 都大学了,小学系统才来?

都大学了,小学系统才来? 第182节

  时间转眼来到了周一。

  下午两点,演海公司的会客区。

  陈林坐在沙发上,对面,是一个看起来二十五六岁、身材消瘦、戴着一副黑框眼镜的年轻男人。

  他就是白迁,国家科学院自动化所的博士后。

  此刻的白迁,穿着一身略显宽松的格子衬衫,牛仔裤,脚上是一双看起来已经穿了好几年的运动鞋。

  整个人的气质,完美符合陈林对于“宅系学霸“的所有刻板印象。

  见面的时候,白迁显得有些沉默寡言。

  陈林主动伸出手,笑着说:“白博士,你好,我是陈林。“

  白迁愣了一下,连忙也伸出手,和陈林握了握,声音有些小:“你好,陈总。“

  握手的时候,陈林明显感觉到,白迁的手心有些湿润,显然是紧张出汗了。

  陈林笑了笑,招呼白迁在沙发上坐下。

  云清端着两杯茶走了过来,笑盈盈地将其中一杯递给白迁:“白博士,请喝茶。“

  白迁接过茶杯的瞬间,脸颊微微泛红,声音更小了:“谢谢。“

  云清见状忍不住轻笑,转身离开了会客区。

  陈林也没有在意这些细节。

  他开门见山地说道:“白博士,咱们就不绕弯子了,直接聊正事吧。“

  “项老那边,应该已经把我这边的情况,大致跟你说过了吧?“

  白迁点了点头,推了推眼镜:“嗯,项老的助手跟我说了。您这边是打算自己开发一个全新的AI大模型,对吧?“

  “没错。“陈林点头,“而且,不是简单地在现有的开源模型基础上做微调,而是要从零开始,训练一个全新的模型。“

  “目标,是要在内容生成质量、逻辑推理能力、以及幻觉率控制这几个方面,全面超越目前市面上所有的主流大模型。“

  陈林说到这里,顿了顿,又补充道:

  “当然,我知道这个目标听起来很夸张,也很困难。但我相信,只要方向对了,资金和人才到位了,就一定能做出来。“

  白迁听完,脸上的表情,从最初的拘谨,渐渐变得认真起来。

  他沉吟了片刻,缓缓开口道:

  “陈总,我能问一下,您对于模型的架构,有什么具体的想法吗?“

  “比如说,是打算用Transformer,还是用MoE(混合专家模型),还是说有别的思路?“

  陈林听到这个问题,坦然地摇了摇头。

  “说实话,白博士,我对计算机、编程、人工智能这些领域,都还只是比较入门的水平。“

  “我唯一的擅长的就是数学。“

  “所以,关于模型架构的选择,我希望能听听你的专业意见。“

  白迁闻言,眼睛立刻亮了起来。

  那双原本还显得有些躲闪的眼睛,此刻仿佛有光芒在闪烁。

  他整个人的气质,也瞬间发生了变化。

  “陈总,既然您问到了这个问题,那我就直说了。“

  白迁推了推眼镜,语速明显加快了几分。

  “我个人认为,当前大模型的两种主流架构,Transformer和MoE,都还远远没有达到最优。“

  “Transformer虽然在并行计算和长距离依赖捕捉上有优势,但它的参数利用效率其实是很低的。“

  “而MoE虽然通过引入多个专家模块,提升了模型的容量,但它的训练难度和推理成本,都非常高。“

  “更重要的是,“白迁的语气变得愈发激动,“现在业界普遍采用的'预训练+微调'这种训练基础范式,我觉得也有很大的改进空间。“

  “预训练阶段,模型是在海量的无标注数据上进行自监督学习,学到的是一种通用的语言表示能力。“

  “微调阶段,则是在特定任务的有标注数据上进行监督学习,让模型适应具体的应用场景。“

  “但是,“白迁说到这里,忽然停顿了一下,目光灼灼地看着陈林,“这种范式,有一个很大的问题——“

  “它假设了预训练阶段学到的知识,是可以无缝迁移到微调阶段的。“

  “但实际上,很多时候,预训练和微调之间,是存在gap的。“

  “这就导致了,哪怕你在预训练阶段投入了天文数字的算力和数据,模型在某些特定任务上的表现,依旧不尽如人意。“

  陈林听到这里,虽然很多专业术语他并不完全理解,但他能听出来,白迁对这个领域,有着非常深刻的思考。

  他微微点头,示意白迁继续说下去。

  白迁见陈林没有打断自己,反而露出了认真聆听的表情,整个人更加兴奋了。

  他的语速越来越快,手舞足蹈地说道:

  “所以,我这几年一直在思考一个问题——“

  “有没有可能,设计出一种全新的模型架构,以及一种全新的训练范式,能够从根本上解决这些问题?“

  “我做了一些初步的研究,也有了一些成果。“

  “但是,“白迁的语气忽然变得有些无奈,“在自动化所,我的研究方向,并不是主流。“

  “所里的资源,大部分都投给了那些跟着业界主流路线走的项目。“

  “我想要的算力,想要的数据,都拿不到。“

  “所以,我的很多想法,都只能停留在理论阶段,没办法真正验证。“

  白迁说到这里,忽然抬起头,那双眼睛里,闪烁着一种近乎狂热的光芒。

  “但是,陈总,当我看到您在数学大会上的那场演算之后......“

  “我忽然觉得,我在您这里,有机会实现我的愿望。“

  “找到一种更好的大模型架构!“

  陈林听到这番话,心中微微一动。

  他能感受到,白迁对于人工智能这个领域,有着一种近乎偏执的热爱。

  这种人,往往是最有潜力做出突破性成果的。

  陈林沉吟了片刻,缓缓开口道:

  “白博士,你给我简单讲一下你刚才说的,你自己的研究成果吗?“

  白迁闻言,立刻点了点头,眼睛里的光芒更亮了。

  “当然可以!“

  他从随身的背包里,掏出一个平板电脑,飞快地点开了一个文件夹。

  “陈总,您看......“

  接下来的半个小时,白迁滔滔不绝地向陈林介绍着自己的研究成果。

  什么动态稀疏激活机制、什么分层知识蒸馏、什么多模态对齐预训练......

  一大堆专业术语,从白迁嘴里蹦出来,听得陈林是一愣一愣的。

  虽然陈林很多细节都听不懂,但他能感觉到,白迁说的这些东西,非常有深度。

  于是,陈林全程都保持着认真聆听的姿态,时不时还用赞许的眼神看着白迁,频频点头,给他提供情绪价值。

  终于,白迁讲完了。

  他似乎是意识到自己说得有点多,有些不好意思地挠了挠头。

  “抱歉,陈总,我一说起这个,就有点收不住......“

第一百九十三章 互补

  “没关系。“陈林笑着摆了摆手,“能看出来,你对这个领域非常有热情。“

  “这是好事。“

  他顿了顿,接着说道:

  “白博士,我这边的想法是这样的。“

  “如果你愿意来演海工作的话,我会给你提供足够的资源和自由度,让你去实现你的那些想法。“

  “算力、数据、人员配备,这些都不是问题。“

  “我唯一的要求,就是你能尽你所能,帮我把这个项目做成。“

  白迁听到这番话,整个人都愣住了。

  他瞪大了眼睛,不可置信地看着陈林。

  “陈总,您......您是认真的吗?“

  “当然。“陈林点了点头,“我从来不开玩笑。“

  白迁的喉结上下滚动了一下,声音有些颤抖:

  “那待遇方面......“

  “月薪税后八万。“陈林直接报出了一个数字,“另外,如果项目做成了,会有额外的项目奖金。“

  白迁听到这个数字,整个人都呆住了。

  月薪税后八万!

  这比他在自动化所的收入高太多了!

  他深吸了一口气,努力让自己平静下来。

  “陈总,能给我时间考虑一下吗?“

  陈林笑了笑:“当然,这么重要的决定,你肯定需要时间考虑。“

  “不过,“他顿了顿,“我希望你能尽快给我答复。因为我这边的项目,已经在筹备阶段了,越早启动越好。“

  白迁用力地点了点头:“我明白!我会尽快给您答复的!“

首节 上一节 182/463下一节 尾节 目录

上一篇:我在华娱当导演,宠坏天仙白月光

下一篇:返回列表

推荐阅读