我的学习群里全是真大佬 第255节
好几个人察觉到门口的动静,转过头来,看见高稳和李总走进来,都笑著点了点。
甚至还有好几个李东不认识的人朝他打了个招呼。
高稳在李东背上轻轻一拍,朝厅里一个相对安静的角落抬了抬下巴。
“先去那边坐会儿。”
三人走过去。
刚一坐下,
李总就从旁边的小几上拿起一杯柠檬水递给李东,笑眯眯地开口。
“李东,今天就当朋友聊。”
“你那个降维算法1.0版本一公开,我们底下深度学习实验室的人就跑去测了。”
“测完之后专门给我打了个电话。”
李总顿了顿,抿了一口水。
“算法是真的很优秀……”
李东喝了一口柠檬水。
“李总您过奖了。”
李总笑得很温和。
“过奖个啥呀。”
“我们公司光是把你那个算法的思路套在分布式训练的通信层上,单卡有效算力直接抬高了一截。”
“你知道这意味著什么吗?”
李东其实大概知道。
但他还是配合地摇了摇头。
李总哈哈的笑道。
“省钱。”
“上亿的省。”
“所以今天我也就不绕弯子了。”
“北行那边,你随时可以来。”
“AI研究院那边,岗位、方向、团队你自己挑,年薪你自己开。”
“别管什么市价,你开多少,我就批多少。”
旁边的高稳端著茶杯,就像没听见一样。
李东心里又开始默默地吐槽。
你们这帮老总怎么回事?
动不动就是拿钱考验干部呀?
你就不怕我开个一百亿吗?
不过吐槽归吐槽,李东脸上的表情还是端得很稳的。
“李总,您是真看得起我。”
“但是说实话,我现在还是想以学业为重。”
“我对纯粹一点的学术更感兴趣,至于把学术成果落地、做产品、做应用这些……我心里清楚,我不是那块料。”
李总脸上的笑容没变。
但眼睛还是有一丝失落闪过。
他在商场上摸爬滚打了二十多年,李东话里的意思,他当然懂。
这小子,是真不爱钱。
华轩:???
或者说……
这小子心里装的东西,比钱大得多。
李总沉默了大概两秒钟。
然后摆了摆手,笑著说道。
“行,不勉强你。”
“我就是惜才。”
“以后你要是改主意了,随时给我打电话。”
高稳这个时候才慢悠悠地插了一句。
“行了李总,你也别老盯著我们家这棵苗子。”
“田钢院士那边可看著呢,你再这么挖下去,老田明天就得给我打电话。”
李总立马“哎哟”一声,做出一个夸张的告饶手势。
“不敢不敢,田院士的人,我哪敢动。”
三个人相视一笑。
桌上的气氛一下子就缓和下来了。
……
六点半的时候,晚宴正式开始了。
服务员推著餐车从门口的侧门进来。
宴会厅一共就两桌,李东、高稳、李总坐在主桌。
旁边几个也是比较有分量的人。
包括里云那位副总裁,还有一个看起来像是某家做芯片的初创公司CEO的男人,也都坐在主桌上。
服务员退出去之后,话题自然而然就从最近的天气、最近的政策,慢慢地飘到了“那玩意儿”上面。
“那玩意儿”
这是在场所有人对“GPT-3.5”心照不宣的称呼。
最先开口的是里云AI那位副总裁,姓邱,叫邱明丽。
她端著酒杯,慢悠悠地说道。
“上个礼拜我们组里专门搞了一个内部测试。”
“中文常识题、英文阅读理解、代码生成、数学推理、长文本总结,五个方向,各出了二十道题。”
她叹了口气。
“五个方向,它都赢了。”
桌上一片沉默。
李总放下了筷子,眉头皱著。
“赢得多吗?”
邱明丽自嘲的笑了一声。
“我就不说具体分数了,但差距……不小。”
“尤其是那种需要多步推理的题,我们这边的模型基本上做到第三步就开始胡言乱语了。”
“它还能稳稳地往下推。”
“你把一道国内高考压轴题扔给它,它就算做错,它做错的路子也是对的。”
“它是在认真地算错,不是那种一看就知道在瞎编的错。”
“这个东西,是我们目前的模型最缺的。”
那个戴眼镜的男人放下了刀叉,慢慢地开口。
“邱总,我其实一直有个问题想请教。”
“GPT-3到GPT-3.5中间这一跳,到底关键是跳在哪儿的?”
“外面现在一提就是RLHF,好像那一套人类反馈就是所有答案。”
“但我总觉得没那么简单。”
邱明丽笑了一下。
“你这个问题,问到点子上了。”
“RLHF这几个字,最近被炒得有点太凶了。”
他用筷子头在桌布上虚划了一下。
“GPT-3到GPT-3.5,真正那一跳,不是RLHF。”
“是代码。”
桌上有人愣了一下。
“代码?”
邱明丽点头。
“OpenAI中间悄悄干了一件事。”
“他们在GPT-3的底座上,又灌了一轮超大规模的代码预训练,内部叫-davinci-002。”
“GitHub上能扒的高质量代码,加上一部分自然语言和代码混在一起的数据,一锅炖进去。”
“灌完这一轮出来,模型的推理能力莫名其妙地就起来了。”
“不光是会写代码了,你让它做数学题、让它做多步逻辑推理、让它分析一段很长的论证,它突然就会想了。”
“业内现在把这个叫做代码带出来的思维链。”
上一篇:我家艺人太没上进心了
下一篇:返回列表
