猜你喜欢
我看见了风暴:人工智能基建革命

我看见了风暴:人工智能基建革命

书籍作者:谭婧 ISBN:9787121454387
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:8952
创建日期:2024-04-04 发布日期:2024-04-04
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

在这六年里,我跟踪过许多微妙线索,与超过千余位AI从业者进行了谈话,见证了一段AI的发展,看见了技术风暴。正是AI算力、框架、平台、算法模型的合力创造了AI大模型的成功。在扎实的基建之上,ChatGPT这个“庞然大物”得以横空出世。
本书讲述了微软、阿里、京东、华为、百度等科技巨头,以及科创企业AI技术演进的故事,每个故事都有自己的声音,每个故事都有自己的主角。那些推动技术的人,他们身负伟大任务的托付。他们发出光,我们被照亮。

作者简介

谭婧,科技和科普题材作者,“亲爱的数据”公众号创始人。香港浸会大学硕士,曾负责中国节能集团控股企业战略管理,多年管理咨询经验,曾加入AI人脸识别创业公司创始团队。观察者网特约作者,虎嗅认证作者,36kr特邀作者。

编辑推荐

本书讲述了微软、京东、华为、百度等科技巨头,以及科创企业AI技术演进的故事,每个故事都有自己的声音,每个故事都有自己的主角。那些推动技术的人,他们身负伟大任务的托付。他们发出光,我们被照亮。

回顾技术演进史,看到更远的未来。


前言

我和AI大模型的缘分,要从2021年元宵节发布的一篇1.4万字的稿子谈起。

《搞深度学习框架的那帮人,不是疯子,就是骗子》这篇稿子发布后,遭遇了冰火两重天,号称见不多识不广的谭老师我,直接傻眼了。

一方面文章在AI、计算机领域百余位专家的朋友圈疯传,我的微信那几天是爆炸状态。

有很多认识的人,疯狂地给我发截图。告诉我这篇文章如何在他们的朋友圈疯传。

一时间,我变成了一个朋友圈截图收集器,哇,好开心。

我看到很多知名人士的转发记录,以及知名人士的群聊记录。

虽未结识,但久仰大名矣。

随后不久,一位叫谢育涛的专家致电我,他告诉我,沈向洋老师想让他代为转达,问我愿不愿意加入IDEA,主要工作是写稿。

IDEA 研究院就是鼎鼎大名的粤港澳大湾区数字经济研究院。谭老师实在水平有限。

虽然这篇文章登上了知乎的周热点,但是评论区翻车了。好一片挖苦讽刺谩骂嘲讽之声。我当时心想,一个人一定是干了什么丧尽天良的事,才配获此“殊荣”。甚至有人说,你不配写科技,你一个女的为什么不去写情感专栏。哇,这真是一个好建议,我怎么没有想到。

言归正传,难能可贵的专家的“批量”转发与部分知乎网友的“尖酸”评价,冰火之别说明了什么?

很有可能说明“吃瓜“群众对于AI系统的认知和真正的专家相比,其分裂程度可能比东非大裂谷还大。

话说回来,世界顶级大型计算机系统令顶尖架构师和开发者头疼,难道写这玩意儿的故事的人就不头疼了吗?做难事必有所得,头疼显然是值得的。因为这篇文章,很多知名专家来加微信,和我聊天。一些之前四年写稿攒下的专家资源也愿意把我推荐给“顶尖专家”。求之不得,感激不尽。一个月后,也就是2021年3 月,我在杭州阿里巴巴,见到了一位叫杨红霞的顶级AI专家。

看见名字里的“红”字不要怀疑,没错,女科学家。那是一个春光明媚的晴天,湖蓝色玻璃映衬着阿里巴巴特有的橙色装饰,像跳动的钢琴键。远远望见超大的“淘公仔”站在建筑物外墙上咧着嘴笑。杨红霞博士朝我招手,我顺着半圆形的斜坡步行而上,也向她挥手回应。春草茵茵,行李箱轱辘哗哗作响。那次,我们聊的是一款叫作M6 的AI大模型。那天,我们也畅谈了当时最火的AI大模型GPT-3。GPT-3 在2020年6 月10 日发布,给中国玩家的触动很大。

更直白些,中国AI科学家有压力。

阿里巴巴的会议室多得像森林里的树木,终于坐下,一张桌子,两杯咖啡。杨红霞博士扎着利落的马尾,额前干净,没有刘海,少量碎发。她说起话来,爽爽快快,普通话极为流利标准。她告诉我:“我实话跟你说,为什么会回国?”她的答案真好,连标点符号里都流露出温柔的真诚与强烈的技术愿景,她说:“我最喜欢的技术是从复杂的业务里抽象出来,用技术去解决实际问题。我不喜欢走反过来的路,假如走反过来的路,我可以选择去研究型的高校。所有人都要有一些耐心,没有耐心,永远只有单点的结果,很难去实现线和面。”

当天的独家专访的主要内容有以下几点。第一,如今的深度学习模型已经不能满足我们的更多要求了。说白了,可能这个算法模型刚出现的时候只能满足一些特别低的要求,慢慢地,我们会越来越接近通用AI,要求的高度肯定越来越高。第二,阿里巴巴希望在一些很重要的核心方向上,尤其是在支撑AI的下一个阶段的技术和产品上,可以做到世界领先。第三,其他技术细节。可以看出,阿里巴巴很早就认得清下一代AI的价值,他们也很早出发了。谈话的最后,杨红霞博士请我品尝了阿里巴巴食堂的鸭血粉丝汤,挺好吃的。

夜幕降临淘宝城,我明白了中国的AI科学家们在思考:在下一代AI的浪潮当中,中国到底哪些技术可以作为世界第一?在与杨红霞博士面谈之后,我又和几位技术大佬聊过。贾扬清(原阿里巴巴技术副总裁),林伟(原微软硅谷研究院研究员,阿里云机器学习PAI平台负责人),曹政(原阿里云基础设施事业群资深技术专家),他们分别代表不同的三层:框架、平台和云基础设施。再算上杨红霞的模型算法团队。一个AI大模型汇集了如此多的大佬。可以看出,对于AI大模型,阿里投入的是整建制的团队,调动的不只是达摩院的力量。所以,才会有M6 大模型的问世。这基本上是制造大模型的标准打法,多个团队“共建”一个模型。

我前后与多位AI顶级从业者长达几十小时的促膝长聊之后,清楚地理解,想做出AI大模型(那时候还没有ChatGPT),仅靠一支算法团队远远不够。大模型团队是由几支分别擅长不同领域(AI算力、AI框架和AI平台)的技术团队合力而成。因为一些外力,我和杨红霞博士的故事就在这里戛然而止了,那次采访没有出稿。2023年春节前后,我得知杨红霞博士已经去了今日头条。此后,所有人问起我关于她离职的消息,我都三缄其口。

我们聊回ChatGPT 这类AI大模型。这么重要的特大工程,底层能不重要吗?需要解释一下,在互联网大厂,底层是共用的。阿里巴巴如此,华为、腾讯、百度,皆如此。底层软件的重要性无须多言,这里面有很多“置之死地,方可后生”的故事。我很激动地见证了AI软件的故事“讲述”到今天,也期待中国软件能够走在“长期主义”的大道上。

回到ChatGTP,AI算力、AI框架、AI平台、AI算法模型合力创造了AI大模型的成功。

某AI大佬曾谈到:“观察硬件和算力平台,如果没有某国的捣乱,整体而言,我们的硬件计算能力、计算量,以及就是说我们的一些底层的核心技术,比如说像高性能网络、高性能存储、异构计算,等等。在国际上,大家的能力拉平,大同小异,更多是在强调怎样用好这些资源。”在基建扎实的基础上,ChatGPT 这个“庞然大物”横空出世。AI新基建的范畴在变大。一开始,GPT 系列大模型不是基建。2023年,GPT-4 大模型已经是新基建的一部分了。在ChatGPT 引领的这一产品架构下,应用和底层大模型的联动十分紧密。

也就是说,大模型也是基建。

今天看来,AI大模型可以被看作是电,我们要有自己的发电厂。

接下来,无论是大玩意儿,还是小玩意儿,我们把大模型的应用玩起来,耍起来,发展起来。某种意义上,AI大模型的奇点已过,通用AI的火花闪烁。国内有多个团队争夺大模型的高地。万一追不上怎么办?那很有可能,一家独大,大家全挂。换句话说,假如美国OpenAI公司和微软公司赢家通吃,这里的赢家只有一家(一对),那会发生什么样的事情?这样的话,可能很大一堆产业只能最多成为依附在巨头API 上的服务商。这可太糟了。好消息是,先进技术领先的时间窗口非常短暂。坏消息是,“赢家”的布局超级迅猛。

这也反映出他们自知领先时间并不是那么多,也有很强的危机感。

中国AI大模型创业者们在焦虑中临机制变。昔日我笔下的“骗子”已不知去向,而“疯子”在太阳升起的地方,沐浴着金色而悠远的晨光,再次出发,留给地平线崭新的背影。

在这六年里,我跟踪过许多微妙线索,与超过千余位从业者进行了谈话,有些人只和我简单说了两句;有些人则让谈话进行了数年。

有机会见证历史一刻,可真激动。衷心感谢大家拨冗与我交流。

“保持联系。”我在微信对话框里写道。

科技专栏作者,谭婧


目录

第1章 搞AI框架的那群人(一):AI框架简史

第2章 搞AI框架的那群人(二):燎原火,贾扬清

第3章 搞AI框架的那群人(三):狂热的AlphaFold和沉默的中国科学家

第4章 搞AI框架的那群人(四):AI框架前传,大数据系统往事

第5章 搞AI框架的那群人(五):老师木解读GPT大模型

第6章 那些站在微软云起点的中国创业者

第7章 京东零售:北极星永远指北

第8章 揭开本质:中国智能供应链走到了哪一步

第9章 DPU的风暴与咏叹调

第10章 超级计算机与人工智能:大国超算,无人领航

附录A 漫画科普ChatGPT,绝不欺负文科生

附录B ChatGPT大火,如何成立一家AIGC公司,然后搞钱

附录C 数据治理,是不是一道送命题

附录D AI人才,需要花多少成本栽培


产品特色