英伟达又一次发布了一份超预期的财报,全年营收达到609亿美元,同比增长126%,股价大涨后公司的市值也首次站上了2万亿美元。从1万亿到2万亿,微软和苹果都用了两年左右的时间,而英伟达只用了9个月,它们也是目前仅有的3家市值超过2万亿美元的公司——沙特阿美石油公司曾经短暂站在这个队伍中。
这其中,微软和英伟达的爆发都与生成式AI紧密相关。前者是OpenAI的最大投资人与战略伙伴,通过将OpenAI的各种模型嵌入到旗下的产品线,成为目前生成式AI商业化上走得最快的公司;后者几乎垄断了构建生成式AI所需要的高性能芯片,并且随着OpenAI最新视频模型Sora的推出,技术公司们对于算力的需求将再上一个台阶。此时,回想不久前OpenAI CEO Sam Altman那高达7万亿美元的芯片资本预算,似乎就不再像是天方夜谭。
就在本周,芯片领域曾经的龙头老大英特尔举办首届晶圆代工服务大会(IFS Direct Connect),这是其代工业务独立后召开的首个重要会议。既然芯片设计上打不过英伟达,那就在芯片代工上另辟蹊径。在会上英特尔宣布了将为微软代工生产其自研的AI芯片,据传订单总价高达150亿美元。这场「英特尔—微软」的合作可以看作在AI芯片上针对替代「台积电—英伟达」模式的一种尝试,英特尔更是在大会上宣称要在2030年成为全世界第二大晶圆代工公司,目前坐在这一个位置上的公司是三星电子。
抢AI芯片生意的还有孙正义和软银。有报道称孙正在筹资1000亿美元以建立一家新的芯片公司,他希望此公司可以与Arm公司形成战略互补,共同挑战英伟达。此外,AI芯片创业公司Groq也在本周发布了基于自研芯片LPU的测试模型,其推理速度比常见的模型快10倍左右,而那些模型基本都是由英伟达的GPU支持的,Groq希望借此证明LPU比英伟达的GPU更适合推理任务。
2月21日,英伟达发布2024财年第四季度(截至2024年1月28日)和全年财报。第四季度营收创纪录地达到221亿美元,同比增长265%;第四季度纯利润是123亿美元,同比增长769%,两项数字均远超分析师的预期。英伟达全年营收也创下历史上最新的记录,达到609亿美元,同比增长126%;年度纯利润是298亿美元,同比暴增581%。财报发布后,英伟达的股价暴涨16.4%,也就是2733亿美元,大约是一个茅台。截至当地时间2月22日收盘,英伟达市值逼近2万亿美元,为微软、苹果之后第三高。
在财报电话会议上,英伟达CFO Colette Kress称,「我们估计,过去一年数据中心大约40%的收入来自AI推理」。CEO黄仁勋紧接着表示,由于在线推荐系统也使用了深度学习和生成式AI接口,40%这一数字还「可能被低估了」。随着慢慢的变多的生成式AI被投入到生产环节中,AI推理带来的算力需求只会慢慢的大。而最近OpenAI推出的Sora视频模型更是让潜在的需求上了一个台阶,解析和生成图片对于算力的需要明显要比文本高一个量级。有分析称,Sora生成一段60秒视频的成本介于十几至数十美元之间。而这些需求最终都会转换成对于英伟达GPU的需求。
2月21日,英特尔宣布将推出面向人工智能的系统级代工——英特尔代工(Intel Foundry),声称要成为全世界第二大代工厂。
英特尔作为美国本土少数具有晶圆厂、兼具设计和代工能力的垂直整合制造模式(Integrated Device Manufacture,IDM)芯片厂商,因在10纳米芯片制程工艺上面临难以突破的技术困境,此前被台积电、三星赶超。2020年7月,英特尔宣布其采用7纳米工艺的CPU将推迟半年发布,而彼时台积电和三星已能实现5纳米芯片的量产订单。为此,CEO基辛格在上任之后推出了IDM 2.0战略,其中关键一环就是加强对先进制程工艺的推进,并重启晶圆代工业务,希望凭借先进制程工艺与台积电、三星在晶圆代工市场展开竞争。
从目前的进展来看,英特尔正朝着目标稳步推进。据报道,英特尔计划在美国、以色列、爱尔兰等地投建与改造晶圆厂,投资额已超越250亿美元。不仅如此,借助美国和欧盟的芯片法案,英特尔有可能从美国政府获得超过100亿美元的补贴、从欧盟获得总计68亿欧元用以在欧洲建设晶圆厂。从技术角度来看,Intel 3的芯片制程工艺拉近了与台积电、三星的3纳米芯片的技术差距,但是后续的Intel 20A和18A芯片制程节点都将有望抢先在2025年台积电和三星的2纳米量产之前推出,从而帮助英特尔实现「成为全世界第二大代工厂」的目标。
微软表示,微软将计划采用Intel 18A制程节点生产其设计的一款芯片。微软和英特尔的代工订单将达到150亿美元,远超投资者此前预期的100亿美元。微软并没有公布这款芯片的功能和用途,不过2023年微软曾宣布将推出两款分别为计算机处理器和AI加速器自研芯片。除此之外,英特尔还透露正在接触更多客户,已经有4个大型客户签约,将使用其18A制造技术。
据报道,软银集团创始人孙正义正在寻求筹集1000亿美元的资金来成立一家芯片合资企业,该企业将与Arm形成互补并共同与英伟达展开竞争。该项目的代号为Izanagi伊邪那岐,这一个名字来自日本的创世神。
据知情的人偷偷表示,软银将考虑出资300亿美元,另外700亿美元可能来自中东的机构。如果该项目成立,将成为自ChatGPT问世后AI领域最大的一笔投资,但目前该项目将如何获得资金、资金将用于何处等细节尚未确定。目前,软银和 Arm并没有对此作出回应。
Groq于2016年在加利福利亚成立,是一家AI芯片初创企业,主要提供低延迟的AI推理解决方案。Groq称自己的愿景是构建生成式AI推理速度的标准,以实现生活中的即时AI应用。创始团队中有多人曾参与Google TPU处理器的开发,其中创始人兼CEO Jonathan Ross更是参与设计并制作出了第一代Google TPU芯片的核心元件,完成了其中20%的研发工作。
在融资方面,Groq目前已完成了3轮融资,共计融资总额达3.67亿美元。Groq于2021年4月完成了最新C轮融资,共筹集资金3亿美元,由老虎环球基金和D1 Capital领投。
不同于业内AI公司都在用英伟达GPU做大模型的训练和推理,Groq在最新的公开测试中使用了自研芯片LPU做大模型的推理工作,所以这其实是一次对LPU芯片性能的公开演习。(训练与推理:训练指的是一个初始神经网络通过一直在优化自身参数,来让自己会变得准确;推理指的是利用成熟的神经网络基于给定的数据去预测结果)
在Groq的宣传中,LPU包含数百个核心的并行处理器,专门为AI推理而设计。与英伟达GPU的工作原理不同,LPU采用了时序指令集计算机(Temporal Instruction Set Computer)架构,在提高效率的前提下能消耗更少的能源,而这两点恰恰都是目前采用GPU做大模型推理时会遇到的问题。
为了实现高效低能耗,LPU不依赖于高速数据传输,而是将数据存储在更快但体积更小的SRAM存储器中,而GPU需要频繁从内存中加载数据,工作速度主要由HBM的读取速度决定。这就使得LPU的速度比GPU使用的高带宽存储器(HBM)快约20倍。从试用结果来看,模型采用LPU的推理速度接近500 token/s,远超于采用GPU时的推理速度(GPT-4的推理速度为40 token/s)。
过去最近一段时间,OpenAI依旧是全球最活跃的AI公司。其最重磅的消息自然是它发布的文生视频模型Sora,该模型不仅将生成视频的长度从业内常见的5到10秒一下子提升到1分钟,而且还表现出模拟现实世界物体运动、碰撞、光影的能力。Sora再次震惊了整个AI圈,它之于视频模型领域的意义丝毫不亚于ChatGPT之于文本模型领域的意义。
不过,除了Sora,围绕OpenAI还有不少关于未来规划的消息,它们展露出的OpenAI的野心令人心惊。
一方面,有消息称OpenAI准备推出智能体(Agent)和AI搜索工具,前者的代表产品是AutoGPT,后者的代表产品是Perplexity,它们是目前聊天机器人应用最广泛的两个场景,而OpenAI的加入必然会引发市场格局变化。届时,OpenAI将完成对生成式AI主流模型和产品的全方位覆盖,包括文本模型GPT、文生图模型DALL·E、文生视频模型Sora、聊天机器人ChatGPT、智能体、AI搜索工具等等。
另一方面,OpenAI还在向产业链上游进发。CEO Sam Altman近期透露了一个高达7万亿美元(几乎是英国GDP的两倍)的芯片产业重构计划,他认为AI将成为未来一切产业的基础设施,这个基础设施需要巨大的算力,也就是芯片的支撑,OpenAI自然将成为这个计划的中心。当然,Altman这一计划由来已久,自去年10月开始就不断有OpenAI准备投资芯片的消息传出,Altman本人也同包括G42、软银、英特尔、台积电和三星电子等公司谈判过合作。
有不少观点认为这个7万亿美元的计划有些异想天开,Altman不过是在为OpenAI下一步的融资画饼,但随着OpenAI的业务不断横向扩张,未来它借此向上游整合并非没有可能,毕竟生成式AI天然就有赢者通吃的属性。
本周,Google又发布了两个开源模型Gemma 2B和Gemma 7B,号称能够在一定程度上帮助外部公司和独立软件开发者构建类似Google Gemini的聊天机器人。通过将Gemma开源,Google或许能够尽可能的防止用户转向Meta等已经开源轻量级模型的竞争对手。Google DeepMind的产品管理总监Tris Warkentin曾在采访中表示,Google希望重新吸引第三方开发者社区,并确保基于Google的模型成为「现代人工智能构建方式的行业标准」。
2月22日,路透社称美国社会化媒体平台Reddit已同Google达成协议,将其内容用于训练后者的人工智能模型,协议价值约为每年6000万美元。2月17日,彭博社也透露过类似消息,但没有公开与Reddit达成交易的对象。此次Reddit与Google达成的协议,是其与大型AI公司的首次公开交易。
同日,Reddit向美国证券交易委员会提交了IPO招股说明书,计划在纽交所上市,股票代码为「RDDT」,摩根士丹利、高盛、摩根大通及美国银行为牵头行。文件显示,Reddit 2023年销售额为8.04亿美元,比上一年的6.667亿美元增长20%。该公司目前拥有超过10万个社区、7300万日活用户和2.67亿周活用户,据分析公司Semrush的数据,Reddit是美国访问量最大的网站之一。
2月22日,迪士尼公司发布声明,宣布其年度创业孵化器计划进入第十年,并公布2024年入围的5家企业。今年的入选名单包括使用AI混音音乐曲目的音频技术公司AudioShake、利用AI语音生成器将文本转换为语音的ElevenLabs,和搜索数字档案以帮助公司设计从电子游戏到摩托车等各种原型的PrometheanAI等3家人工智能公司,另外两家入选企业为制造无人驾驶送货车的Nuro和利用VR与AR创造沉浸式体育游戏体验的StatusPro。
迪士尼加速器项目成立于2014年,是一项旨在加速全世界创新公司发展的业务发展计划。2014年至2018年每年一期,2019年和2020年暂停,2021年迪士尼又高调重启这项计划,展现出积极布局未来技术与娱乐的决心。过往其孵化的公司涉及领域消费媒体和娱乐产品等领域,也关注NFT、AR与AI等技术领域。
迪士尼为在加速器项目中被选中的企业来提供投资资金、迪士尼创意园区的共享办公空间,和来自迪士尼高管、企业家、投资者,以及娱乐界和技术界的其他知名商业领袖的指导。勇于探索商业模式的公司还可获取迪士尼旗下所有卡通人物IP的使用权,并被允许以此展开内容和技术创新。
今日,AI创业公司月之暗面(Moonshot AI)已完成新一轮超10亿美元融资,投资方包括红杉中国、小红书、美团、阿里,老股东跟投。这是生成式AI热潮来中国创业公司拿到的最大单笔融资,推动「月之暗面」估值上涨至25亿美元。月之暗面尚未官宣该轮融资,信息若属实,将推升其成为国内估值最高的生成式AI创业公司,反超此前位列榜单前两名的MiniMax和智谱。
月之暗面成立于2023年3月,入局虽晚,但核心人才拥有丰富的大模型开发经验,是一家以人才密度著称的AI创业公司。创始人杨植麟以及联合创始人周昕宇和吴育昕都曾就读于清华,因此也被认为是清华系AI公司。目前公司员工80人左右。
2023年10月公司发布了首个模型 Moonshot 和智能助手 Kimi ,特点是能支持 20 万汉字长文本输入。有消息称,公司目前正在研发多模态大模型,将于今年推出。