虽然 ChatGPT API 开放之后,使用成本降低了九成,但对于 OpenAI 和集成 ChatGPT 的科技公司来说,情况却大不相同。
众所周知,在谷歌搜索的时代,搜索引擎的工作原理是建立巨大的网络索引,在用户进行搜索时,这些索引条目会被扫描、排名和分类,随后结果显示出最相关的条目。谷歌的搜索结果页面实际上会告诉用户搜索所需要的时间(通常不到一秒)。
而 ChatGPT 式的搜索引擎会在每次搜索时启动一个模仿人脑的巨大
神经网络
,生成一堆文本,可能还会
查询
大型搜索索引以获取事实信息。这意味着用户与其交互的时间可能远远超过几分之一秒,并且这些额外的处理需要花费更多的成本。
据路透社报道,Alphabet(谷歌的母公司)的董事长 John Hennessy 及几位分析师交谈之后写道:「与 AI 大型
语言模型
交流询问的成本可能是标准关键字搜索的 10 倍以上」。对于致力于推行 ChatGPT 式搜索引擎的谷歌、微软来说,这可能意味着「数十亿美元的额外成本」。
Alphabet 董事长 John Hennessy。
虽然 ChatGPT 这个研发热点肯定是要跟的,但付出的成本是各家公司能够承担的吗?
微软的答案是肯定的,而且它还要进一步增加相关的研发投入。
彭博社报道,微软花费了数亿美元为 OpenAI 建造了一台巨大的超级计算机,使用了「成千上万块 GPU」以推动 OpenAI 的 ChatGPT
聊天机器人
。
据彭博社获得的回复,微软
人工智能
和
云计算
副总裁 Scott Guthrie 说,公司在该项目上花费了数亿美元的资金。虽然这对微软来说可能不值一提,毕竟它最近延长了对 OpenAI 的多年、数十亿美元的投资,但这无疑表明,微软愿意在
人工智能
领域投入更多资金。
在本周一的博客中,微软介绍了它是如何创建 OpenAI 使用的强大的 Azure
人工智能
基础设施,以及其系统如何变得更加强大。
比如微软推出了新的虚拟机 —— 使用英伟达 H100 和 A100 Tensor Core GPU 以及 Quantum-2 InfiniBand 网络,这是两家公司去年就预告过的项目。这将允许 OpenAI 和其他依赖 Azure 的公司训练更大、更复杂的 AI 模型。
「大约五年前,OpenAI 向微软提出了一个大胆的想法,即它可以构建将永远改变人们与计算机交互方式的
人工智能
系统。」John Roach 写道。
当时,没有人知道这将意味着什么。现在,我们理解了这种设想 ——ChatGPT,并体验到了它的魔力:AI 系统可以创建人们用简单语言描述的任何图片,
聊天机器人
可以根据少量单词编写说唱歌词、起草电子邮件和
规划
整个菜单。
像这样的技术,在当时看来未必不可能。只是为了构建它,OpenAI 需要真正大规模的计算能力。
2019 年,微软公司宣布向 OpenAI 投资 10 亿美元,同意为这家 AI 研究初创公司建造一台大规模的前沿超级计算机。当时唯一的问题是:微软没有 OpenAI 所需要的东西,也不完全确定能在自己的 Azure 云服务中建造这么大的东西而不崩溃。现在,这个承诺终于兑现了。
微软表示,为了建立给 OpenAI 项目提供动力的超级计算机,它在 Azure
云计算
平台上「将成千上万的英伟达 GPU 连接在一起」。反过来,这使得 OpenAI 能够训练出越来越强大的模型,并「释放出 AI 能力」,比如 ChatGPT 和必应工具。
这些突破的关键是学习如何构建、操作和维护数万个在高吞吐量、低延迟 InfiniBand 网络上相互连接的共置 GPU。这个规模甚至比 GPU 和网络设备供应商测试过的还要大。这是一片未知的领域,没有人确切知道硬件是否可以在不损坏的情况下被推到那么远。为了训练一个大型
语言模型
,计算工作量被分配到一个集群中的数千个 GPU 上。在计算的某些阶段(称为 allreduce),GPU 会交换有关它们已完成工作的信息。InfiniBand 网络加速了这一阶段,该阶段必须在 GPU 开始下一个计算块之前完成。
「我们看到的是,我们将需要建立专注于实现大型训练工作负载的特殊用途集群,而 OpenAI 是这一点的早期证明之一,」微软 Azure AI 企业副总裁 Eric Boyd 在一份声明中说。「我们与他们紧密合作,了解他们在建立训练环境时寻找的、需要的关键是什么。」
相比于微软,谷歌的搜索成本问题无疑更大。微软之所以如此渴望撼动谷歌搜索引擎,部分原因就是在大多数市场份额估计中,必应只占全球搜索市场的 3%,而谷歌约占 93%。搜索是谷歌的主要业务,而微软并不需要担心这一点。
根据 Morgan Stanley 的估算 —— 假设「类 ChatGPT 的 AI 能够用 50 个词(word)的答案处理一半的
查询
」,谷歌每年的成本将增加 60 亿美元。
有趣的是,谷歌从一开始就对模型规模持谨慎态度。谷歌表示 Bard
聊天机器人
最初发布的是 LaMDA 轻量级模型版本,原因是「这个更小的模型需要更少的计算能力,才能够扩展到更多的用户,得到更多的反馈。」要知道这不是谷歌的常见操作,谷歌经常在模型规模方面让其他公司相形见绌,在计算资源方面也是极具优势。「规模」只是谷歌花点钱就能解决的问题,除非成本增加的不是一点半点。
根据 Insider 的最新消息,谷歌正在测试一个名为 Big Bard 的模型,它是 Bard 的高级版本,使用了与 Bard 相同的
语言模型
LaMDA。
根据内测示例显示,对于相同的问题,Big Bard 给出了更丰富、更人性化的回答,它通常也更健谈、更随意。不过不是所有员工都可以内测 Big Bard ,它是有限制的,仅供部分员工使用,而 Bard 则对所有谷歌员工开放。
除此以外,Big Bard 使用更大规模的 LaMDA,AI 技术为其
聊天机器人
提供支持。谷歌表示 Big Bard 是其在布局对话模型计划中的一部分,该计划旨在创建一个通用
聊天机器人
,可以回答用户在其产品和服务中提出的任何问题或请求。
出于成本考虑,谷歌可能会推出 Bard 的限量版。然而,这场
人工智能
竞赛并没有放缓的迹象。上周有消息传出,多模态的 GPT-4 将于本周发布。看来微软和谷歌的对打一时半会儿还停不下来。
类 ChatGPT 产品能为科技公司带来多大的收益,目前很难衡量。有一个已知的例子,谷歌和亚马逊的语音助手多年来一直保持「以后再想办法」的盈利思路,目前都未能产生利润,而且它们是比 ChatGPT 更受限制的
聊天机器人
。OpenAI 在开放 ChatGPT API 之后,以 token 为单位收取费用,但这对搜索引擎来说并不适用。
微软方面已经准备「在必应
聊天机器人
生成的回复中插入广告」,补偿其高昂的服务器运行成本。
在开放 API 之后,越来越多的企业用户将与 OpenAI 合作,将其 ChatGPT 服务集成到自己的产品中。大多数公司使用 ChatGPT 等大型
语言模型
来帮助客户制作企业博客、营销电子邮件等等,而工作量比以前少得多。然而,这些公司的产品几乎都是给大型
语言模型
套了一个简单的「外壳」,因此很难实现差异化竞争优势。
实际上,OpenAI 最近还推出了 4 个 GPT-3 模型 ——Davinci、Curie、Babbage 和 Ada。其中 Davinci 是功能最强大的模型,Ada 则是速度最快的。Davinci 被一些公司认为是开发产品的更好选择,它的输出往往比 ChatGPT 的更简洁、更直接,并且在某些类别的 prompt 下也表现更好。而 ChatGPT 在一些关键领域优于 Davinci,包括数学、情绪分析等等。
值得注意的是,OpenAI 为 Davinci API 设置的定价是 ChatGPT 的十倍。因此近几周内,大多数 Davinci 用户可能会涌向 ChatGPT。对于 OpenAI 和其竞争对手(包括 Cohere、AI21、Anthropic、Hugging Face)来说,Davinci 的定价似乎更加合理。至于 ChatGPT,它的超低定价会让行业内的同类产品价格大幅下跌,包括 OpenAI 自己的产品。
将 ChatGPT API 的价格设置得如此低的水平(只有原来的十分之一)之后,很难说 OpenAI 会从 ChatGPT 或其他任何模型中获利还是亏损,因为这些超大规模的模型
查询
成本非常高。有人猜测:OpenAI 可能已经通过剔除自 11 月首次亮相以来全世界提出的无数 ChatGPT
查询
中很少激活的
参数
,修剪了支持 ChatGPT 的模型以降低模型成本。但这只是一个猜测。
接下来的一段时间,OpenAI 可能会因为 ChatGPT 被大量使用而亏损。这听起来有点反直觉,但大型
语言模型
的训练和运行成本确实非常高。但对于获得微软 100 亿美元和 GPU 全力支持的 OpenAI 来说,「薄利多销」也能让它比其他竞争对手走得更远。
https://news.microsoft.com/source/features/ai/how-microsofts-bet-on-azure-unlocked-an-ai-revolution/
https://www.bloomberg.com/news/articles/2023-03-13/microsoft-built-an-expensive-supercomputer-to-power-openai-s-chatgpt?srnd=technology-vp#xj4y7vzkg
https://arstechnica.com/gadgets/2023/02/chatgpt-style-search-represents-a-10x-cost-increase-for-google-microsoft/
https://arstechnica.com/gadgets/2023/03/has-the-generative-ai-pricing-collapse-already-started/
https://www.businessinsider.com/google-employees-test-smarter-chatbot-big-bard-2023-3