OpenAI忙着“宫斗”时，竞争对手发布新款大模型-科技让生活更美好

开发对话和聊天机器人Pi的初创公司impact AI刚刚发布了其最新的AI模型。据说这款机型的性能已经超越了Google和Meta的主流替代品，正在迅速缩小与OpenAI旗舰成绩的差距。

影响力人工智能由谷歌DeepMind人工智能研究小组的联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)和领英(LinkedIn)的联合创始人雷德·霍夫曼在今年3月创立。短短两个月，公司完成2.25亿美元融资；到今年6月，Influence AI已经从微软和英伟达等许多知名投资者那里额外筹集了13亿美元。

根据Influence的说法，这款名为Influence-2的新机型在各项标准基准测试中已经超过了谷歌今年5月发布的PaLM Large 2机型，并在其他指标上击败了Meta领导的开源Llama 2机型。这家初创公司指出，总体而言，影响力在同体积的模型中表现最佳，仅次于OpenAI发布的旗舰模型GPT-4。

该公司首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)在接受采访时表示，“我们坚信，我们正处于这条扩张曲线的起点，从中延伸出来的新功能确实令人兴奋。”

新发布的模型将很快集成到今年5月影响力发布的聊天机器人Pi中。不过，苏雷曼表示，在此之前还有大量的“对齐”工作要做，即让新模型掌握Pi机器人的语气和回答风格，使其能够帮助Pi更好地发挥作用，吸收最新信息而不产生额外的错觉。

他解释说，“无论用户是否希望在此刻就种族、性别、政治、OpenAI甚至任何有争议的问题进行敏感的对话，Pi都可以以非常聪明、谨慎和尊重事实的方式进行互动，并实时获取信息。”苏莱曼补充说，Pi将“很快”更新到影响力-2模型，但没有给出具体日期。

他也拒绝透露Pi上的用户数量，只强调“Pi很受欢迎，用户留存率很高。”两周前，OpenAI表示，其免费ChatGPT服务的周用户已经达到1亿。然而，就在这个好消息发布后不久，上周五，OpenAI董事会突然出击，解雇了CEO萨姆·奥特曼，上演了一场震惊世界的“宫斗”。

在行业头部模型开发者乱象丛生的背景下，我们很难不关注这次由影响力发布的大语言模型。

有外媒称，拥有1750亿个参数的模型被很多业内人士视为“当今世界第二大模型”。就在本周三上午，OpenAI正式宣布奥特曼将重返公司，继续担任CEO。整个周末，各方盟友已经开始就奥特曼回归展开谈判，OpenAI员工也签署请愿书，要求董事会成员集体辞职。

在影响力方面，苏莱曼坚称这家初创公司今年早些时候已经筹集了13亿美元。不过，当时他并没有给出影响力新模式的发布日期，只是在早前的公开讲话中暗示可能会在年底前推出。他在最新的公告中解释说，发布实际上晚了一周，模型训练工作早在上周就完成了。

影响力AI:影响力-2超越谷歌和Meta的主流机型，目前仅落后于GPT-4。

在影响力-2的训练中，该公司使用了5000个英伟达H100图形处理单元(GPU)，远少于上一代影响力-1训练中使用的数千个A100。目前，H100的零售价超过25000美元，内置800亿个晶体管，其语言模型的运行速度比英伟达的旗舰A100 GPU快30倍。

影响力AI也使用H100进行推理，即在生产中运行影响力-2来处理用户提交的任务。苏莱曼还提到，新模型的训练速度更快，成本更低，但也需要处理大量的计算任务(10^25 FLOP，即浮点运算)。影响力与微软、英伟达和CoreWeave密切合作，管理他们的计算集群。

Influence已经在一组流行的高中和职业能力基准(MMLU)上测试了它的最新模型。在测试中，该模型回答了涉及57个主题的大量问题，包括世界知识、解决实际问题和道德判断。

根据影响力AI的介绍，新模型可以访问升级后的知识库，从而更准确地回答用户的查询。Influence-2还具有“显著提高的推理能力”，使模型能够更好地执行代码生成等任务，并对生成文本的语言风格进行细粒度调整。

与竞争对手的大语言模型相比，Influence-2不仅优于其前身，而且表现出色。

影响力-2与其他机型的性能对比。

苏莱曼表示，影响力-2的性能优于业界领先的700亿参数版本Llama 2、马斯克初创公司xAI的Grok-1、谷歌的PaLM 2 Large和Anthropic的Claude 2，目前仅落后于GPT-4。

根据影响力，新模型在科学问答的七项基准测试中五次击败了Llama 2和PaLM 2模型。在三次问答任务基准测试中，也成功登顶两次，仅次于一次测试中的PaLM 2 Large。该公司还补充说，虽然在模型训练中没有明显的领域倾向，但Influence-2在四项数学和代码基准测试中取得了优异的成绩，但与OpenAI公布的结果相比，仍远远落后于GPT-4。OpenAI的模型虽然性能更好，但体积比Influence-2大，这意味着它的训练需要消耗更多的计算资源。

苏雷曼指出，尽管似乎只有AI研究人员或开发人员会密切关注这样的基准测试结果，但即使是最轻微的改进也足以形成“技术原型”和“生产级、高可靠性和高质量”模型之间的关键区别。总的来说，苏莱曼表示，影响力-2在同体积车型中已经遥遥领先，在很多方面已经“非常非常接近”最强王者GPT-4。

据悉，影响力AI共有22000个H100 GPU，相当于训练影响力-2的GPU数量的4倍多。在这次发布中，该公司强调，他们计划使用这些硬件来构建更先进和更大的新模型。据报道，从现在开始，影响力已经将训练重点转移到下一代车型上。预计新模型将在六个月内达到影响力-2的10倍体积，并在未来六个月内进一步扩大10倍。(最终成交量有望增加到100倍。)

OpenAI的管理混乱，给了竞争对手可乘之机。

就在OpenAI管理层达成临时和解方案的几个小时前，苏莱曼敦促公众以“同理心和宽容”对待那些被卷入风波的人。他指出“许多人的言行完全是出于善意”，并点名OpenAI的联合创始人伊利亚·苏茨基弗(Ilya Sutskever)。Sutskever是参与解雇Altman的第一批董事会成员之一，但后来在周日晚上对该决定表示遗憾。(尚不清楚Sutskever是否会留在OpenAI，但他对该公司和奥特曼宣布x回归的帖子表示赞赏。)

Sutskever在2011年为Suleyman工作，当时他是DeepMind的外包商和顾问。三年后，苏莱曼将这家人工智能初创公司卖给了谷歌。在谈到苏茨基弗时，苏莱曼说，“我非常尊重他。这种尊重不仅来自于技术层面，更来自于他的原则性和真诚的态度。我认为在这次事件中，他和团队的其他成员都有真诚的意图。”

影响力和苏莱曼此前在AI安全问题上表达了明确的态度，并在今年7月自愿签署了由拜登总统发布的“关于安全、可靠和可信的AI的行政命令”。他还发誓不会让聊天机器人Pi回答任何有关选举的问题，也不会为政治竞选提供材料。苏莱曼最近出版了一本名为《即将到来的浪潮》(The Coming Wave)的书，详细介绍了AI技术的风险。

在谈到OpenAI的非营利董事会及其最近的一系列行为，特别是在科技领域遭受的诽谤时，苏莱曼说，“显然，他们犯了一系列非常重要的错误。但我还是希望人们能宽容一点，把这件事当做OpenAI发展历程中的一个插曲。努力让公司变得更好，做正确的事情，通过新的治理结构让世界变得更好，这才是真正重要的任务。”

然而，苏莱曼本人持有典型的资本主义思维。当被问及OpenAI的困境(ChatGPT周一周二短时间瘫痪，大量客户担心发展)是否给竞争对手带来机会时，他没有否认。

参考链接:

https://silicon angle . com/2023/11/22/inflection-ai-debutts-new-旗舰-inflection-2-LLM-trained-5000-h100-chips/

未经允许不得转载：科技让生活更美好 » OpenAI忙着“宫斗”时，竞争对手发布新款大模型

OpenAI忙着“宫斗”时，竞争对手发布新款大模型

作者：pu

相关推荐