最流行的语言模型可能可以通过 API 访问,但开放模型(就该术语而言)正在取得进展。Mistral 是一家法国人工智能初创公司,于 6 月份筹集了巨额种子轮资金,刚刚揭开了其第一个模型的面纱,声称该模型的性能优于其他同等规模的模型,而且完全免费使用,没有任何限制。
Mistral 7B 模型现在可以通过多种方式下载,包括 13.4 GB 的 torrent(已经有几百个播种器)。该公司还启动了GitHub存储库和Discord频道,用于协作和故障排除。
最重要的是,该模型是在Apache 2.0 许可证下发布的,这是一种高度宽松的方案,除了归属之外,对使用或复制没有任何限制。这意味着该模型可以被业余爱好者、价值数十亿美元的公司或五角大楼等使用,只要他们拥有能够在本地运行该模型的系统或愿意支付必要的云资源费用。
Mistral 7B 是对 Llama 2 等其他“小型”大型语言模型的进一步改进,以相当低的计算成本提供类似的功能(根据一些标准基准)。像 GPT-4 这样的基础模型可以做更多的事情,但价格昂贵且难以运行,导致它们只能通过 API 或远程访问来使用。
“我们的目标是成为开放生成人工智能社区的主要支持者,并将开放模型带来最先进的性能,”米斯特拉尔的团队在模型发布时发布的博客文章中写道。“Mistral 7B 的性能充分证明了小型模型的能力。这是三个月紧张工作的结果,我们从头开始组建了 Mistral AI 团队,重建了顶级性能的 MLops 堆栈,并设计了最复杂的数据处理管道。”
对于某些人(也许是大多数人)来说,这份清单听起来可能像是三个多月的工作,但创始人们已经领先一步,因为他们曾在 Meta 和 Google DeepMind 开发过类似的模型。确切地说,这并不容易,但至少他们知道自己在做什么。
当然,尽管每个人都可以下载和使用它,但这与“开源”或该术语的某种变体有很大不同,正如我们上周在 Disrupt 上讨论的那样。尽管许可证非常宽松,但模型本身是使用私人资金私人开发的,数据集和权重同样是私人的。
这似乎就是米斯特拉尔商业模式的构成:免费模式可以免费使用,但如果你想深入了解,你会想要他们的付费产品。“[我们的商业产品]将作为白盒解决方案分发,提供权重和代码源。我们正在积极致力于为企业开发托管解决方案和专用部署,”博客文章中写道。我已要求米斯特拉尔澄清一些开放性及其未来发布的计划,如果收到他们的回复,我将更新这篇文章。