首页 科技开发工具 娱乐游玩工具 热门工具   APP 登录/注册 联系/合作
   
 
Meta 通过定制芯片和超级计算机在 AI 上押
在今天上午的一次虚拟活动中,Meta 揭开了其为 AI 工作负载开发内部基础设施的努力的帷幕,包括支持其最近推出的广告设计和创作工具的生成 AI 类型。

这是对 Meta 实力投射的一次尝试,Meta 历来在采用 AI 友好型硬件系统方面进展缓慢,这阻碍了其与谷歌和微软等竞争对手保持同步的能力。

“构建我们自己的 [硬件] 功能使我们能够控制堆栈的每一层,从数据中心设计到培训框架,”Meta 基础设施副总裁 Alexis Bjorlin 告诉 TechCrunch。“需要这种水平的垂直整合才能大规模突破人工智能研究的界限。”

在过去十年左右的时间里,Meta 花费了数十亿美元来招募顶级数据科学家并构建新型人工智能,包括现在为发现引擎、审核过滤器和遍布其应用程序和服务的广告推荐器提供支持的人工智能。但该公司一直在努力将其许多雄心勃勃的 AI 研究创新转化为产品,尤其是在生成 AI 方面。

直到 2022 年,Meta 主要使用 CPU 和专为加速 AI 算法而设计的定制芯片的组合来运行其 AI 工作负载——CPU 在处理这类任务时的效率往往低于 GPU。Meta 取消了计划于 2022 年大规模推出定制芯片的计划,转而订购了价值数十亿美元的 Nvidia GPU,这需要对其多个数据中心进行重大重新设计。

为了扭转局面,Meta 计划开始开发更具雄心的内部芯片,该芯片将于 2025 年推出,能够训练 AI 模型并运行它们。这就是今天演讲的主题。

Meta 将新芯片称为元训练和推理加速器,简称 MTIA,并将其描述为加速 AI 训练和推理工作负载的芯片“家族”的一部分。(“推理”指的是运行经过训练的模型。)MTIA 是一种 ASIC,一种将不同电路组合在一块板上的芯片,允许对其进行编程以并行执行一项或多项任务。
专为 AI 工作负载设计的 AI 芯片 Meta。
“为了在我们的重要工作负载中获得更高水平的效率和性能,我们需要一个与模型、软件堆栈和系统硬件共同设计的定制解决方案,”Bjorlin 继续说道。“这通过各种服务为我们的用户提供了更好的体验。”

定制 AI 芯片越来越成为大型科技公司的游戏名称。谷歌创建了一个处理器,TPU(“张量处理单元”的缩写),用于训练大型生成式人工智能系统,如PaLM-2和Imagen。亚马逊向 AWS 客户提供专有芯片,用于训练 ( Trainium ) 和推理 ( Inferentia )。据报道,微软正在与 AMD 合作开发一种名为 Athena 的内部 AI 芯片。

Meta 表示,它在 2020 年创建了第一代 MTIA——MTIA v1——基于 7 纳米工艺。它可以从其内部 128 MB 内存扩展到高达 128 GB,并且在 Meta 设计的基准测试中——当然,必须持保留态度——Meta 声称 MTIA 处理了“低复杂性” ”和“中等复杂度”的 AI 模型比 GPU 更有效。

Meta 表示,芯片的内存和网络领域仍有工作要做,随着 AI 模型规模的增长,这会出现瓶颈,需要将工作负载分配到多个芯片上。(并非巧合,Meta 最近收购了位于奥斯陆的英国芯片独角兽 Graphcore 的 AI 网络技术团队。)目前,MTIA 的重点完全放在 Meta 应用程序系列“推荐工作负载”的推理上,而不是训练上。

但 Meta 强调,它继续改进的 MTIA 在运行推荐工作负载时“大大”提高了公司在每瓦性能方面的效率——反过来允许 Meta 运行“更加增强”和“尖端”(表面上)人工智能工作负载。

人工智能超级计算机
也许有一天,Meta 会将其大部分人工智能工作负载委托给 MTIA 银行。但就目前而言,该社交网络在其专注于研究的超级计算机 Research SuperCluster (RSC) 中依赖 GPU。

RSC 于 2022 年 1 月首次亮相,与 Penguin Computing、Nvidia 和 Pure Storage 合作组装而成,已经完成了第二阶段的扩建。Meta 表示,它现在包含总共 2,000 个 Nvidia DGX A100 系统,配备 16,000 个 Nvidia A100 GPU。

那么为什么要建造一台内部超级计算机呢?嗯,一方面,有同龄人的压力。几年前,微软对其与 OpenAI合作构建的 AI 超级计算机进行了重大改造,最近又表示将与 Nvidia 合作,在 Azure 云中构建新的 AI超级计算机。在其他地方,谷歌一直在宣传自己的专注于人工智能的超级计算机,它拥有 26,000 个 Nvidia H100 GPU——领先于 Meta。
Meta 用于 AI 研究的超级计算机。
但除了跟上竞争对手之外,Meta 表示 RSC 的好处是允许其研究人员使用 Meta 生产系统中的真实示例来训练模型。这与该公司之前的 AI 基础设施不同,后者仅利用开源和公开可用的数据集。

“RSC AI 超级计算机用于在多个领域推动 AI 研究的边界,包括生成 AI,”Meta 发言人说。“这真的关系到人工智能研究的生产力。我们希望为 AI 研究人员提供最先进的基础设施,使他们能够开发模型并为他们提供培训平台以推进 AI 发展。”

在其巅峰时期,RSC 可以达到近 5 exaflops 的计算能力,该公司声称这使其成为世界上最快的计算能力之一。(为了避免给人留下深刻印象,值得注意的是,一些专家对 exaflops 性能指标持保留态度,并且 RSC 远远超过世界上许多最快的超级计算机。)

Meta 表示,它使用 RSC 来训练 LLaMA,这是“大型语言模型元人工智能”的首字母缩写词——该公司在今年早些时候作为“门控发布”向研究人员共享的大型语言模型(随后以各种形式泄露)互联网社区)。Meta 表示,最大的 LLaMA 模型在 2,048 个 A100 GPU 上进行了训练,耗时 21 天。

“构建我们自己的超级计算能力使我们能够控制堆栈的每一层;从数据中心设计到培训框架,”发言人补充道。“RSC 将帮助 Meta 的 AI 研究人员构建新的更好的 AI 模型,这些模型可以从数万亿个示例中学习;跨数百种不同的语言工作;一起无缝分析文本、图像和视频;开发新的增强现实工具;以及更多。”

视频转码器
该公司在今天的活动中透露,除了 MTIA 之外,Meta 还在开发另一种芯片来处理特定类型的计算工作负载。该芯片称为 Meta 可扩展视频处理器或 MSVP,是 Meta 的第一个内部开发的 ASIC 解决方案,专为满足视频点播和直播流媒体的处理需求而设计。

读者可能还记得, Meta 多年前就开始构思定制服务器端视频芯片,并宣布在 2019 年推出用于视频转码和推理工作的 ASIC。这是其中一些努力的成果,也是对竞争优势的新推动。特别是现场视频领域。

“仅在 Facebook 上,人们就将 50% 的时间花在观看视频上,”Meta 技术主管 Harikrishna Reddy 和 Yunqing Chen 在今天上午发表的一篇合着的博客文章中写道。“为了服务于世界各地的各种设备(移动设备、笔记本电脑、电视等),上传到 Facebook 或 Instagram 的视频被转码为多个比特流,具有不同的编码格式、分辨率和质量……MSVP是可编程和可扩展的,并且可以配置为有效地支持 VOD 所需的高质量转码以及实时流媒体所需的低延迟和更快的处理时间。”
Meta 的定制芯片旨在加速视频工作负载,例如流媒体和转码
Meta 表示,它的计划是最终将大部分“稳定和成熟”的视频处理工作负载卸载到 MSVP,并仅对需要特定定制和“显着”更高质量的工作负载使用软件视频编码。Meta 说,使用智能降噪和图像增强等预处理方法以及伪影去除和超分辨率等后处理方法,我们将继续使用 MSVP 提高视频质量。

“在未来,MSVP 将使我们能够支持更多 Meta 最重要的用例和需求,包括短视频——实现生成 AI、AR/VR 和其他元宇宙内容的高效交付,”Reddy 和 Chen 说。

人工智能焦点
如果今天的硬件公告中有一个共同点,那就是 Meta 拼命地试图加快与 AI 相关的步伐,特别是生成 AI。

之前已经电报了很多。今年 2 月,首席执行官马克扎克伯格——据报道已将提高 Meta 的人工智能计算能力作为首要任务——宣布了一个新的顶级生成人工智能团队,用他的话说,“涡轮增压”公司的研发。首席技术官安德鲁博斯沃思最近同样表示,生成人工智能是他和扎克伯格花费最多时间的领域。首席科学家 Yann LeCun表示,Meta 计划部署生成式 AI 工具来在虚拟现实中创建项目。

“我们正在探索 WhatsApp 和 Messenger 中的聊天体验、Facebook 和 Instagram 帖子和广告的视觉创建工具,以及随着时间的推移视频和多模式体验,”扎克伯格在 4 月份 Meta 第一季度财报电话会议上表示。“我希望这些工具对从普通人到创作者再到企业的每个人都有价值。例如,我预计一旦我们确定了这种体验,人们就会对用于业务消息传递和客户支持的 AI 代理产生很大兴趣。随着时间的推移,这也将扩展到我们在元宇宙上的工作,在那里人们将能够更容易地创建化身、对象、世界和将所有这些联系在一起的代码。”

在某种程度上,Meta 感到来自投资者的压力越来越大,他们担心该公司的行动速度不够快,无法占领(潜在的大)生成人工智能市场。它对像 Bard、Bing Chat 或 GPT 这样的聊天机器人还没有答案。它在图像生成方面也没有取得太大进展,这是另一个出现爆炸性增长的关键领域。

如果预测正确,生成式 AI 软件的总潜在市场可能达到 1500 亿美元。高盛预测它将使 GDP 增长 7%。即使是其中的一小部分,也可以消除 Meta 在增强现实耳机、会议软件和 Horizon Worlds 等 VR 游乐场等“元宇宙”技术投资中损失的数十亿美元。Meta 负责增强现实技术的部门 Reality Labs 报告上个季度净亏损 40 亿美元,该公司在第一季度电话会议上表示,预计“2023 年运营亏损将同比增加”。
最新文章:
所有文章资讯、展示的文字、图片、数字、视频、音频、其它素材等内容均来自网络媒体,仅供学习参考。内容的知识产权归属原始著作权人所有。如有侵犯您的版权,请联系我们并提供相应证明,本平台将仔细验证并删除相关内容。
工具综合排行榜
TOP 1
双计算器 双计算器
同时用两个计算器,用于价格对比、数字分别计算等
TOP 2
推算几天后的日期 推算几天后的日期
推算从某天开始,增加或减少几天后的日期
TOP 3
随机密码生成 随机密码生成
随机生成安全复杂的密码,自由设置密码长度及复杂度
TOP 4
推算孩子的血型 推算孩子的血型
根据父母的血型推测子女的血型
TOP 5
日期转中文大写 日期转中文大写
把数字日期转成中文大写,是财务或商务合同常用的工具
TOP 6
世界时间 世界时间
世界时区查询时差计算器
TOP 7
放假安排时间表 放假安排时间表
哪些日子休息,哪些日子上班
TOP 8
IP地址坐标查询 IP地址坐标查询
IP地址查询
TOP 9
中文拆字 中文拆字
中文拆字偏旁、部首、字根
TOP 10
外汇率 外汇率
今日汇率查询表
热门内容:       双计算器       推算孩子的血型       随机密码生成       日期转中文大写       推算几天后的日期       达轻每日一景       高校分数线       高校查询       周公解梦大全
首页 科技开发工具大全
娱乐游玩工具大全
登录/注册
联系我们
  用户咨询/建议
kf@ss3316.com


商务合作/推广
hz@ss3316.com

达轻工具 APP

访问手机版网站
使用本平台必读并同意:任何内容仅供谨慎参考,不构成建议,不保证正确,平台不承担任何责任,同意用户协议隐私政策   
BaiduTrust安全认证签章
© 达轻科技 版权所有 增值电信业务经营许可证 ICP备 沪B2-20050023-3