借助Spotify 的 AI DJ,该公司用真人的声音训练了 AI——其文化合作伙伴关系负责人兼播客主持人Xavier “X” Jernigan 的声音。现在看来,主播可能会将同样的技术用于广告。根据 The Ringer 创始人比尔·西蒙斯 (Bill Simmons) 的声明,流媒体服务正在开发 AI 技术,该技术将能够使用播客主持人的声音来制作主持人阅读的广告——主持人实际上不必阅读和录制广告文案。
西蒙斯在比尔西蒙斯播客的最近一集中发表了声明,他说:“将有一种方法可以用我的声音来制作广告。显然你必须对声音表示认可,但从广告的角度来看,它为你打开了所有这些不同的巨大可能性。”
他说,这些广告可以为播客开辟新的机会,因为他们可以定位广告——比如听众所在城市当地活动的门票——甚至可以在主持人的许可下制作不同语言的广告。
他的评论首先由Semafor报道。The Ringer于 2020 年被 Spotify 收购,但不清楚西蒙斯是否被授权谈论这家流光公司在这一领域的计划,因为他首先说:“我不认为 Spotify 会因为我而生我的气这……”在分享信息之前。
就此征求意见,Spotify 没有直接确认或否认该功能的开发。“我们一直在努力提升 Spotify 体验并测试有利于创作者、广告商和用户的新产品,”Spotify 发言人告诉 TechCrunch。“人工智能领域正在迅速发展,拥有悠久创新历史的 Spotify 正在探索广泛的应用,包括我们广受欢迎的人工智能 DJ 功能。过去一个月,讨论 AI 的每日播客剧集数量增加了 500%,其中包括 Derek Thompson 和 Bill Simmons 之间的对话。广告代表了未来探索的有趣画布,但我们目前没有任何消息要宣布。”
此评论的潜台词表明西蒙斯的声明可能有些为时过早。也就是说,Spotify 已经暗示,今天应用程序中的 AI DJ 不会是未来用户遇到的唯一 AI 语音。当 Jernigan 最近被问及 Spotify 未来与其他语音模型合作的计划时,他开玩笑说:“敬请期待。”
流媒体还一直在悄悄投资人工智能开发和研究,目前有数百人的团队致力于个性化和机器学习等领域。此外,该团队一直在使用 OpenAI 模型并研究跨大型语言模型、生成语音等的可能性。
Spotify 创建 AI 语音的能力专门利用了Spotify 2022 年收购Sonantic 的 IP 以及 OpenAI 技术。该公司最近告诉我们,它可能会选择在未来使用自己的内部人工智能技术。
为了创建 AI DJ,Spotify 让 Jernigan 进入录音室制作高质量的录音,包括那些他朗读带有不同节奏和情绪的台词的录音。他在录音中保持自然的停顿和呼吸,并确保使用他已经说过的语言——比如“曲调”或“砰砰声”,而不仅仅是“歌曲”。然后将所有这些输入到 AI 模型中,然后创建 AI 语音。
该公司已经更详细地解释了这个过程,或者说明了将 Jernigan 的录音变成 AI DJ 需要多长时间。但是,考虑到它可能有兴趣将其播客主机转变为 AI 语音模型,它必须在这里开发一个相当有效的过程——并且一个可以利用播客现有录音的过程。
虽然人工智能的声音并不新鲜,但让它们听起来像真人的能力是一个更现代的发展。几年前,谷歌在 Duplex 中推出了一个听起来像人类的人工智能,它可以为你打电话给餐厅进行预订,这让世界惊叹不已。但这项技术最初因缺乏披露而受到猛烈抨击。本月,Apple推出了一项辅助功能 Personal Voice,该功能能够在用户首次训练模型后通过花 15 分钟阅读随机选择的提示来模仿用户自己的声音,并在他们的设备上进行本地处理。