Wellen 利用 OpenAI 的 GPT 打造聊天机器人，提供有关骨骼健康的建议

人工智能聊天机器人有什么用?科幻小说爱好者可能会想起尼尔·斯蒂芬森 (Neal Stephenson) 1992 年经典作品《雪崩》(Snow Crash) 中的“图书管理员”——不是一个人，而是一个能够以对话方式与用户互动的人工智能程序和虚拟图书馆。这个虚构的概念为知识发现问题提出了一个优雅且易于访问的解决方案，只要对它所提出的任何查询的答案都隐藏在其训练数据中即可。

快进到今天，AI 聊天机器人随处可见。但有一个主要缺点:这些通用工具无法达到科幻小说中设想的高水平响应精度。“雪崩”中的对话式 AI 版本几乎总是有用，而且肯定不会经常“产生幻觉”（错误的）答案。当被问及它没有明确信息的问题时，它会“承认”知识差距，而不是诉诸编造。所以事实证明，尖端 AI 工具的现实比我们一些最好的虚构预测要靠谱得多。

虽然我们距离“Snow Crash”图书管理员的强大知识传播游戏还很远，但我们看到定制聊天机器人正在为更窄的上下文中的实用程序而磨练，它们本质上充当不那么乏味的网站搜索。因此，基础大型语言模型 (LLM)，如 OpenAI 的 GPT，正在通过其 API 由其他企业定制，通过在专业数据集上进行训练，以便在特定（即非通用）上下文中应用。

而且，在最好的例子中，这些自定义聊天机器人被指示保持他们的反应简洁（请不要胡说八道!），并被要求展示一些基本的工作原理（通过包括参考资料的链接）作为防止无意中误导信息的后盾-饥饿的人类对话者（他们自己可能容易产生幻觉或看到他们想看到的东西）。

Wellen是一家总部位于纽约的专注于骨骼健康的健身初创公司，今年早些时候推出了一项针对中年女性的订阅服务——宣传旨在帮助治疗骨质减少和骨质疏松症的科学支持的“个性化”力量训练计划——刚刚推出一个这样的人工智能聊天机器人建立在 OpenAI 的法学硕士之上。

测试这个聊天机器人，它被清楚地标记为“实验”——在你开始与它互动之前，你必须承认一个额外的免责声明，强调它的输出“不是医疗建议”——在它今天发布之前，它让人想起“Snow Crash”图书管理员的一点实用性。或者，好吧，只要你留在它的所有骨骼健康专业领域。

因此，例如，问它“骨质疏松症可以逆转吗?”之类的问题。和“跳跃对骨骼健康有益吗?” 你会得到简洁连贯（看似准确）的答案，这些答案链接到创业公司在其网站上托管的内容（由其内部专家撰写），以便进一步阅读你的查询。在首次推出时，它还提供了一些相关问题的示例，您可以向它提出相关问题，以促进交流。

但如果你问的是无关紧要（跑题）的问题——比如“谁是美国总统?” 或者“我应该剪个新发型吗?” — 你会得到随机的答复，这些答复不会解决你所问的问题。在这里，它倾向于提供与核心主题无关（但仍然可能有用）的信息花絮，就好像它完全误解了这个问题和/或试图从它愿意讨论的内容语料库中模式匹配一个最不相关的响应。但它仍然会回答你从未问过的问题。（这可能包括主动提供有关如何支付其个性化健身计划费用的信息。这当然是转移垃圾问题的一种方式。）

向机器人询问与其专业领域相关的可疑内容——例如关于骨骼健康的医学阴谋论或关于骨质疏松症神奇疗法的狡猾内容——我们发现它能够直接驳斥这些废话或将用户引回经过验证的信息揭穿垃圾或两者。

该机器人也经受住了我们（相当粗鲁）试图说服它放弃护栏和角色扮演的尝试，试图让它给出无益甚至有害的建议。对于明显荒谬的问题（比如吃人骨头是否对骨骼健康有益），它非常直接地回答——尽管它对此的反应可能有点过于干巴巴和谨慎，机器人告诉我们:“没有提到在所提供的背景下，吃人骨有益于骨骼健康。” 但是，嗯，这并没有错。

该工具的早期印象是它非常易于使用（并且比一般的低效站点搜索功能更好的体验）。它看起来也可能有助于支持 Wellen 的用户寻找与骨骼健康相关的有用资源。或者只是找到他们以前在其网站上阅读过但不记得他们在哪里看到的内容。（例如，我们设法让它列出了它所写的所有关于饮食和骨骼健康的博客文章的链接。）

在这个有限的上下文中，它看起来像是对生成式 AI 的合理使用——其设计具有适当的安全机制，以防止对话偏离主题或转向其他误导性陷阱。并严格尊重采购。（请注意，您每天可以提出的免费查询次数有上限，最多 6 个。我们假设付费 Wellen 会员没有上限。）

尽管您确实有点想知道，当一个更简单的决策树聊天机器人可能就足够了（至少对于主流/可预测的查询而言）时，在这个用例中使用 LLM 是否有点矫枉过正?

“我们正在使用 OpenAI 的 API 来创建嵌入，以生成我们内容的矢量存储，”首席执行官兼创始人 Priya Patel 解释道。“我们正在利用一个名为 LangChain 的流行开源框架来促进在我们的嵌入中搜索和检索信息。”

关于培训数据，她说他们嵌入了Well Guide中的内容以及网站上的其他内容，并指出:“我们所有的 Well Guide 内容都是由该领域的专家编写和同行评审的，包括对同行评审的参考研究、医学协会和政府机构。”

所以，基本上，这个实现看起来像是一个简洁的例子，说明高质量的人工智能输入与内容护栏相结合如何产生质量受控的输出。（然而，如果你在随机会议上训练你的生成人工智能，从互联网论坛上刮下来，然后让它在网络上松散，如果它很快开始模仿通常的在线阴谋论废话，不要感到惊讶。）

Wellen 表示，聊天机器人的目标是为其目标人群提供更多支持，声称该机器人可以“解释意图、记住历史并提供快速、准确的响应”，利用“专家编写”的内容（包括最新的在骨骼健康研究中）除了提供生活方式和营养指导外，还可以回答“数千”个问题。

“我们使用聊天机器人的目标是让信息更易于访问和使用，”帕特尔告诉 TechCrunch。“大多数人花几个小时在网上搜索医疗问题，但我们的网站上有数百页专家撰写的内容，可以简化这个搜索过程。通过我们的聊天机器人，我们可以让用户比以往更轻松地利用我们已经收集的信息，并轻松找到他们问题的科学支持答案，以及与基础资源的直接链接。”

当被问及它采用的具体安全措施时，她确认它正在为 GPT 使用“低温”设置——这意味着它通过 OpenAI 提供的控制来降低输出的随机性/创造力，以限制响应偏离轨道的风险——因为以及部署“某些快速工程技术，以帮助减少聊天机器人响应中的创造力和幻觉空间。” 因此，换句话说，它试图弄清楚用户可能会如何尝试绕过安全措施以主动锁定潜在的漏洞。

同样，对于可能遇到聊天机器人的用户类型不太可能试图突破其限制的用例，后者可能有点过头了。他们很可能只是想要帮助了解骨骼健康。但是没有人会抱怨在与健康相关的环境中对 AI 安全的过度设计。

Patel 标记的另一项安全措施是硬性要求所有机器人的响应都包括来源——“这是指向我们网站内容的直接链接，可用于验证信息。” 对于已经在经过验证的数据集上进行训练的自定义机器人，这显然是一个明智的选择。它还鼓励用户四处点击并发现这家初创公司提供的更丰富的网络内容，作为信息营销来推动其付费服务的采用。

鉴于目前围绕生成式人工智能的炒作程度，Wellen 的聊天机器人还可以作为其所提供产品的效用营销，包括通过当前对对话式人工智能的普遍兴趣的漩涡，有机地吸引更多的关注。因此，这是立即实施该技术所带来的另一个轻松胜利。

此外，当涉及到以健康为中心的用例时，企业的首要任务通常只是提高人们对健康问题的认识，以宣传生活方式干预的好处，作为传统（被动）医疗保健的主动替代方案。因此，一个可以响应各种查询并全天候 24/7 运行以帮助缩小知识差距的聊天机器人看起来也是一个更广泛任务的便捷工具。