查看原文
其他

亚马逊开发大型语言模型 LLM 准确率胜过 ChatGPT

myfreax myfreax 2023-03-06

OpenAI 在 GPT-3.5 模型下进行一系列进行微调,在 2022 年初完成训练,年末进一步推出的 ChatGPT 模型引发热议,带动全球关注AI 热潮。

而亚马逊新开发的大型语言模型 Large Language Models,LLM,宣称只用 10 亿个参数建立模型,准确率比起最先进的GPT-3 高出 16%。

亚马逊近期发布一篇名为《Multimodal Chain-of-Thought Reasoning in Language Models》的论文。

亚马逊资深产品经理 Assaf Yablon 指出,其 LLM 经过 10 亿个参数训练,达到91.68% 的惊人准确率。

相较目前火热的 GPT-3,准确率则是75.17%,亚马逊 LLM 的准确率比 GPT-3 高出16%,这个令人印象深刻的成就在 Chain-of-Thought(CoT)帮助达成。

亚马逊 LLM 推论答案的流程

亚马逊的做法是透过两阶段架构整合语言文字和视觉图像的方式,该架构区分成基本理由和推断答案。

如此一来,答案推论过程可以受惠于多模型资讯。简而言之,亚马逊的 LLM 能够根据更广泛的知识产生更有洞察力的基本理由和答案。

在这波AI 竞赛中,亚马逊并没有打算缺席,其 LLM 的架构不算复杂且已完整开源。想像如能进一步开发成类似 ChatGPT 的对话式 AI。

可以运用在亚马逊电商客服上,解决消费者在 App 操作、付款、到货等问题,也能推荐商品,改善整个购物体验。

此外,由于架构整合文字和图像,或许也能帮助品牌供应商或第三方卖家产生合适的商品文案。

如果您有任何问题或反馈,请随时发表评论。点击下方阅读原文获取更好排版格式与文章参考引用


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存