查看原文
其他

国产 GTPs 上线!智谱 AI 推出 GLM-4 全家桶,我们浅试了一下

褚杏娟 InfoQ 2024-01-21

作者 | 褚杏娟

1 月 16 日,智谱 AI 团队全面展示了其投身于大模型事业三年多来所积累的技术成果,并重磅发布了新一代基座大模型 GLM-4。

根据智谱 AI 的介绍,GLM-4 的整体性能相比上一代大幅提升,逼近 GPT-4。 具体包括:支持 128k 的上下文窗口长度,单次提示词可以处理的文本可以达到 300 页;在 needle test(大海捞针)测试中,128K 文本长度内 GLM-4 模型均几乎 100% 的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降问题等。

在多模态能力方面,我们也进行了尝试:(生成等待时间有点长,我们剪辑了下~)

输入“以智谱 AI 发布大模型为主题,制作一张图片”,最后生成的图片如下:

想看 GML-4 和 GPT-4 对比的“数据党”,可以看如下对比:

GLM-4 在 MMLU(81.5)达到 GPT-4 的 94%;GSM8K(87.6) 达到 GPT-4 的 95%;MATH(47.9)达到 GPT-4 的 91% ;BBH (82.25) 达到 GPT-4 的 99%;HellaSwag (85.4) 达到 GPT-4 的 90% ;HumanEval(72)达到 GPT-4 的 100% 水平。

此外,GLMs 个性化智能体定制能力同步上线。

用简单的提示词指令就能创建属于自己的 GLM 智能体并分享:(等待时间也略长,我们剪辑了下~)

想尝试的朋友可以智谱清言官网:https://www.chatglm.cn/

智谱 AI CEO 张鹏同时表示,GLMs 模型应用商店、开发者分成计划也即将发布。

此外,GLM-4 的 All Tools 能力全新发布。

基于 GLM 模型的 Agent 能力,GLM-4 实现了自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter 代码解释器和文生图 CogView3 模型。

GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及 Math23K 三个数据集上的结果,GLM-4 All Tools 取得和 GPT-4 All Tools 相当的效果。

处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。

2024 年,智谱 AI 也将发起开源开放的大模型开源基金,该计划包括三个“一千”:智谱 AI 将为大模型开源社区提供一千张卡,助力开源开发;提供 1000 万元的现金用来支持与大模型相关的开源项目;为优秀的开源开发者提供 1000 亿免费 API tokens。

张鹏表示,大模型开源基金的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。面对全球的大模型创业者,智谱 AI 也将“Z 计划”进一步升级,联合生态伙伴发起总额 10 亿人民币的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。

已经尝试了 GLM-4 的小伙伴,快来说说你的使用体验呀~

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

预览版“纯血鸿蒙”开放申请,中国开发者要为“四端”体验一致头痛了

挑战 Spark 和 Flink?大数据技术栈的突围和战争|盘点

谷歌放弃毛利率 99%业务:不想用我们的可以免费迁出!上云免费、下云无限“贵”的时代即将结束?

并发王座易主?Java 21 虚拟线程强势崛起,Go & Kotlin还稳得住吗 | 盘点

继续滑动看下一个

国产 GTPs 上线!智谱 AI 推出 GLM-4 全家桶,我们浅试了一下

褚杏娟 InfoQ
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存