智谱 AI 宣布 GLM-4-Flash 大模型免费开放：支持中文、英语、日语、韩语等 26 种语言 [复制链接]

gythy1978

军衔等级：

少将

电梯直达

1^# 大中小

发表于 2024-8-27 17:38:35

来自手机 |只看该作者 |倒序浏览

IT之家 8 月 27 日消息，智谱 AI 今日宣布，GLM-4-Flash 大模型免费开放，通过智谱 AI 大模型开放平台调用。

GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务，生成速度能达到 72.14 token/s，约等于 115 字符/s。

GLM-4-Flash 具备多轮对话、网页浏览、Function Call（函数调用）和长文本推理（支持最大 128K 上下文）等功能，同时支持包括中文、英语、日语、韩语、德语等在内的 26 种语言。

官方表示，通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法，在推理层面实现模型的延迟降低与速度提升，更大并发量和吞吐量不仅提升了效率，而且让推理成本显著降低，从而免费推出。

在预训练方面，官方引入了大语言模型进入数据筛选流程，获得 10T 高质量多语言数据，数据量是 ChatGLM3-6B 模型的 3 倍以上；同时采用了 FP8 技术进行预训练，提高了训练效率和计算量。

IT之家附相关链接如下：

体验地址：https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash

说明文档：https://open.bigmodel.cn/dev/api#glm-4

本主题由版主或管理员于 2024-8-27 17:47 审核通过

0 举报本楼

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2024-12-29 09:26 , Processed in 0.108162 second(s), 16 queries , Gzip On.

Discuz Licensed

回顶部

		自动登录	找回密码
密码			注册