快手自研大模型“快意(KwaiYii)”亮相,CMMLU 中文向排名第一

[知识] 时间:2024-04-20 08:34:18 来源:蓝影头条 作者:综合 点击:149次
8 月 21 日消息,快手近日,自研U中快手自研的大模第大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。型快

在最新的亮相 CMMLU 中文向排名中,快意的排名 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名,在人文学科、快手中国特定主题等方面较强,自研U中平均分超 61 分。大模第

查询快意 GitHub 页面发现,型快官方介绍显示:

快意大模型(KwaiYii) 是亮相由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),排名当前包含了多种参数规模的快手模型,并覆盖了预训练模型(KwaiYii-Base)、自研U中对话模型(KwaiYii-Chat)。大模第这里面我们介绍 13B 规模的系列模型 KwaiYii-13B,其主要特点包括:

KwaiYii-13B-Base 预训练模型具备优异的通用技术底座能力,在绝大部分权威的中 / 英文 Benchmark 上取得了同等模型尺寸下的 State-Of-The-Art 效果。例如,KwaiYii-13B-Base 预训练模型在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平。

KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYii-13B-Chat 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5)同等水平。

据了解,快手 AI 团队将持续迭代“快意”大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多 C 端与 B 端业务场景下的落地。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

(责任编辑:热点)

    相关内容
    精彩推荐
    热门点击
    友情链接