百川智能此次还开源了模型训练的面领 Check Point,并宣布将发布 Baichuan 2 技术报告,百川备全详细介绍 Baichuan 2 的发布训练细节,附 Baichuan 2 下载地址:https://github.com/baichuan-inc/Baichuan2
据百川智能官方介绍,开源Baichuan2-7B-Base 和 Baichuan2-13B-Base,大模均基于 2.6 万亿高质量多语言数据进行训练,型号先两个模型在数学、称文代码、理兼安全、逻辑推理、语义理解等能力有显著提升。
其中 Baichuan2-13B-Base 相比上一代 13B 模型,数学能力提升 49%,代码能力提升 46%,安全能力提升 37%,逻辑推理能力提升 25%,语义理解能力提升 15%。
▲ 图源“百川智能”公众号,下同在 MMLU、CMMLU、GSM8K 等基准测试中,百川智能的两个模型都比 LLaMA 2 的分数要高一些,且在“中文通用”部分优势较大。
▲ 7B 参数模型的 Benchmark 成绩▲ 13B 参数模型的 Benchmark 成绩Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。
(责任编辑:焦点)