蚂蚁集团 CTO 何征宇:坚决投入大模型底层基础设施,已建成万卡 AI 集群

[百科] 时间:2024-04-27 03:19:07 来源:蓝影头条 作者:综合 点击:169次
9 月 8 日消息,蚂蚁在 2023 外滩大会上,集团坚决建成集群蚂蚁集团宣布发布金融大模型,征宇并开源生成式 AI 编程平台 CodeFuse。投入

蚂蚁集团首席技术官、大模平台技术事业群总裁何征宇在接受采访时介绍,型底蚂蚁大模型走纯自研的层基础设技术路线,以全栈布局、施已长线发展为原则,蚂蚁以创造产业价值为目标。集团坚决建成集群为此,征宇蚂蚁坚决投入大模型底层基础设施,投入目前已建成万卡 AI 集群,大模训练效率领先行业,型底为大模型产业化应用提供有力支撑。层基础设

何征宇介绍,蚂蚁一直以来坚持核心技术自主创新,2022 年底正式立项大模型研发,目前已形成从基础大模型到行业大模型以及产业应用的全栈布局。

今天发布的蚂蚁金融大模型基于蚂蚁基础大模型,针对金融产业深度定制。何征宇介绍,蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练 MFU 可达到 40%,集群有效训练时长占比 90% 以上,RLHF 训练在同等模型效果下训练吞吐性能相较于业界方案提升 3.59 倍,推理性能相较于业界方案提升约 2 倍,处于业界先进水平。

何征宇表示,未来蚂蚁将持续探索和精进大模型的五大能力方向,总结如下:

一是,建设高质量的数据标注团队,沉淀高质量数据体系;

二是,攻坚基础大模型算法,以及高效绿色工程能力,提升模型逻辑推理等能力;

三是,从通用语言大模型到通用多模态大模型,从一般通识走向全面专业;

四是,建设高效的大模型评测标准和评测体系,加快大模型迭代速度;

五是,建设大模型安全能力,保障大模型健康可持续发展。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

(责任编辑:百科)

    相关内容
    精彩推荐
    热门点击
    友情链接