京东云推出 vGPU 池化方案，可令“大模型推理大幅降本”-蓝影头条

当前位置：当前位置：首页 >综合 >京东云推出 vGPU 池化方案，可令“大模型推理大幅降本” 正文

京东云推出 vGPU 池化方案，可令“大模型推理大幅降本”

[综合] 时间：2024-04-25 12:22:56 来源：蓝影头条作者：时尚点击：53次

8 月 15 日消息，京东降本京东云已推出 vGPU 池化方案，云推“该方案可提供一站式 GPU 算力池化能力，出vU池令 GPU 利用率最高提升 70%，化方大幅降低大模型推理成本”。模型

▲ 图源京东云官方公众号

京东云表示，推理凭借其“自主研发的大幅混合多云操作系统云舰”，京东云在原有支持混合多云 CPU 算力池化能力基础上，京东降本针对大模型训练所需的云推泛算力池化能力，进一步增加了针对 AI 应用所需的出vU池调度管理能力，包括卡管理、化方节点管理、模型异构资源调度管理等，推理为包括大模型训练在内的大幅多种 AI 应用，提供一站式算力池化解决方案，京东降本从而全面提升资源利用率。

京东云同时称，自家池化方案具有四大优势，转录相关内容如下：

算力切分灵活：支持任意比例切分和动态调整机制，可实现按显卡算力、显存做细粒度切分，一张物理卡可供多个容器使用，与整卡算力相比，性能衰减在 2% 以内。

精细化配额管理：支持灵活的配额管理，按显卡型号 / label 配额，有效保障资源按需分配，提升推理稳定性和训练性能。

多场景适配：适配主流 CUDA 版本和不同 GPU 芯片适配，支持 TensorFlows、Pytorch 等行业主流的 AI 训练框架。

多节点管理：支持节点虚拟分组和节点组指定应用使用，全面提升大模型训练效率。

京东云表示，在使用场景中，开发者可以根据卡型号申请资源，按算力和显存切分，统一由控制器根据用户指定的调度策略调整。仅在训练、微调和推理任务启动时进行动态分配，在任务结束即可以释放，支持多任务算力隔离和任务冷启动。

从实践效果看，通过 GPU 异构资源池化，AI 运行效率显著提高，整体 GPU 利用率提升 70%。结合任意切分和按需分配，在同等 GPU 数量的前提下，实现了数倍业务量扩展和资源共享，降低了硬件采购成本，使用更少的 AI 芯片支撑了更多的训练和推理任务。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，所有文章均包含本声明。

(责任编辑：休闲)

欧美在西非驻军，为什么纷纷被下“逐客令”？斯佳辉“绝杀”晋级斯诺克世锦赛16强