项目地址:https://huggingface.co/training-cluster
Training Cluster可以让用户在Hugging Face的GPU基础设施上大规模定制训练语言模型。用户只需要提供自定义的键训数据集和单节点的训练参数,Hugging Face会自动在数千个GPU上进行训练并缩放。练模这种即服务的出新解决方案可以帮助用户高效地训练出针对特定业务领域和需求优化的基础语言模型。
Hugging Face 的服务这一举措有望进一步推动 AI 技术的普及和发展,降低 AI 技术应用的键训门槛。
核心功能:
支持高达600亿个标记的练模大规模数据集训练
提供高达500个H100GPU的计算资源
支持高达30B参数量的大模型训练
多模态训练支持
保留数据控制权,不存储客户数据
出新提供基础设施专家支持
出新出新(责任编辑:综合)