【TechWeb】9月30日消息,昨日晚间,DeepSeek发布DeepSeek-V3.2-Exp大语言模型,凭借稀疏注意力(DeepSeek Sparse Attention, DSA)架构,以及超过50%的API成本大幅优化,再次刷新了行业技术标杆。
今日,人工智能基础设施及智算云提供商九章云极宣布已经完成在 Alaya NeW智算云平台高端GPU资源上的深度适配与集成DeepSeek-V3.2-Exp,提供一键化的全新模型的部署方案。
通过DSA一键化部署工具,企业可便捷地将DeepSeek V3.2 Exp大模型灵活部署于自有专属环境,实现模型与数据全链路的物理隔离,最大化防护核心业务数据免受外部风险威胁,无需担忧数据在外部平台流转或存储,满足企业的合规、隐私和行业敏感性需求。
九章云极云原生 Alaya NeW智算云平台集成了顶尖GPU计算资源,为DeepSeek-V3.2-Exp大模型的稳定运行与性能释放,提供了坚实的硬件和软件基础。该平台提供多样化资源形态,全方位满足不同应用场景的算力需求,支持云容器实例(CCI)、虚拟算力服务(VKS)、裸机算力服务(DKS)等多种资源模式,可灵活切换,从单卡小规模训练到千卡大规模推理均可秒级调
同时,平台同时集成Aladdin、LlamaFactory等主流AI工具生态,为用户从算力资源、开发工具到应用框架提供完整支持。一站式供给,覆盖研发到上线的全流程,无论是模型训练、推理还是微服务部署,都能快速适配,极大提升效率。
Alaya NeW智算云平台还创新推出Alaya NeW Serverless弹性资源调度体系,支持推理节点从0卡到1000卡的秒级弹性扩缩,用户可根据实际业务负载动态调整算力资源,避免资源浪费,确保始终以最佳性价比进行AI推理与应用创新。(果青)