登录
首页 > 丰田汽车 > 从望模生叹到用模超级赞,只有一个天翼云CPU云主机的距离!

从望模生叹到用模超级赞,只有一个天翼云CPU云主机的距离!

发布时间:2025-03-11 20:08:54 发布用户: 15210273549

最近AI圈可谓热闹非凡

越来越多的企业正积极探索

如何将DeepSeek的能力与自身业务深度融合

而合理选择算力平台

将成为这场角逐中获胜的关键!

作为云服务国家队

天翼云始终致力于为企业

提供强大的算力支持

依托CPU的出色性能

显著的成本优势和便捷的使用体验

为更多用户的模型应用之路开辟算力捷径!

 

天翼云以CPU云主机

打破大模型算力的“不可能三角”

 

长期以来,企业入局大模型时会在算力平台选择上面临着性能、成本和便捷性的“不可能三角”。由传统方案“高成本=高性能”“大集群=高性能”的玩法带来的高成本“泥沼”,往往让众多企业在AI转型之路上“望模生叹”。

 

企业在探索模型应用的过程中也面临着同样的挑战。以某满血版模型为例,虽然它性能卓越,能为用户带来极致AI体验,但其部署成本不容小觑。如果选择传统方案,用户至少需要投入数百万元用于硬件采购、机房建设和运维,让众多中小型企业用户脑海里飘过三个字:玩不转!

 

是不是所有的模型服务场景

都必须用昂贵的方案?

作为云服务国家队

天翼云想用户之所想

以CPU云主机为企业带来破局之道!

 

仅需单台CPU云主机

即可低成本实现蒸馏版模型上云

 

天翼云提供规格丰富、性能卓越、配套完善的CPU云主机产品,第八代弹性云主机以其卓越的计算性能、高效的能源效率、强大的安全性和可靠性以及兼容性等特点,为用户提供全新的云上体验。尤其在AI加速方面,每个物理内核都具备AI加速功能,可直接对大参数量的AI模型进行推理和调优。

 

一台24C48G规格的天翼云第八代弹性云主机,搭载60G通用SSD系统盘,1M公网带宽,启用高级矩阵扩展(AMX)加速后,DeepSeek 7B蒸馏模型(BF16)推理速度能够超越9token/s,平均token生成速率提升21%,可满足大多数日常AI应用场景的需求。更为重要的是,总花费只需5.2022元/时!(注:5.088元/时 计算资源+0.0582元/时 存储资源+0.056元/时 网络资源)

AMX加速前后生成速率对比

此外,天翼云针对不同用户场景提供了对多个DeepSeek蒸馏版本的支持。为方便用户使用,天翼云推出了一键部署的云主机镜像,预装了
DeepSeek-R1-Distill-Qwen-7B模型、DeepSeek-R1-Distill-Qwen-14B模型、DeepSeek-R1-Distill-Qwen-1.5B模型及vLLM推理框架、开源的AI推理框架xFasterTransformer(xFT)加速库以及Open WebUI前端可视环境。用户只需在天翼云控制台选择相应的资源池和镜像,即可轻松开通云主机,一键部署DeepSeek大模型进行业务应用。

一键部署镜像实现DeepSeek大模型开箱即用

671B满血版DeepSeek

天翼云有妙招

 

在天翼云看来,DeepSeek-R1满血版全量参数虽然高达6710亿,但其采用稀疏注意力机制和混合专家模型(MoE)架构,意味着单token推理时仅需激活少量专家参数,这种特性不仅显著降低了推理过程中的算力要求,也与CPU的计算特点高度契合,使模型在CPU平台上展现出更高的运行效率。

 

对此,天翼云基于全新一代X86处理器,搭配高级矩阵扩展AMX,开展了DeepSeek-R1-671B(Q4_K_M社区量化版)的部署测试。测试结果表明,在单实例单socket(128核)模式下,DeepSeek-R1-671B在上述CPU平台上可达到平均9.7~10token/s的吞吐量,而在单机双实例部署模式下,总体吞吐量可提升至14.7token/s,这意味着单颗CPU构建的服务吞吐性能即可达到普通用户的日常使用需求,天翼云CPU云主机的通用计算型规格在成本和便捷性上优势明显。

 

本次实践证明,天翼云第八代弹性云主机的CPU系统能够有效支持DeepSeek大模型推理,并展现出符合行业基本需求的性能表现。无论处理轻量化蒸馏模型还是全功能满血模型,天翼云CPU云主机都能灵活应对不同规模的模型需求,高效满足用户场景,提供低成本且高效的解决方案。随着CPU架构、工艺的不断进步,以及更大缓存、更高内存带宽的加持,CPU平台将在模型应用之路上,为更多厂商和开发者开辟一条便捷之路。

 

此外,面向海量计算需求,搭载全新一代X86处理器的天翼云第九代弹性云主机也即将面世,并将在更专业的科学计算与AI应用带来性能提升,敬请期待!

Copyright 2018-2024 集齐豆 版权所有  京ICP备2018023569号