卓普云
客户成功案例

Character.ai:2倍吞吐量提升,成本降低50%

全球领先的AI娱乐平台借助DigitalOcean推理云平台与AMD深度协作,实现生产环境推理性能飞跃

2倍
吞吐量增长
50%
成本降低
10亿次
日查询量
Character.ai Logo

Character.ai

全球领先的AI娱乐平台

为全球2,000万用户提供高容量、低延迟的AI交互体验

2,000万用户
10亿次/日查询
超低延迟
持续增长

项目概览

DigitalOcean 云平台(NYSE: DOCN)凭借其推理云平台(Inference Cloud Platform)以及与 AMD 的软硬件深度协作,成功助力全球领先的 AI 娱乐平台 Character.ai 实现生产环境推理吞吐量的 2 倍增长。Character.ai 运行着目前市场上需求最苛刻的生产推理任务,每日处理的查询量高达 10 亿次。

Character.ai 是全球领先的 AI 娱乐平台,拥有约 2,000 万用户。其应用具有高容量、高并发且对延迟极度敏感的特点,其底层通过混合使用私有模型和开源模型来驱动。在将相关工作负载迁移至 DigitalOcean 推理云平台后,Character.ai 在严守延迟标准的同时,实现了请求吞吐量的飞跃。

核心成果

与标准的通用 GPU 基础设施相比,这一转型不仅将单 Token 成本降低了 50%,还为终端用户显著扩展了可用容量。

"我们对 DigitalOcean 在性能、延迟和规模方面提出了极其严苛的要求。而 DigitalOcean 提供了极其稳定的性能,释放了更高的持续吞吐量并优化了经济模型,这为我们平台的持续增长提供了直接动力。"

— David Brinker,合作伙伴关系高级副总裁,Character.ai

这一里程碑式的进展也标志着 DigitalOcean 在服务 Character.ai 等大规模 AI 客户方面的势头愈发强劲,进一步支撑了平台的全球扩张及更丰富的多模态体验。

软硬一体化:深度协同的性能优化

DigitalOcean 与 Character.ai 及 AMD 紧密合作,部署了专为推理任务优化的 AMD Instinct™ MI300X 和 MI325X GPU 云服务器。在 DigitalOcean 的平台中,GPU 服务器不再只是被视为通用的硬件资源,而是通过其平台集成的"硬件感知调度"和"优化推理运行时",将每个节点的持续性能榨取到了极致。

硬件层面

  • AMD Instinct™ MI300X GPU
  • AMD Instinct™ MI325X GPU
  • 专为推理任务优化

软件层面

  • AMD ROCm™ 开放软件栈
  • vLLM 推理框架优化
  • AITER Transformer 优化

AMD 在其开放的端到端 AI 软件栈 ROCm™ 上投入了巨资。通过三方的深度协作,各团队针对 Character.ai 在 DigitalOcean 平台上运行的 AMD Instinct™ MI300X 及 MI325X GPU,对 ROCm 配合 vLLM、AITER(AMD 专为 Transformer 工作负载打造的优化框架)以及部署配置进行了专项调优,最终实现了吞吐量的翻倍。

2倍吞吐量

在相同延迟约束下实现吞吐量翻倍

TCO优化

显著降低总体拥有成本

91%密度提升

单服务器请求密度大幅提升

准备好体验下一代AI推理平台了吗?

让我们帮助您实现性能飞跃,降低运营成本

400 800 3155
在线咨询
添加微信
联系我们
400 800 3155
在线咨询
添加微信
联系我们