返回首页
enterprise2026-02-28

AT&T 如何用 AI 把成本砍掉 90%:企业级 AI 落地的最佳实践

作者: 毛创作官
AD SLOT — TOP

AT&T 如何用 AI 把成本砍掉 90%:企业级 AI 落地的最佳实践

引子:80 亿 Token/天意味着什么

80 亿。

这是 AT&T 每天通过 AI 系统处理的 Token 数量。

换个角度感受一下这个数字:GPT-4 处理一次普通对话大约消耗 1000-2000 个 Token。80 亿 Token 意味着每天相当于 400 万到 800 万次完整对话。如果按每次对话 30 秒计算,这相当于 3 万到 6 万个全职客服同时工作 24 小时的工作量。

AT&T 是一家拥有 16 万员工、服务 2 亿用户的电信巨头。这个体量的企业跑通 AI 落地,并把成本压低 90%,不是偶然——是系统性工程的结果。


AT&T 的三阶段落地路径

第一阶段:高频重复场景切入(2022-2023)

AT&T 没有从最复杂的问题开始,而是选择了最高频、最重复的场景:客服和内部工具

每天有数百万用户打电话询问账单问题、套餐变更、网络故障。这类对话有几个共同特征:问题模式固定、答案有标准流程、错误容忍度相对较高(答错了用户会再打一次)。

AT&T 先用 AI 处理这类"低风险高频次"的场景,积累了两件事:真实的生产数据内部对 AI 的信任

内部工具同步推进。工程师查文档、运维人员排查故障、销售团队查客户历史——这些内部场景的 AI 化,让员工在低压力环境下习惯了与 AI 协作。

第二阶段:网络智能化(2023-2024)

有了第一阶段的数据积累,AT&T 开始把 AI 推向更核心的业务:网络运维

电信网络的故障预测和流量调度,是传统上需要大量专家经验的领域。AT&T 用 AI 做了两件事:

  • 故障预测:分析历史故障数据,在设备真正宕机前 24-48 小时发出预警,让运维团队提前介入
  • 流量调度:实时分析全网流量分布,动态调整路由策略,减少拥堵和资源浪费

这一阶段的 AI 不再只是"回答问题",而是开始主动影响业务决策。这是企业 AI 落地的关键跃迁。

第三阶段:成本重构(2024-至今)

当 AI 使用量达到每天 80 亿 Token 的规模,AT&T 面临一个选择:继续按量付费给云厂商,还是自建推理基础设施?

答案是后者。

AT&T 开始大规模自建 GPU 集群,部署开源模型,把核心推理工作负载从外部 API 迁移到内部基础设施。这一步是成本从"可接受"变成"降低 90%"的关键。


成本降 90% 的技术拆解

90% 不是一个单一技术带来的结果,而是四个杠杆叠加的效果。

1. 规模效应:体量换折扣

80 亿 Token/天的体量,让 AT&T 在与云厂商谈判时拥有极强的议价能力。企业级合同的 Token 单价,可以比零售价低 60-80%。

启示:AI 成本不是线性的。用量越大,单位成本越低。这意味着企业应该尽快把 AI 使用量做上去,而不是等"想清楚了再大规模用"。

2. 模型选型:对的场景用对的模型

不是所有任务都需要最强的模型。AT&T 建立了一套模型路由机制:

  • 简单的 FAQ 查询 → 小模型(成本低 10 倍以上)
  • 复杂的网络故障分析 → 大模型
  • 代码生成和审查 → 专用代码模型

启示:企业 AI 成本优化的第一步,是建立"任务-模型"匹配矩阵。用 GPT-4 回答"我的账单是多少",是最贵的浪费。

3. 缓存机制:重复问题只算一次

电信客服有大量重复性问题。"如何查余额""套餐怎么升级""网络故障怎么报修"——这类问题每天被问数百万次。

AT&T 部署了语义缓存:相似的问题命中同一个缓存答案,不重复调用模型推理。缓存命中率达到 40% 以上,意味着近一半的请求几乎零成本。

启示:语义缓存是企业 AI 成本优化中被严重低估的手段。实现成本低,收益立竿见影。

4. 私有部署:减少外部 API 依赖

这是成本降幅最大的一步。自建推理基础设施后,边际成本接近于电费和硬件折旧,而不是按 Token 计费。

AT&T 选择的路径是:核心高频场景私有部署开源模型,长尾低频场景继续用云 API。这样既控制了主要成本,又保留了灵活性。


对企业 AI 落地的 3 个启示

启示一:从"能用"到"规模化"是两个完全不同的工程问题

很多企业的 AI 项目停在 POC 阶段——能跑通演示,但无法规模化。AT&T 的经验表明,规模化需要专门解决三个问题:稳定性(99.9% 可用性)、成本可控(不能随用量线性增长)、可观测性(知道 AI 在做什么、做得好不好)。

启示二:数据飞轮比模型本身更重要

AT&T 的竞争优势不是用了更好的模型,而是积累了更多的领域数据。16 万员工的使用反馈、数亿用户的交互数据、几十年的网络运维记录——这些数据让 AT&T 的 AI 越用越准,而竞争对手很难复制。

启示三:AI 落地是组织变革,不只是技术部署

AT&T 的 AI 项目成功,很大程度上是因为他们把 AI 当成重构工作流程的机会,而不是在现有流程上加一个 AI 工具。客服团队的工作方式变了,网络运维的决策流程变了,工程师的开发习惯变了。技术只是触发器,组织适应才是真正的挑战。


结语

AT&T 的案例证明了一件事:企业级 AI 落地不是"用不用"的问题,而是"怎么用"的问题。

80 亿 Token/天、成本降 90%,这个结果不是靠押注某个神奇的模型实现的,而是靠系统性的工程思维:选对场景、建对基础设施、跑通数据飞轮。

对于正在考虑 AI 落地的企业决策者,AT&T 的路径提供了一个可参考的框架:从高频重复场景切入,用数据积累建立优势,在规模化后重构成本结构。

这条路不容易,但 AT&T 证明了它走得通。


数据来源:AT&T 2025 年度报告及公开技术分享 | 发布日期:2026-02-28

AD SLOT — BOTTOM