随着 IT 领域的持续演变,新的趋势正在涌现并有望在 2025 年重塑企业对待技术的方式。从生成式 AI 到数据主权,未来一年各行各业都将面临重新思考其战略以适应新变化的挑战。基于关键观察与行业信号, 以下是 Ampere 对 2025 年做出的四大预测。
趋势一
从实验到执行:生成式 AI 推理成为焦点
生成式 AI 正在从单纯的实验性工具转变为能够提供巨大商业价值的全面集成解决方案。虽然在过去一年中,生成式 AI 的应用主要集中在基于公共数据的聊天机器人上,但未来的重点是将其应用于私密、安全的数据集,以创建更具价值的工具。金融、保险和电子商务等行业的企业正准备采用这些技术,从专有数据中提取有价值的见解。
部署灵活性将至关重要。随着 AI 工作负载扩展到各种环境——包括本地部署、边缘和气隙(air-gapped)隔离托管设施——对延迟敏感的应用程序将要求基础设施更接近用户,部署在现有数据中心和接入点(PoPs)中。此外,推理不再是一个独立的工作负载。支持检索增强生成(RAG)和应用集成等任务将需要强大的通用计算与 AI 专用资源相结合,同时强调效率与可扩展性。
趋势二
推动未来发展:可再生能源增长叠加效率提升
随着计算需求的激增,电力需求也在快速增加。然而,电网过载与地域性电力限制正迫使各行业寻求新的解决方案。随着小型、区域分布式数据中心的出现,太阳能、风能和地热等可再生能源逐渐受到青睐。这些项目的发展需要更长的时间,才能满足 IT 基础设施增长的即时需求。
然而,效率的提升刻不容缓。为了避免短期内采用新型不可再生能源或延长其使用寿命,硬件优化将在减少电力需求方面发挥关键作用。用现代高效的处理器替代老旧的高能耗系统,可以大幅降低能耗,使现有基础设施更具可持续性。这种效率转变对于在增加能源需求和兼顾环境管理责任之间取得平衡至关重要。
趋势三
密度增长:充分释放每个机架与数据中心的潜能
鉴于 AI 计算需求的快速增长,大规模密度已成为计算效率的新基准。解决方案的构建不再局限于节点层面,而是扩展到了机架和数据中心层面。这意味着企业正在通过充分利用现有硬件来最大化每个机架的工作负载。与因效率低下而常常导致资源利用不足的传统系统不同,现代架构设计旨在消除浪费,并提高机架和数据中心规模上的平均利用率,同时避免不可预测性带来的负面影响。
在解决方案层面,密度优化的挑战不仅局限于 AI 专用(AI-only)工作负载。某些 AI 工作负载,特别是推理型工作负载,正在推动基础设施变革以适应混合用途环境,而通用计算密度也同样重要。在软件工程组织中,更高效的虚拟化和容器化技术结合更高效的容器和 PAC(power aware coding)实践,将实现更好的资源划分,使企业能够在不牺牲性能的情况下实现更高的利用率。
趋势四
主权与安全:企业级 AI 崛起
数据主权与安全将在 2025 年对 AI 部署策略产生重要影响。企业越来越多的认识到专有数据集的价值,并将其视为具有竞争力的资产。这一转变意味着,AI 推理工作负载不仅将在超大规模的公有云上运行,还会在更安全的环境中运行,如私有云、本地数据中心或私有托管设施。
数据泄露和 AI 算法篡改的风险凸显了对安全、隔离基础设施的需求。随着企业在 AI 驱动创新领域展开竞争,保护知识产权和敏感信息的能力将成为成功的关键。此外,这一趋势还将扩大企业自有计算资源的作用,创建一个更加分散和安全的 AI 生态系统。这种主权和安全需求,再加上需要将计算资源放在更靠近用户的地方,将分散计算资源,并催生计算量更大的边缘架构。
全部0条评论
快来发表一下你的评论吧 !