联想领跑大模型2.0时代，基础设施全面升级加速AI普惠

生成式AI的爆发式发展正在重塑应用生态，并对算力基础设施提出全新挑战。进入2025年，DeepSeek的横空出世加速了这一变革进程，同时也进一步凸显了算力基础设施面临的挑战。为助力企业应对新的挑战，基础设施相关产品和技术加快了迭代速度。

在5月7日举行的2025联想创新技术大会上，联想围绕基础设施宣布了六项创新技术（包括AI推理加速算法集、AI编译优化器、AI训推慢节点故障预测与自愈系统、专家并行通信算法、“飞鱼”仿生散热设计与浸没式制冷系统、算力服务“成本-效能”双优运营系统）以及两大重磅升级（联想万全异构智算平台3.0、算力基础设施），直指当前用户在落地AI应用时最为关切的痛点，旨在帮助用户升级基础设施，早日实现AI算力赋能业务。

助力人工智能快速落地，加速AI价值的充分释放

在人工智能向千行百业快速渗透的背景下，DeepSeek通过技术创新大大地降低了大模型的应用门槛，推动了AI普惠的进程，也标志着大模型逐步进入规模化落地新阶段。中国信通院云计算与大数据研究所所长何宝宏称其为“大模型2.0”阶段。

此前人们追求的是更大参数规模的大语言模型，如今人们开始关注如何让AI普惠，能以更高性价比让大模型落地，而DeepSeek就是一个标志——一个从对大模型的探索转向规模化应用的标志。

“此前人们追求的是更大参数规模的大语言模型，如今人们开始关注如何让AI普惠，能以更高性价比让大模型落地，而DeepSeek就是一个标志——一个从对大模型的探索转向规模化应用的标志。”

中国信通院云计算与大数据研究所所长何宝宏在联想AI算力基础设施技术创新论坛暨春季新品发布会主题演讲时表示。

中国信通院云计算与大数据研究所所长何宝宏

随着大模型2.0时代的来临，大模型的应用边界不断突破，催生了AI绘画、文本创作、代码生成等颠覆性应用，推动AI从辅助工具向生产力平台转变。这一转变导致算力需求结构发生根本性变化：传统以推理为主的算力模式，被训练与推理并重、且训练算力占比持续攀升的新模式取代。

为应对需求的变化，作为AI应用的能力底座，算力技术也在不断演进。联想集团副总裁、中国基础设施业务群总经理陈振宽在发布会上表示：“万卡、十万卡级算力集群的出现，要求在超大规模算力集群里，实现“算存网”能力的高效协同；而模型本地部署的应用潮流，又带来对大模型一体机单机性能的极致要求。此外，如何获得极致算力效率与能效也促使异构智算等技术创新快速取得突破。”

在这样的时代背景下，陈振宽介绍，联想正通过构建更强大、更高效、更稳定、更绿色的混合式基础设施，助力混合式人工智能快速落地，加速AI价值的充分释放。

具体举措包括：

深度构建以计算力、存储力、运载力为核心的AI基础设施，打造覆盖AI全场景、性能领先的AI算力产品组合；

持续升级联想万全异构智算平台，融入四大技术创新，为高效算力提供强大支撑；

坚定拥抱生态，全面打造万全生态，实现从芯片、系统再到应用的全栈能力整合，为客户提供多种一站式AI解决方案。

四大创新技术，打造智算平台差异化优势

联想万全异构智算平台就是上述战略的落地手段之一。联想万全异构智算平台是去年推出的一款算力管理平台。针对大模型预训练和传统模型推理的算力诉求，联想万全异构智算平台推出了五大技术，包括算力匹配魔方、超智融合调度、AI高效断点续训、联想集合通信库和GPU内核态虚拟化。

凭着这些创新，平台获得了22项核心发明，在多个应用案例中出创出佳绩。不过，联想并不满足现有的成绩，而是一直在打磨这一平台，在今年的联想创新科技大会上宣布重磅升级，推出了联想万全异构智算平台3.0。

联想万全异构智算平台的研发负责人、联想中国基础设施业务群战略管理部总监黄山介绍，联想万全异构智算平台3.0中新增的四大差异化技术就是为了助力众多用户在AI预训练、后训练、推理的过程中取得最高效、最稳定的算力。

AI推理加速算法集：通过实现MLA、投机推理等关键技术，结合联想自己的混合精度量化和分布式并行技术，最大程度地发挥GPU效能，使AI推理性能相对业界最优方案保持20%以上优势。

AI编译优化器：自动替换低效算子、优化计算路径并重新编译，大幅简化AI计算过程，节省算力和显存资源，相比同类编译器可降低训练和推理计算开销各15%以上。

AI训推慢节点故障与自愈系统：通过异步实时状态监测与全面故障分析，提前预知并自动化解决故障，将发现故障及自愈时间控制在百卡秒级、千卡分钟级、万卡十分钟级。

专家并行通信算法：通过协同优化通信计算原语、访存方式和网络路由算法，减少通信延迟和带宽占用，将推理延时降低至原来的1/3以下，同时将训推过程中网络带宽利用率从50%提升至90%。

联想领跑大模型2.0时代，基础设施全面升级加速AI普惠

生活学习更多>>