2025开源大模型回顾：小白/程序员必看！收藏这份深度指南，带你从零入门大模型时代

最新推荐文章于 2026-05-07 14:08:32 发布

原创最新推荐文章于 2026-05-07 14:08:32 发布 · 771 阅读

7 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#开源 #人工智能 #算法 #大模型学习 #学习

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

2025年，开源大模型迎来重大突破，DeepSeek、Qwen、Moonshot等中国力量崛起，性能超越顶级闭源模型。本文回顾了开源大模型的技术突破、关键模型、竞争格局、产业应用及未来趋势，剖析了开源与闭源的博弈，并展望了2026年AI发展新纪元，包括性能持续收敛、专用模型崛起、智能体成为新战场、具身智能产业化等趋势。对于想了解大模型发展路径和学习大模型的小白/程序员来说，这是一份不可多得的深度指南。

一句话总结：

2024 年 Llama 3 主导生态而 Qwen 与 DeepSeek 仍属小众，到了 2025 年二者分别凭借 R1[2] 和 Qwen 3[3] 一举成名，并带动国内公司纷纷开源其大模型。

图1 开源LLM模型生态图

2025 年是人工智能历史上一个决定性的转折点。这一点，我想是毋庸置疑的！！！

如果说 2024 年是 Meta Llama 3 一枝独秀，奠定了开源生态的基础，那么 2025 年则是以 DeepSeek、Qwen（通义千问）和 Moonshot AI（月之暗面）为代表的中国力量引领的“百花齐放”，彻底改写了全球 AI 的竞争格局。

DeepSeek R1 的横空出世，不仅在关键基准测试上实现了对 GPT-4o 等顶级闭源模型的超越，更以其极致的开放性和成本效益，点燃了全球范围内的开源创新浪潮。

本文旨在全面梳理和回顾2025 年开源LLM领域的技术突破、关键模型、竞争格局、产业应用以及未来趋势，深刻剖析这场正在发生的范式转移及其对整个科技产业的深远影响。

一、转折点——从边缘到主流的跃迁

2024 年回顾：Llama3[4]

开源地址：https://github.com/meta-llama/llama3

往前再次回望 2024 年，开源 LLM 生态系统很大程度上是围绕着 Meta 的 Llama 3 构建。Llama 3以其强大的性能和相对开放的许可证，成为了绝大多数研究机构和初创公司的首选基础模型。

Llama 3.1 采用标准 Transformer 架构，支持128K tokens 长上下文窗口，在 150 余个基准测试中展现出与 GPT-4、Claude 3.5 等闭源模型相当的效能。

Meta 的 Llama 3.1 系列虽然发布于 2024 年，但在 2025 年持续迭代，其 405B 参数版本实现多模态能力跃升，在数学推理、工具使用等场景对标顶级模型。

Qwen2.5 系列[5] ： 2024 年 9 月 19 日，阿里发布，包括 0.5B，1.5B，3B，7B，14B，32B 以及 72B，以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math 模型。

DeepSeek-V3[6]： 2024 年 12 月发布，参数量达 6710 亿，训练数据集规模为 14.8 万亿 tokens, 训练耗时约 55 天，成本约 558 万美元。在性能上，它超越了 Llama 3.1、Qwen 2.5 等模型，与 GPT-40、Claude 3.5 Sonnet 等模型相当。

然而，尽管当时中国的 Qwen2.5、DeepSeek V2/V2.5/V3 等模型已在技术圈内获得高度认可，展示出强大的潜力，但它们的全球影响力和普及度仍相对有限。

整个生态呈现出一种**“Llama 3 为主，百家争鸣为辅”的格局。这种格局虽然繁荣，但也暗含着对单一技术路线的依赖**，以及对更高性能、更低成本解决方案的深切渴望。

2025 年初：DeepSeek R1[7]的石破天惊

开源地址：https://huggingface.co/deepseek-ai/DeepSeek-R1

2025 年 1 月，深度求索（DeepSeek）发布了其革命性的模型——DeepSeek R1，专注于逻辑推理、数学推理和实时问题解决能力，特别在数学问题解决方面表现出色，准确率超过 90%。

这不仅仅是一次常规的模型迭代，更是一次蓄谋已久的“范式攻击”，它彻底打破了开源模型性能逊于闭源模型的固有印象，成为了引爆 2025 年开源革命的催化剂。

DeepSeek R1 的发布具有三重战略意义：

1、性能的颠覆： R1 在发布之初，就在多个全球公认的权威基准测试中，展现了与顶级闭源模型（如 OpenAI GPT-4o、Anthropic Claude 3.5 Sonnet）相当的甚至超越的惊人实力。尤其是在数学、代码生成和复杂推理这些被认为是 LLM 能力天花板的领域，R1 的表现尤为突出。这向世界证明，开源模型完全有能力触及甚至定义人工智能的能力边界。

2、开放的彻底性： DeepSeek R1 采用了极为宽松的 MIT 许可证，这意味着任何个人、学术机构或商业公司都可以免费使用、修改和分发，甚至用于商业目的，没有任何附加条件。这种彻底的开放姿态，与 Llama 系列附带商业限制的许可证形成鲜明对比，极大地降低了全球开发者和企业使用尖端 AI 技术的门槛。

3、成本效益的革命：更令人震惊的是，DeepSeek 宣称 R1 的训练成本和推理成本远低于同等性能的闭源模型，其 API 定价也极具颠覆性。据估算，其训练成本可能仅为海外顶尖模型的几十分之一这得益于其在混合精度框架、MoE（混合专家）架构等方面的技术创新。这标志着高性能 AI 不再是少数巨头的专利，“普惠 AI”的时代真正拉开了序幕。

**DeepSeek R1 的发布，如同一块巨石投入平静的湖面，激起了千层浪。**它不仅为自己赢得了全球声誉，更重要的是，它激励并带动了大量中国科技公司，如阿里巴巴、月之暗面等，更加坚定地走向开放，共同将 2025 年塑造成了开源 LLM 的“胜利之年”。

二、前沿三杰——重新定义技术巅峰

2025 年，全球开源 LLM 模型的最高峰由三家来自国内的组织占据：DeepSeek、Qwen 和 Moonshot AI。它们不仅在技术上你追我赶，更在开放策略和生态建设上相互辉映，共同定义了开源模型的 SOTA。

1、DeepSeek：开源革命

DeepSeek 在 2025 年的角色，不仅仅是一个模型提供者，**更像是一位深思熟虑的革命架构师。**其 R1 模型系列成为了衡量所有其他开源模型的黄金标准。

技术架构与模型特性：

DeepSeek R1 是一个拥有 671B 参数的稠密模型。其设计的核心是最大化推理能力，尤其是在逻辑、数学和编程方面。

与当时业界普遍追求更大参数规模的趋势不同，DeepSeek 似乎更专注于通过高质量数据、创新的训练方法和算法优化，在“中等”参数规模下实现极致性能，从而达成惊人的成本效益。

其低成本的实现，很大程度上归功于其在训练基础设施和算法层面的深度优化，例如高效的混合精度框架。

基准测试性能：

在当时，DeepSeek R1 的性能不仅在开源领域一骑绝尘，更是在多个高难度基准上直接挑战甚至击败了最强的闭源模型。

基准测试 (Benchmark)	DeepSeek R1 得分	GPT-4o 得分	Claude 3.5 Sonnet 得分
MMLU-Pro	84.0	72.6	78.0
MMLU (Overall)	90.8%	88.7%	-
GPQA Diamond	71.5%	-	-
LiveCodeBench	领先	落后于 R1	落后于 R1
AIME 2024	表现出色	-	-

注：闭源模型分数来自不同来源的交叉引用，可能存在微小差异。

开放策略与生态影响：

DeepSeek R1 的 MIT 许可证和极低的 API 价格，不仅吸引了全球范围内的开发者，还促使包括英伟达、亚马逊、微软在内的美国科技巨头宣布接入 DeepSeek-R1 ，这是对其技术领导地位的最终认可。

DeepSeek 用实际行动证明了，最极致的开放，可以带来最广泛的生态和最强大的影响力。

2、Qwen：全面均衡

技术报告：https://arxiv.org/pdf/2505.09388

如果说DeepSeek 是以“点”上的极致突破引爆市场，那么阿里巴巴的Qwen 团队则以“面”上的全面和均衡，构筑了同样强大的护城河。

阿里巴巴 Qwen 团队始终坚持开源与自研并行的路线，从 Qwen、Qwen1.5、Qwen2、Qwen2.5 到 Qwen3，其模型系列以稳健的迭代速度和卓越的性能表现，赢得了开发者社区的广泛认可。

其 Qwen2.5 系列在 2025 年持续进化，成为了另一个绕不开的开源模型系列，实现了两大跨越：

数据规模的飞跃：预训练数据量从 Qwen2 的 7 万亿 token 猛增至惊人的 18 万亿 token为模型的知识广度和深度提供了坚实基础。
架构的革新：引入了先进的 MoE（混合专家）架构并结合了复杂的监督微调（SFT）和多阶段强化学习（RL）技术显著提升了模型在知识、编码、数学和长文本处理等方面的综合能力。

**2025 年 4 月，Qwen3 发布，是 Qwen 系列大语言模型的最新成员。**其旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中，与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比，表现出极具竞争力的结果。此外，小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%，表现更胜一筹，甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

3、Moonshot AI (Kimi)：万亿参数的开源探索者

技术报告：https://arxiv.org/pdf/2507.20534

在 DeepSeek 和 Qwen 以极致性能和全面性震撼世界的同时，月之暗面（Moonshot AI）则以其对技术边界的无畏探索，开辟了开源模型的另一条路径——超大规模化。

其在 2025 年 7 月发布的 Kimi K2 模型，是全球首个真正意义上达到万亿参数规模的开源模型。

万亿参数与 MoE 架构的极致运用：Kimi K2 的总参数量高达 1 万亿，但其精妙之处在于采用了稀疏 MoE 架构。在每次推理时，模型仅激活约 320 亿的“活跃参数” 。这种设计使得 Kimi K2 能够在拥有巨大知识储备和潜力的同时，保持相对高效的推理成本，解决了超大模型难以落地应用的核心矛盾。
**训练规模与技术创新：**为了训练如此庞大的模型，Moonshot AI 使用了超过 15.5 万亿 token 的数据进行预训练。更重要的是，他们自研了名为 MuonClip 的优化器，用于稳定大规模模型的训练过程。这一技术创新，显著提高了训练的效率和可靠性，使得训练万亿参数模型不再是遥不可及的梦想。

三、群星闪耀——多元化的竞争格局

**2025 年的开源 LLM 生态呈现出一个健康而多元的多层次竞争格局。**不同定位的参与者各展所长，共同推动了整个生态的繁荣。

紧密竞争者 (Close Competitors)：

智谱 AI (Zhipu AI) 和 MiniMax 作为中国大模型领域的另外两股重要力量，在 2025 年同样保持着强劲的研发势头。

智谱的 GLM 系列模型，凭借其从早期就坚持开源开放的策略，积累了深厚的开发者社区基础。GLM-4.5[8] 是智谱 AI 的旗舰开源大语言模型，专为 AI Agent 应用设计。于 2025 年 7 月发布，代表了通过其创新的混合专家（MoE）架构，将大规模规模与实用性相结合的突破。
MiniMax则在模型综合能力和多模态探索上持续发力。MiniMax-M2[9] 重新定义了智能体的效率。它是一个紧凑、快速且具成本效益的 MoE 模型（总参数 2300 亿，活动参数 100 亿），旨在实现编码和代理任务中的精英表现，同时保持强大的通用智能。

值得关注的玩家 (Noteworthy)：

这一梯队汇集了国内外的大型科技公司和独角兽企业。

国内巨头：阶跃星辰 (StepFun)、蚂蚁集团 (InclusionAI)、美团 (LongCat) 和腾讯(Hunyuan)，它们依托自身丰富的业务场景和海量数据，积极布局开源模型。其策略往往是“应用驱动”，发布的模型或许不追求在通用榜单上登顶，但更注重与自身业务（如金融、电商、本地生活、社交）的深度结合，为特定场景提供最优解。
国际巨头： IBM、英伟达 (NVIDIA)、谷歌 (Google) 和 Mistral AI 构成了国际阵营的中坚力量。英伟达不仅是算力基石的提供者，也通过发布自己的模型，展示其软硬协同的生态能力。谷歌在其顶级闭源模型 Gemini 之外，也持续通过Gemma 等系列回馈开源社区。而来自法国的 Mistral AI，作为 MoE 架构的重要布道者，其早期工作为 Kimi K2 等模型的成功铺平了道路，持续在欧洲市场扮演着领导者角色。

专精型选手 (Specialists)：

2025 年，一个明显的趋势是“小而美”的专精模型的崛起，并非所有玩家都参与通用大模型的军备竞赛。

AI2 (Allen Institute for AI) 专注于科学研究领域，Moondream 推出轻量级视觉语言模型，Arcee 致力于特定领域的模型定制。
小米则将重心放在了端侧大模型的研发和落地，推动 AI 在智能手机等个人设备上的普及。2025 年 12 月 17 日，小米发布最新大模型：MiMo-V2-Flash[10]，旨在通过融合多种模态信息（如视觉、语音等），实现更自然、高效的人机交互体验，广泛应用于智能设备和虚拟助手等领域。
HuggingFace 作为全球最大的 AI 社区和模型托管平台，其本身也通过发布开源工具和模型，扮演着生态“赋能者”和“连接者”的关键角色。
值得一提的是，OpenAI 虽然以闭源闻名，但在 2025 年也进行了一些有限的开源尝试，这反映出即便是闭源的领导者，也无法完全忽视开源社区的巨大力量。比如 GPT-OSS。

崛起新势力与荣誉提名 (On the Rise & Honorable Mentions)：

字节跳动 (ByteDance Seed)、百度 (Baidu)、上海人工智能实验室 (InternLM) 等新老玩家在 2025 年也发布了有影响力的开源模型，显示出该领域的持续活力和巨大潜力。而 Meta，尽管其 Llama 3 在 2025 年的风头不及往昔，但它作为开启大模型开源时代的奠基者，其贡献和行业地位依然值得被铭记。

四、技术浪潮——驱动 2025 年的核心创新

2025 年开源 LLM 的集体爆发，背后是几大关键技术趋势的融合与成熟。

混合专家（MoE）架构： MoE 已从一种实验性架构，演变为 2025 年构建超大规模模型的事实标准。Qwen 和 Kimi K2 的成功实践证明 MoE 能够有效解耦模型的总参数量与单次推理的计算量，实现了“规模”与“效率”的兼得。这使得万亿参数模型从理论走向现实，成为开源社区能够驾驭的力量。

数据——迈向“数十万亿”Token 时代：**模型性能的天花板，很大程度上取决于训练数据的规模和质量。Qwen2.5 的 18 万亿 token 和 Kimi K2 的 15.5 万亿 token 标志着行业进入了数十万亿 token 的训练数据时代。竞争的焦点不再仅仅是数据量的堆砌，更在于数据清洗、多语言数据配比、高质量代码数据、以及利用合成数据进行“课程学习”**（Curriculum Learning）等精细化操作。

训练——效率优化与成本控制： 如果说算力是引擎，那么训练算法和工程优化就是变速箱。2025 年，以 DeepSeek 的低成本训练方法和 Moonshot 的 MuonClip 优化器为代表的技术创新，极大地提升了训练效率和稳定性。这使得训练 SOTA 级别的 LLM 不再是少数几家云巨头的专属游戏，更多的初创公司和研究机构获得了入场券。

推理优化——让大模型“飞入寻常百姓家”： 模型再强大，如果无法高效、低成本地部署，也只是“屠龙之技”。2025 年，推理优化技术取得了长足进步。vLLM、SGLang、TensorRT-LLM 等推理框架日趋成熟，INT8、INT4 等量化技术能够在几乎不损失性能的情况下，大幅降低显存占用和推理延迟。这些技术的普及，使得在消费级 GPU 甚至边缘设备上运行强大的开源 LLM 成为可能。

五、未解的二元性——开源与闭源的未来博弈

尽管 2025 年开源取得了历史性突破，但闭源模型在应用层的主导地位依然稳固。开源与闭源之间，形成了一种复杂、动态的竞合关系。

性能差距：弥合，但前沿仍在移动

从基准测试数据看，2025 年的顶级开源模型与顶级闭源模型在许多核心能力维度上已经基本持平，甚至在某些方面实现了反超。然而，这种“弥合”是动态的。OpenAI、Google、Anthropic 等闭源厂商很可能已经储备了更新一代、能力更强的模型。

闭源的优势在于能够集中全部资源，冲击技术的最前沿，而这些最前沿的能力，往往在发布数月甚至一年后，才会被开源社区通过不懈努力追赶上。

闭源模型在实际应用中依然占据主导，其原因在于：

极致的易用性： API 模式提供了一种“开箱即用”的体验，企业无需关心底层的硬件和运维，可以快速将 AI 能力集成到产品中。
成熟的生态系统：闭源厂商围绕其核心模型，构建了包括插件、应用商店、开发者工具链在内的完整生态，这种生态壁垒是单纯一个开源模型难以比拟的。
品牌与信任背书：对于许多寻求稳定和可靠服务的企业而言，闭源巨头的品牌本身就是一种质量保证。

生态赋能 vs. 产品为王

开源与闭源的竞争，本质上是两种不同发展战略的博弈。

开源战略：核心是商品化（Commoditization）和生态赋能。通过开放模型，将 AI 的基础能力变成像水和电一样的基础设施，从而在算力、云服务、开发者工具等生态链的其他环节获利。这是一种“卖水”和“修路”的模式，旨在做大整个 AI 产业的蛋糕。
闭源战略：核心是构建护城河和产品体验为王。通过保持技术上的领先代差，提供最卓越、最稳定的模型性能和最无缝的产品体验，直接吸引终端用户和企业客户付费。这是一种“开金矿”的模式，旨在分享最大块的蛋糕。

结论：展望 2026——开启全民 AI 的新纪元

回顾 2025 年，我们可以毫不夸张地说，这是开源 LLM 的“成人礼”。这一年，开源模型完成了从追随者到领导者的身份转变。以DeepSeek、Qwen、Moonshot AI 为代表的中国力量，不仅在技术上站上了世界之巅，更以彻底的开放精神，引领了全球 AI 的创新方向。

展望 2026 年及更远的未来，我们预见以下趋势：

1. 性能持续收敛：开源与闭源模型在通用能力上的差距将进一步缩小。企业的选择将更多地基于总体拥有成本、数据控制权、定制化需求和特定功能，而非单纯的性能指标。

2. 专用模型崛起：在强大的开源基座模型之上，将会涌现出大量针对特定行业（如法律、金融、生物医药）或特定任务（如科学计算、艺术创作）的高度优化的专用模型。

3. 混合模式成为常态：绝大多数企业将采纳混合 AI 策略——利用便捷的闭源 API 进行快速原型验证和处理非核心业务，同时在核心、数据敏感的业务场景中，部署经过深度定制和微调的私有化开源模型。

4. 智能体（Agent）成为新战场：随着模型推理、工具调用和长上下文能力的增强，具备自主规划和执行复杂任务能力的 AI 智能体，将成为 2026 年及以后的核心竞争焦点。开源社区凭借其庞大的开发者基数和快速迭代的优势，在这一新战场上拥有巨大的创新潜力。

5. 具身智能（Embodied AI）开启产业化进程：随着多模态理解、运动控制和环境交互技术的突破，2026 年将成为具身智能从实验室走向产业应用的关键节点。机器人将不仅能“听懂”指令，更能结合场景上下文进行自主决策与物理操作。家庭服务机器人、柔性制造助手、自主仓储物流系统等将率先实现规模化落地，推动 AI 从“数字世界”全面融入“物理世界”。

6. 边缘 AI 与分布式计算重构终端生态： 2026 年，随着模型轻量化技术与神经网络加速硬件的成熟，高性能 AI 模型将大规模部署至手机、汽车、IoT 设备等边缘终端。本地化推理不仅大幅降低延迟、保护隐私，更将催生“永远在线、即时响应”的真正个性化智能服务。云计算与边缘计算的协同架构，将重新定义人机交互的边界。

7. AI 与科学研究的双向革命进入深水区： AI for Science（AI4S）在 2025 年初步验证其在生物制药、材料设计、气候模拟等领域的潜力后，2026 年将迈向“自主科学发现”的新阶段。与此同时，科学家对 AI 机理的逆向探索（如神经科学启发的模型改进、物理规律嵌入的算法设计），也将推动 AI 理论范式的演进，形成“以 AI 发现科学，以科学重塑 AI”的双向飞轮。

8. 价值对齐与治理框架走向全球共识： 随着 AI 深度融入社会经济，国际社会将加速推动安全标准、伦理准则与治理机制的建立。开源生态因其透明性、可审计性，将成为验证对齐技术、探索合规方案的重要试验场。跨国机构、政府、企业、开源社区之间，将围绕可解释性、责任归属、价值校准等议题展开深度协作。

9. AI 原生应用引爆新业态： 基于自主智能体、多模态交互、实时环境感知等能力，2026 年将涌现出真正意义上的“AI 原生应用”：它们并非现有功能的自动化增强，而是从交互逻辑、服务形态到商业模式的全新创造。从“思考型 Copilot”迈向“执行型 Agent”，AI 将逐渐隐于幕后，成为无缝衔接数字与物理世界的智能中枢。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】