DeepSeek创始人梁文峰是个什么样的人？

最新推荐文章于 2026-06-18 14:16:48 发布

原创最新推荐文章于 2026-06-18 14:16:48 发布 · 6.6k 阅读

13 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #深度学习 #gpu算力 #学习 #机器学习

该文章已生成可运行项目，

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

DeepSeek热度一直爆棚，其创始人梁文峰也逐渐走入大众视野，作为一直关注大模型发展的开发者，我深入研究了一下梁文峰，真觉得这人不简单，今天就和大伙唠唠。梁文峰1985年出生在广东湛江，家庭条件很普通，父母都是小学语文老师。可他从小就在学习上展现出超强天赋，一路从吴川梅菉小学读到吴川一中，后来更是17岁就考入浙江大学电子信息工程专业，之后还拿下了信息与通信工程硕士学位。在校期间，他就对金融市场产生了浓厚兴趣，正好赶上2008年全球金融危机，他就带着团队尝试用机器学习技术做全自动量化交易，这为他之后的发展埋下了伏笔。毕业后，梁文峰投身金融领域。2013年，他和浙大同学一起创立了杭州雅克比投资管理有限公司，两年后，又成立了杭州幻方科技有限公司，也就是后来大名鼎鼎的幻方量化。

在2015年市场波动的时候，幻方靠着先进的高频量化策略脱颖而出。之后，梁文峰不断扩大AI算法研究团队，到2017年底，幻方几乎所有量化策略都用上了AI模型。随着业务发展，算力不够用了，2019年，他带着团队自主研发了“萤火一号”训练平台，后来又砸10亿打造“萤火二号”。到2021年，幻方资产管理规模突破千亿，成了国内量化私募的“四大天王”之一。但梁文峰的野心不止于此，2023年，他宣布进军通用人工智能领域，创办了DeepSeek 。别看DeepSeek团队只有139人，和OpenAI的1200人、Anthropic的500多人比起来，规模小得多，可取得的成绩却相当惊人。2024年5月，DeepSeek发布DeepSeek-V2模型，创新的架构让推理成本大幅降低，直接引发了国内大模型的“价格战” 。

梁文峰说他们不是故意当鲶鱼，只是想让算力普惠。去年12月发布的DeepSeek-V3，多项评测成绩超过其他开源模型，甚至能和顶级闭源模型一较高下，关键是训练成本极低，仅用2048颗英伟达H800 GPU，成本约557.6万美元，是GPT-4o的十分之一。今年1月发布的DeepSeek-R1，在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。从梁文峰的经历能看出，他是个极具创新精神的人。在量化投资领域，他早早把AI技术融入策略；做DeepSeek的时候，更是在模型架构、训练方法上大胆创新，突破了传统思路。而且他特别务实，不追求大团队、高成本，DeepSeek团队里很多都是应届毕业生和工作经验少的年轻人，他觉得创新就得摆脱惯性，经验有时候反而是包袱。

在商业考量上，他也不被短期利益左右，投身大模型研发，不是为了马上赚钱，更多是出于对AI能力边界的好奇。在我看来，梁文峰还是个有远见的技术理想主义者。他坚持DeepSeek走开源路线，主动分享技术成果，就像他说的，在颠覆性技术面前，闭源护城河不长久，开源能形成技术社区，推动行业发展。他深知中国AI不能永远跟随，必须有人站到技术前沿，而他就想成为那个人。所以，梁文峰不仅在技术上有硬实力，在理念上也给整个行业带来了新的思考，期待他未来能带着DeepSeek创造更多惊喜吧。

另外，另外对于有大模型训练需求的小伙伴，如果自己电脑跑不动，也可以找云服务器，七月份有羊毛可以薅yijiacloud.com.cn，注册就有50算力金.

本文章已经生成可运行项目