DeepSeek创始人梁文峰是个什么样的人?

该文章已生成可运行项目,

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

DeepSeek热度一直爆棚,其创始人梁文峰也逐渐走入大众视野,作为一直关注大模型发展的开发者,我深入研究了一下梁文峰,真觉得这人不简单,今天就和大伙唠唠。 梁文峰1985年出生在广东湛江,家庭条件很普通,父母都是小学语文老师。可他从小就在学习上展现出超强天赋,一路从吴川梅菉小学读到吴川一中,后来更是17岁就考入浙江大学电子信息工程专业,之后还拿下了信息与通信工程硕士学位 。在校期间,他就对金融市场产生了浓厚兴趣,正好赶上2008年全球金融危机,他就带着团队尝试用机器学习技术做全自动量化交易,这为他之后的发展埋下了伏笔。 毕业后,梁文峰投身金融领域。2013年,他和浙大同学一起创立了杭州雅克比投资管理有限公司,两年后,又成立了杭州幻方科技有限公司,也就是后来大名鼎鼎的幻方量化 。

在2015年市场波动的时候,幻方靠着先进的高频量化策略脱颖而出。之后,梁文峰不断扩大AI算法研究团队,到2017年底,幻方几乎所有量化策略都用上了AI模型。随着业务发展,算力不够用了,2019年,他带着团队自主研发了“萤火一号”训练平台,后来又砸10亿打造“萤火二号”。到2021年,幻方资产管理规模突破千亿,成了国内量化私募的“四大天王”之一 。 但梁文峰的野心不止于此,2023年,他宣布进军通用人工智能领域,创办了DeepSeek 。别看DeepSeek团队只有139人,和OpenAI的1200人、Anthropic的500多人比起来,规模小得多,可取得的成绩却相当惊人。2024年5月,DeepSeek发布DeepSeek-V2模型,创新的架构让推理成本大幅降低,直接引发了国内大模型的“价格战” 。

梁文峰说他们不是故意当鲶鱼,只是想让算力普惠。去年12月发布的DeepSeek-V3,多项评测成绩超过其他开源模型,甚至能和顶级闭源模型一较高下,关键是训练成本极低,仅用2048颗英伟达H800 GPU,成本约557.6万美元,是GPT-4o的十分之一 。今年1月发布的DeepSeek-R1,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版 。 从梁文峰的经历能看出,他是个极具创新精神的人。在量化投资领域,他早早把AI技术融入策略;做DeepSeek的时候,更是在模型架构、训练方法上大胆创新,突破了传统思路 。而且他特别务实,不追求大团队、高成本,DeepSeek团队里很多都是应届毕业生和工作经验少的年轻人,他觉得创新就得摆脱惯性,经验有时候反而是包袱 。

在商业考量上,他也不被短期利益左右,投身大模型研发,不是为了马上赚钱,更多是出于对AI能力边界的好奇 。 在我看来,梁文峰还是个有远见的技术理想主义者。他坚持DeepSeek走开源路线,主动分享技术成果,就像他说的,在颠覆性技术面前,闭源护城河不长久,开源能形成技术社区,推动行业发展 。他深知中国AI不能永远跟随,必须有人站到技术前沿,而他就想成为那个人。所以,梁文峰不仅在技术上有硬实力,在理念上也给整个行业带来了新的思考,期待他未来能带着DeepSeek创造更多惊喜吧。

另外,另外对于有大模型训练需求的小伙伴,如果自己电脑跑不动,也可以找云服务器,七月份有羊毛可以薅yijiacloud.com.cn,注册就有50算力金.

本文章已经生成可运行项目

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值