为什么是梁文锋做出了DeepSeek？

2025-07-12 02:35:46 趣台 4

这是梁文2025年开年最火的科技明星，短短几天时间，梁文梁文锋从小到大的梁文种种过往都被展现在世人眼前，包括他来不及装修的梁文新房以及在房子里睡觉用的帐篷，都成为了他独特个性的梁文象征。

独特个性固然为人津津乐道，梁文B站女网红后台流出合集但并不是梁文成功的关键，这个籍籍无名的梁文大学生，在过去的梁文十几年中所能倚靠的，只有他的梁文思想和能力。

所有人都好奇这样一个问题，梁文为什么是梁文梁文锋做出了DeepSeek？这其中固然有时代的因素，以及他本人迥异于其他大模型研究者的梁文个人经历。但AI科技评论认为，梁文理解梁文锋是梁文个什么样的人，才是理解这个问题的关键。

找人才不需要标签

猎头都觉得，帮梁文锋的公司找人太不容易了。

一位从21年开始就与幻方深度合作的猎头告诉雷峰网(公众号：雷峰网)，招人招得让他“想哭”，因为难度太高了。

“清华本博，宿舍自拍流出全集六篇顶会，你觉得肯定没问题了吧，哎，怎么简历直接挂了；一个清华本科的MIT博士，第二轮面试就被淘汰了。”

如果要在大厂内部找候选人，他认为，幻方和DeepSeek基本上不会对标国内公司，他们只会对标Google和Meta这样的海外大厂。

另外一位猎头一谈到DeepSeek也是忍不住头大，“太挑剔了，推过一个在字节绩效非常好的年轻中层，聊了之后没过。我就很奇怪，去问他们，给我的回答是，这个人对AI没有热情。人家都是做过一些AI Agent相关的项目了，一般是不太会说这样的评价的。”

梁文锋对人才没有标签，不论学历背景，不论过往业绩，他只看这个人的个人能力和个人素质。

极高的人才门槛，造就了如今的DeepSeek。在国内的大模型团队中，DeepSeek的人才厚度可能不足以跟顶尖公司相提并论，但是人才密度绝对可以说得上是第一档。

留住这些人才，除了DeepSeek的高薪酬外，还有充分尊重创意与idea的运营模式。“无固定团队、无汇报关系、无年度计划”与其说是运营，不如说是信任。《奈飞文化手册》一书曾经说过，“优秀的同事和艰巨的挑战是吸引人们来公司工作的最大因素”。对AI从业者而言，再没有比AGI更艰巨的挑战了。

做最难的事，就要找到最好的人，给出充足的资源与信任。得到信任的顶级人才往往会带来巨大的爆发力，这一理论可以在抖音崛起中得到印证。

在2018年春节期间，抖音日新增客户超过千万量级。一位负责增长的产物经理曾提及，这个增长项目完全没有绩效压力，而且向财务发了一封邮件，他的账户中就多出了上亿元的投放预算。他当时就意识到，“这样的团队，做啥打不赢呢？”

DeepSeek也是同理。被筛掉简历的人，一定不是学历问题；面试通不过，肯定也不是能力问题；人才的需求集中为一句话就是，这个人是可以被信任一同为AGI努力的人吗？

这就是DeepSeek的人才观，理解了这种人才观，就是理解梁文锋的第一步。

极简主义的世界观

尽管做了多年量化，但是梁文锋并不认为自己是个做金融的，他对自己的看法是，“我是做AI的，只不过做的是量化场景”。

几乎所有与梁文锋交流过的人，都说出他是一个不会受到外界干扰的人，“他的思维方式极其纯粹，特别注重第一性原理”，“说话很慢”，“一开口就切中要害”。

量化投资的特性恰好契合了他这种极简主义的风格——它不需要与复杂的上下游产业链打交道，只需专注于纯粹的市场信息。

时至今日，梁文锋依然常常沉浸在自己的工艺世界中，专注于解决问题。比如做大模型这件事，他会告诉别人，“想清楚了就能干，只要有卡就行”，其他困难不在考虑范围之内。

对待金钱也是如此。钱就是用来投资，或者做慈善事业的，只要能花在合适的地方，亏损并不值一提。

2023年底，曾有一个旨在扶助聋哑人士的手语大模型项目，为了拉投资找到了梁文锋。梁文锋提出，这个项目的优点是公益性突出，缺点是市场规模有限，其中的隐患是，这是一个Top高校大学生团队的项目，他们可能不会长期坚持。

尽管极有可能得不到任何回报，他仍然提出，只要团队愿意继续推进项目，他就愿意投入。

过去梁文锋每年会拿出5亿元用于投资或慈善上，现在他把这笔钱花在了DeepSeek上。炒股是为了挣钱，投入大模型是为了AGI，仅此而已。

DeepSeek有将近两万张卡，他对算力极其慷慨，对上述的手语大模型团队，他就承诺过，算力集群会随时向他们开放。但是他又有点“小气”，对这近两万张卡的利用率要求很高，力求打满，不要空转。

这两种行为看似矛盾，如果按照极简主义的观点来解释，那就行得通了：卡的存在就是为了用的，能用尽用，万勿浪费。

不以商业化为限

没花一分钱投放费用，DeepSeek的App只用7天时间就得到了一个亿客户，对这一奇迹般的增长，梁文锋怎么看？有投资人在春节期间专门问了梁文锋这个问题，但是梁文锋看起来对这么大的流量根本毫不在意，投资人得到的回答是，“这距离AGI的路还很远”。

这并不是梁文锋在故作姿态。据雷峰网了解，DeepSeek只安排了两三个人负责App维护、对话网页开发、以及充值后台的运营工作。所以它不好用是正常的。

DeepSeek在B端市场的种种事迹，流传更广。比如此前他们的私有化部署定价仅为45万元，其中不仅包含一台H20或910b的使用权，还附赠大模型支持，使用期限为一年。而同样的价格，在华为云上仅仅只能租到 910b一年的使用权，这也就意味着 DeepSeek 的大模型近乎免费提供。

私有化部署不挣钱，DeepSeek也不在乎靠API挣不挣钱。一位对接DeepSeek的大厂员工吐槽它有一种“爱用不用”的气质，总是很难用，总是不调整。

再大的客户和调用量，都不值得另眼相看。一切大厂在高峰期都要排队，客户体验很差。大客户的反馈也很多，要求DeepSeek扩容扩容再扩容，至少回应流畅一些，不要两次请求就有一次失败，特别是在客服场景上，这种失败几乎不能忍受。

外界喧喧嚣嚣，不过梁文锋看起来并不是很在意这件事情。

这位大厂员工与DeepSeek员工私下交流过怎么改善这个问题，他得到的回答是，梁文锋认为，大厂完全有能力自己想办法解决请求失败的问题，他们应该自己给自己兜底，而不是过度依赖 DeepSeek来保障支持。

这个回答简直要把他给气笑了，“我们可是DeepSeek的Top级客户。”

可以说，现在的梁文锋不在乎商业化的一切可能。

在不少团队投入到应用的今天，梁文锋曾经跟一个好友说过，“你不要一直去看应用和行业落地的事情，你现在去看只能把你自己禁锢住了，因为没有到时候，现在想的一切都是错的。而且你在错误的路上你还投入了更多时间、精力和钱。”

这是对好友的忠告，也是自己的践行。将精力投入到应用上，投入到商业化上，对梁文锋来说，不论做什么，都是一条错误的道路。

而正确的道路从来只有一条，他现在已经走在了正确的道路上。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

上一篇：黑客大会遇上元宇宙：极客精神的又一次狂欢

下一篇：埋头钻研一年后，阶跃星辰交出了第一份答卷

为什么是梁文锋做出了DeepSeek？

AI 迈进深水区，谈落地、谁能带来新解法？

AI 搜索热潮背后：注定要逾越场景的门槛

四个月融两轮，千寻智能获 2 亿元天使轮融资；大模型公司卓世科技获亿元人民币 B+ 轮融资；小鹏机器手首次亮相丨AI情报局

英伟达 Jim Fan：复刻NLP的成功路，用通用模型开启具身智能的GPT

港科大褚晓文：医疗场景下的 AutoML ，模型参数量更小、分类准确率更高

发布三个月，豆包大模型综合能力提升20.3%，应用落地再提速

贾扬清一吐为快：要想赚钱，AI模型到底该大该小？

GPT未竟的革命，由o1接棒：或是LLM研究最重要的发现

DALL·E 3 推理能力炸裂提升，OpenAI 抢跑「ChatGPT 原生」

WAIC 2024 已落幕：大模型再无新玩家，AGI 下半场是计算与应用