颠覆美国AIDeepSeek，老板竟是85后土鳖 (中国论坛)

作者: admin , 发表于: 星期一, 一月 27, 2025, 08:45 (138天前)

颠覆美国AIDeepSeek，老板竟是85后土鳖

　　2025年的开年，总理主持的新年首场专家、企业家座谈会，一位年轻人的出席让人眼前一亮。他就是85后创业者梁文锋，深度求索（DeepSeek）和幻方量化的创始人。他不仅是量化投资领域的“王者”，更是人工智能领域的先锋。他领导的团队仅用2048张GPU，在53天内打造出全球领先的大模型“DeepSeek-V3”，用极低成本完成了对美国OpenAI的技术“逆袭”。

　　在座谈会上，梁文锋提出了关于国产大模型发展的独到见解。他低调却充满力量的形象，成为中国科技力量崛起的缩影。从一位普通的湛江少年，到震撼硅谷的AI创新者，他的故事，是一段关于技术、勇气和坚持的传奇。
　　01 少年成才：从湛江到浙江大学
　　1985年，梁文锋出生在广东湛江的一个普通家庭。湛江当时是一个经济发展缓慢的三线城市，他的父亲是一名小学老师，家庭并不富裕，但却给了梁文锋充满智慧和坚韧的成长环境。自幼，梁文锋便展现出对数学和科学的天赋，他对数字与逻辑的敏感性远超同龄人，这也让他成为老师和同学眼中的“学霸”。

　　最后一排右边第6个是梁文锋。
　　2002年，17岁的梁文锋以优异成绩考入浙江大学电子信息工程专业，成为家族中第一个进入顶尖高校的孩子。在当时，浙大是一所注重理工科发展的高校，而电子信息工程又是其中的王牌学科。对梁文锋来说，这是一个开拓视野的全新舞台。在浙大的四年本科生活里，他不仅刻苦学习，还积极参加各种数学建模竞赛，逐渐在学术圈小有名气。
　　
　　梁文锋的求学历程
　　本科毕业后，他并没有选择直接就业，而是继续在浙江大学攻读硕士，研究方向从电子信息转向了更具前沿性的机器视觉。他的导师项志宇教授是国内这一领域的专家，这段时期让梁文锋的学术能力得到了极大的提升，也让他进一步接触到了人工智能领域的技术发展。

　　然而，与许多追求“高薪体面”工作的同学不同，梁文锋的目标从来不局限于做一名普通工程师。他在学术研究之余，开始关注更大的产业变革方向，尤其是人工智能在实际场景中的应用。他坚信，科技将成为未来社会的核心驱动力，而自己必须抓住这场时代机遇。
　　正是这份“走在别人前面”的勇气与决心，让梁文锋在大学期间便踏上了一条充满挑战的路。他带领一群志同道合的伙伴，尝试用机器学习的方法分析金融市场数据，甚至在全球金融危机的阴影下，探索全自动量化交易的可能性。这些“超前”的尝试，逐渐成为梁文锋未来事业的基石，也奠定了他走向世界科技舞台的起点。

　　此图来自幻方官网
　　02 量化投资的崛起：从“幻方”开始书写传奇

　　2008年，全球金融危机爆发，这对传统金融市场带来了深远影响，却也让技术驱动的量化交易迎来了发展的契机。当时，尚在浙大读研究生的梁文锋敏锐地察觉到，技术和数据可以重塑金融市场。他带领一群志同道合的同学，用机器学习方法分析市场数据，尝试实现全自动量化交易。他们采集海量的市场行情数据、宏观经济信息，并用数学建模的方法研究价格波动规律。这些探索不仅为梁文锋积累了实践经验，也为他日后的创业埋下了伏笔。
　　2013年，梁文锋与浙大校友徐进共同创办了杭州雅克比投资管理有限公司，正式迈入量化投资的世界。尽管当时的量化投资在国内还处于起步阶段，但梁文锋凭借对技术的信仰和对市场的深刻理解，坚定地相信这是金融领域的未来。

　　2015年，中国量化投资行业迎来了重要节点——中证500股指期货的上市。这为量化私募提供了更丰富的对冲工具，也标志着行业进入2.0时代。同年，30岁的梁文锋与徐进正式创办幻方量化（High-Flyer），用技术重新定义投资策略。他们的愿景是通过数学建模和人工智能，成为世界顶级量化对冲基金。
　　初创阶段的幻方量化，仅凭10张GPU显卡完成了多项产品的设计和发布。在2015年的“股灾”中，梁文锋的高频量化策略帮助团队取得了不错的成绩，吸引了大量资金和客户的关注。短短一年内，幻方量化成立了20只产品，快速扩张资金管理规模。这种依靠技术驱动的高效率运作模式，使幻方迅速成为量化投资领域的佼佼者。
　　2016年，梁文锋带领团队推出了第一个由深度学习算法驱动的AI模型，并开始将GPU引入计算交易仓位。这在国内量化领域尚属首创。当年年底，幻方量化的管理规模突破10亿元。随后几年，梁文锋不断扩大AI算法研究团队，将人工智能技术深度融入量化策略，逐步取代传统模型。
　　2018年，幻方量化首次获得了中国私募证券领域的最高奖项——私募金牛奖，这标志着它在行业内的领先地位。与此同时，团队也开始遇到算力瓶颈。梁文锋再次展现了他对技术的执着，投入巨资研发“萤火一号”深度学习平台，为幻方量化提供大规模算力支持。
　　2019年，幻方量化的管理规模突破百亿元，正式跻身国内顶级量化私募行列。2021年8月，幻方量化的资金管理规模一度突破千亿，成为行业内的“量化四大天王”之一。这一年，梁文锋在金牛奖颁奖典礼上发表演讲，指出“量化投资的未来，是用技术让市场更有效率”。
　　
　　梁文锋在金牛奖颁奖典礼现场

　　然而，辉煌的背后也伴随着挑战。2021年底，由于市场波动和技术决策问题，幻方的业绩出现回撤，团队决定主动缩减管理规模并暂停新产品募集。这一决定虽然短期内带来了质疑，却体现了梁文锋对风险控制的高度敏感。
　　
　　2021年，梁文锋还带领幻方先于一些云厂商拿到英伟达A100显卡，并且其AI集群搭载显卡的数量达到“万卡级别”。有报道称，当时国内超过1万枚GPU的企业不超过5家，而且除了幻方之外，其他4家公司都是互联网大厂。
　　
　　英伟达创始人黄仁勋介绍显卡产品
　　尽管幻方量化的规模有所收缩，但梁文锋的技术信仰从未动摇。他通过量化投资的实践，证明了科技在金融领域的深远价值。而幻方的成功，也为他积累了足够的资本和资源，支持他在人工智能领域开启新的征程。
　　03 跨界AI：DeepSeek的横空出世
　　2023年，38岁的梁文锋再次选择站在技术浪潮的最前沿。这一次，他瞄准的是更具前景和挑战的人工智能领域。他创办了深度求索（DeepSeek），这是一家专注于AI大模型研发的公司，目标是用低成本、高性能的技术，打破国际巨头在人工智能领域的垄断。
　　
　　梁文锋对人工智能并不陌生。在幻方量化的崛起过程中，人工智能早已成为量化策略的核心驱动力。而这次，他决定跳出金融行业，把自己对技术的热情倾注到人工智能的大模型研发中。他的思路十分明确——通过技术创新和成本优化，让AI技术更加普惠。他直言：“我们不是要跟随，而是要在技术上真正超越。”
　　2024年：DeepSeek的爆发之年。在成立仅一年后，DeepSeek就凭借其创新能力，成为AI领域一颗耀眼的新星。2024年5月，DeepSeek发布了其首款混合专家语言模型DeepSeek-V2。这一模型以超低的价格震惊市场：每百万tokens输入1元、输出2元，仅为GPT-4 Turbo价格的百分之一。凭借出色的性能和性价比，DeepSeek-V2引发了一场大模型价格战，国内外科技巨头纷纷跟进降价。
　　然而，DeepSeek的真正爆发点出现在2024年12月。梁文锋带领团队推出了新一代大模型DeepSeek-V3。这款模型不仅在数学运算、代码生成和中文问答等方面表现出色，更令人震惊的是，它的训练成本仅为557.6万美元，而OpenAI的GPT-4o训练成本高达7800万美元。DeepSeek-V3以1/10的成本实现了对GPT-4o的全面对标，被美国科技圈称为“来自东方的神秘力量”。
　　
　　DeepSeek-V3的各项测试结果与同行对比
　　DeepSeek的成功并非偶然，而是梁文锋在团队管理和技术研发上的一系列独特策略的结果。他组建了一支完全由本土年轻程序员组成的团队，不依赖海归(专题)或高级技术专家。团队成员大多是应届毕业生或工作经验不超过5年的年轻人。梁文锋认为，“创新需要摆脱惯性，经验有时会成为包袱。”
　　此外，DeepSeek采取了开源的技术策略，主动向全球开发者社区分享核心技术成果。这种开放的态度不仅赢得了国际认可，也推动了行业技术生态的快速发展。OpenAI的创始成员安德烈·卡帕西（Andrej Karpathy）评价说：“DeepSeek在有限资源下展现了惊人的工程能力，它可能重新定义大模型研发的规则。
　　
　　DeepSeek的技术突破让美国硅谷震撼不已，多位业内人士称，DeepSeek-V3的问世打破了全球AI巨头的“成本壁垒”。有评论认为，DeepSeek在降低算力需求、优化训练效率上的创新，可能会彻底改变AI行业的生态。
　　然而，梁文锋并未急于将DeepSeek商业化。他坚信，人工智能领域的成功取决于长期的技术积累，而非短期的盈利目标。他表示，DeepSeek的使命是“以更低的成本、更高效的技术推动人工智能的普及”，并始终把技术研发置于首位。
　　04 技术驱动未来：中国科技的崛起力量
　　梁文锋始终站在技术创新的最前沿。从量化投资到人工智能，他不断用实践证明，中国科技不仅能参与全球竞争，更能引领技术变革。他认为，中国科技企业不能永远跟随，而是要勇敢站到前沿。
　　深度求索的成功，证明了他的远见和坚持。在全球AI竞争愈发激烈的今天，梁文锋用技术和创新，让中国AI力量在国际舞台上赢得了一席之地。正如他所说：“我们不只是追赶，更要在核心技术上实现真正的超越。”
　　梁文锋，这位85后中国小伙，正用他的低调和实力，为中国科技书写更多震撼全球的故事。

发表回复

306次阅读

主题RSS Feed

《中国论坛》是综合性论坛

颠覆美国AIDeepSeek，老板竟是85后土鳖 (中国论坛)