颠覆美国AIDeepSeek,老板竟是85后土鳖 (中国论坛)
颠覆美国AIDeepSeek,老板竟是85后土鳖
2025年的开年,总理主持的新年首场专家、企业家座谈会,一位年轻人的出席让人眼前一亮。他就是85后创业者梁文锋,深度求索(DeepSeek)和幻方量化的创始人。他不仅是量化投资领域的“王者”,更是人工智能领域的先锋。他领导的团队仅用2048张GPU,在53天内打造出全球领先的大模型“DeepSeek-V3”,用极低成本完成了对美国OpenAI的技术“逆袭”。
在座谈会上,梁文锋提出了关于国产大模型发展的独到见解。他低调却充满力量的形象,成为中国科技力量崛起的缩影。从一位普通的湛江少年,到震撼硅谷的AI创新者,他的故事,是一段关于技术、勇气和坚持的传奇。
01 少年成才:从湛江到浙江大学
1985年,梁文锋出生在广东湛江的一个普通家庭。湛江当时是一个经济发展缓慢的三线城市,他的父亲是一名小学老师,家庭并不富裕,但却给了梁文锋充满智慧和坚韧的成长环境。自幼,梁文锋便展现出对数学和科学的天赋,他对数字与逻辑的敏感性远超同龄人,这也让他成为老师和同学眼中的“学霸”。
最后一排右边第6个是梁文锋。
2002年,17岁的梁文锋以优异成绩考入浙江大学电子信息工程专业,成为家族中第一个进入顶尖高校的孩子。在当时,浙大是一所注重理工科发展的高校,而电子信息工程又是其中的王牌学科。对梁文锋来说,这是一个开拓视野的全新舞台。在浙大的四年本科生活里,他不仅刻苦学习,还积极参加各种数学建模竞赛,逐渐在学术圈小有名气。
梁文锋的求学历程
本科毕业后,他并没有选择直接就业,而是继续在浙江大学攻读硕士,研究方向从电子信息转向了更具前沿性的机器视觉。他的导师项志宇教授是国内这一领域的专家,这段时期让梁文锋的学术能力得到了极大的提升,也让他进一步接触到了人工智能领域的技术发展。
然而,与许多追求“高薪体面”工作的同学不同,梁文锋的目标从来不局限于做一名普通工程师。他在学术研究之余,开始关注更大的产业变革方向,尤其是人工智能在实际场景中的应用。他坚信,科技将成为未来社会的核心驱动力,而自己必须抓住这场时代机遇。
正是这份“走在别人前面”的勇气与决心,让梁文锋在大学期间便踏上了一条充满挑战的路。他带领一群志同道合的伙伴,尝试用机器学习的方法分析金融市场数据,甚至在全球金融危机的阴影下,探索全自动量化交易的可能性。这些“超前”的尝试,逐渐成为梁文锋未来事业的基石,也奠定了他走向世界科技舞台的起点。
此图来自幻方官网
02 量化投资的崛起:从“幻方”开始书写传奇
2008年,全球金融危机爆发,这对传统金融市场带来了深远影响,却也让技术驱动的量化交易迎来了发展的契机。当时,尚在浙大读研究生的梁文锋敏锐地察觉到,技术和数据可以重塑金融市场。他带领一群志同道合的同学,用机器学习方法分析市场数据,尝试实现全自动量化交易。他们采集海量的市场行情数据、宏观经济信息,并用数学建模的方法研究价格波动规律。这些探索不仅为梁文锋积累了实践经验,也为他日后的创业埋下了伏笔。
2013年,梁文锋与浙大校友徐进共同创办了杭州雅克比投资管理有限公司,正式迈入量化投资的世界。尽管当时的量化投资在国内还处于起步阶段,但梁文锋凭借对技术的信仰和对市场的深刻理解,坚定地相信这是金融领域的未来。
2015年,中国量化投资行业迎来了重要节点——中证500股指期货的上市。这为量化私募提供了更丰富的对冲工具,也标志着行业进入2.0时代。同年,30岁的梁文锋与徐进正式创办幻方量化(High-Flyer),用技术重新定义投资策略。他们的愿景是通过数学建模和人工智能,成为世界顶级量化对冲基金。
初创阶段的幻方量化,仅凭10张GPU显卡完成了多项产品的设计和发布。在2015年的“股灾”中,梁文锋的高频量化策略帮助团队取得了不错的成绩,吸引了大量资金和客户的关注。短短一年内,幻方量化成立了20只产品,快速扩张资金管理规模。这种依靠技术驱动的高效率运作模式,使幻方迅速成为量化投资领域的佼佼者。
2016年,梁文锋带领团队推出了第一个由深度学习算法驱动的AI模型,并开始将GPU引入计算交易仓位。这在国内量化领域尚属首创。当年年底,幻方量化的管理规模突破10亿元。随后几年,梁文锋不断扩大AI算法研究团队,将人工智能技术深度融入量化策略,逐步取代传统模型。
2018年,幻方量化首次获得了中国私募证券领域的最高奖项——私募金牛奖,这标志着它在行业内的领先地位。与此同时,团队也开始遇到算力瓶颈。梁文锋再次展现了他对技术的执着,投入巨资研发“萤火一号”深度学习平台,为幻方量化提供大规模算力支持。
2019年,幻方量化的管理规模突破百亿元,正式跻身国内顶级量化私募行列。2021年8月,幻方量化的资金管理规模一度突破千亿,成为行业内的“量化四大天王”之一。这一年,梁文锋在金牛奖颁奖典礼上发表演讲,指出“量化投资的未来,是用技术让市场更有效率”。
梁文锋在金牛奖颁奖典礼现场
然而,辉煌的背后也伴随着挑战。2021年底,由于市场波动和技术决策问题,幻方的业绩出现回撤,团队决定主动缩减管理规模并暂停新产品募集。这一决定虽然短期内带来了质疑,却体现了梁文锋对风险控制的高度敏感。
2021年,梁文锋还带领幻方先于一些云厂商拿到英伟达A100显卡,并且其AI集群搭载显卡的数量达到“万卡级别”。有报道称,当时国内超过1万枚GPU的企业不超过5家,而且除了幻方之外,其他4家公司都是互联网大厂。
英伟达创始人黄仁勋介绍显卡产品
尽管幻方量化的规模有所收缩,但梁文锋的技术信仰从未动摇。他通过量化投资的实践,证明了科技在金融领域的深远价值。而幻方的成功,也为他积累了足够的资本和资源,支持他在人工智能领域开启新的征程。
03 跨界AI:DeepSeek的横空出世
2023年,38岁的梁文锋再次选择站在技术浪潮的最前沿。这一次,他瞄准的是更具前景和挑战的人工智能领域。他创办了深度求索(DeepSeek),这是一家专注于AI大模型研发的公司,目标是用低成本、高性能的技术,打破国际巨头在人工智能领域的垄断。
梁文锋对人工智能并不陌生。在幻方量化的崛起过程中,人工智能早已成为量化策略的核心驱动力。而这次,他决定跳出金融行业,把自己对技术的热情倾注到人工智能的大模型研发中。他的思路十分明确——通过技术创新和成本优化,让AI技术更加普惠。他直言:“我们不是要跟随,而是要在技术上真正超越。”
2024年:DeepSeek的爆发之年。在成立仅一年后,DeepSeek就凭借其创新能力,成为AI领域一颗耀眼的新星。2024年5月,DeepSeek发布了其首款混合专家语言模型DeepSeek-V2。这一模型以超低的价格震惊市场:每百万tokens输入1元、输出2元,仅为GPT-4 Turbo价格的百分之一。凭借出色的性能和性价比,DeepSeek-V2引发了一场大模型价格战,国内外科技巨头纷纷跟进降价。
然而,DeepSeek的真正爆发点出现在2024年12月。梁文锋带领团队推出了新一代大模型DeepSeek-V3。这款模型不仅在数学运算、代码生成和中文问答等方面表现出色,更令人震惊的是,它的训练成本仅为557.6万美元,而OpenAI的GPT-4o训练成本高达7800万美元。DeepSeek-V3以1/10的成本实现了对GPT-4o的全面对标,被美国科技圈称为“来自东方的神秘力量”。
DeepSeek-V3的各项测试结果与同行对比
DeepSeek的成功并非偶然,而是梁文锋在团队管理和技术研发上的一系列独特策略的结果。他组建了一支完全由本土年轻程序员组成的团队,不依赖海归(专题)或高级技术专家。团队成员大多是应届毕业生或工作经验不超过5年的年轻人。梁文锋认为,“创新需要摆脱惯性,经验有时会成为包袱。”
此外,DeepSeek采取了开源的技术策略,主动向全球开发者社区分享核心技术成果。这种开放的态度不仅赢得了国际认可,也推动了行业技术生态的快速发展。OpenAI的创始成员安德烈·卡帕西(Andrej Karpathy)评价说:“DeepSeek在有限资源下展现了惊人的工程能力,它可能重新定义大模型研发的规则。
DeepSeek的技术突破让美国硅谷震撼不已,多位业内人士称,DeepSeek-V3的问世打破了全球AI巨头的“成本壁垒”。有评论认为,DeepSeek在降低算力需求、优化训练效率上的创新,可能会彻底改变AI行业的生态。
然而,梁文锋并未急于将DeepSeek商业化。他坚信,人工智能领域的成功取决于长期的技术积累,而非短期的盈利目标。他表示,DeepSeek的使命是“以更低的成本、更高效的技术推动人工智能的普及”,并始终把技术研发置于首位。
04 技术驱动未来:中国科技的崛起力量
梁文锋始终站在技术创新的最前沿。从量化投资到人工智能,他不断用实践证明,中国科技不仅能参与全球竞争,更能引领技术变革。他认为,中国科技企业不能永远跟随,而是要勇敢站到前沿。
深度求索的成功,证明了他的远见和坚持。在全球AI竞争愈发激烈的今天,梁文锋用技术和创新,让中国AI力量在国际舞台上赢得了一席之地。正如他所说:“我们不只是追赶,更要在核心技术上实现真正的超越。”
梁文锋,这位85后中国小伙,正用他的低调和实力,为中国科技书写更多震撼全球的故事。