惠车网 > 头条 >

梁文锋和杨植麟再「撞车」

来源:投资界 时间:2025-05-04 18:49   阅读量:8153   

继2月论文“撞车”之后,梁文锋和杨植麟又在另一个大模型赛道上相遇了。

4月30日,DeepSeek上线新模型DeepSeek-Prover-V2,这是一个数学定理证明专用模型。

Prover-V2的参数规模进一步扩展到671B,相较于前一代V1.5版本的7B规模增加了近百倍,这让其在数学测试集上的效率和正确率更高,比如,该模型的miniF2F测试通过率达到88.9%,它还解决了PutnamBench(普特南测试)的49道题。

巧合的是,4月中旬,月之暗面也曾推出一款用于形式化定理证明的大模型Kimina-Prover,这是Kimi团队和Numina共同研发的大模型,该产品也开源了1.5B和7B参数的模型蒸馏版本。该模型的miniF2F测试通过率为80.7%,PutnamBench测试成绩为10道题。

两者相比较,在miniF2F测试通过率以及普特南测试上,DeepSeek-Prover-V2的表现超过了Kimina-Prover预览版。

值得注意的是,两家公司在技术报告中都提到了强化学习。比如DeepSeek的题目为《DeepSeek-Prover-V2:通过子目标分解的强化学习推进形式数学推理》,而月之暗面的题目为《Kimina-Prover Preview:基于强化学习技术的大型形式推理模型》。

在2月的两篇“撞车”论文中,梁文锋和杨植麟都在作者行列,两家公司都关注Transformer架构最核心的注意力机制,即如何让模型更好地处理长上下文。

作为中国大模型领域最受瞩目的创业者,两人也正在面临不同的挑战。

对于梁文锋而言,在R1模型推出三个多月后,外界对DeepSeek“魔法”的痴迷程度正在下降,阿里巴巴的开源模型正在迅速赶上以及超过DeepSeek,外界热切期待其发布R2或V4模型,以加强*优势。

对于杨植麟和月之暗面,Kimi正在遭受来自字节跳动的豆包和腾讯元宝的挑战,它也需要保持持续创新。

编程与数学,实现AGI的两条路径

对于AGI的实现路径,2024年,DeepSeek创始人梁文锋在接受《暗涌》采访时曾说,他们确实押注了三个方向:一是数学和代码、二是多模态、三是自然语言本身。数学和代码是AGI天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。另一方面,多模态需要参与到人类真实世界里学习。他们对一切可能性都保持开放。

此次Prover-V2模型的推出,让DeepSeek的各个模型矩阵保持了同步进化。

Prover系列模型于2024年3月开始被发布,2024年8月被更新为DeepSeek-Prover-V1.5,2025年4月再被更新至DeepSeek-Prover-V2。

DeepSeek代码系列模型Coder从2024年4月开始更新,6月升级为Coder-V2-0614,7月再次升级,9月,DeepSeek-V2-Chat和DeepSeek-Coder-V2合并,升级后的新模型为DeepSeek-V2.5,2024年12月,该模型更新至V3,今年3月,升级至V3-0324。

通用推理大模型,以1月20日发布的R1模型为代表,价格低廉,自然语言推理性能强劲,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

从Prover-V2的技术报告上看,其与DeepSeek的其他模型进化有关联,其中,DeepSeek-Prover-V2-671B是以DeepSeek-V3作为基础模型来做微调,如在冷启动阶段,DeepSeek-V3将复杂问题分解为一系列子目标,而后,已解决子目标的证明被合成到一个思维过程链中,结合DeepSeek-V3的逐步推理,为强化学习创建一个初始冷启动。

算法工程师、知乎用户“小小将”告诉《中国企业家》,推理模型在进行推理时,要进行复杂的思考,代码与数学模型可以检验推理大模型能力进展,因为数学与代码的结果是可验证的。

他认为,Prover-V2的推出与新模型R2或V4的上线没有必然联系,它更像是一个独立模型的更新。

他预测,R2模型更像是GPT-o1到o3的过程,比如在提高强化学习的能力方面,DeepSeek可以基于V3,提升后训练效果,因此R2的研发周期可能会比较短。但V4就是一个大版本的更新,其研发周期有可能更长,因为预训练的工程量以及训练方法可能都会发生变化。

目前市场已经对DeepSeek的新模型充满了想象和期待。

市场上传言,R2模型将基于华为昇腾系列GPU芯片而推出,但一位行业人士说,这个消息不太可靠,在英伟达H20芯片被限之后,昇腾系列芯片在市场上也是一卡难求,“对于昇腾来说,如果用于大模型研发,可能鲁棒性没那么强”。

另有创业公司相关人士告诉《中国企业家》,华为昇腾芯片用于大模型的训练,效果一般,原因在于生态系统没那么完善,但用于大模型的推理与部署,是没有问题的。

DeepSeek与Kimi还能保持*吗?

DeepSeek与月之暗面作为明星初创公司,正在遭受大公司的追赶和超越。

以月之暗面旗下的Kimi为例,据QuestMobile数据,Kimi上线不足1年,在2024年11月,月活突破2000万,仅次于豆包的5600万。

QuestMobile数据显示,截至2025年2月底,AI原生APP月活规模前三名从豆包、Kimi、文小言更迭为DeepSeek、豆包、腾讯元宝,规模分别是1.94亿、1.16亿、0.42亿。

目前,Kimi最新的举动是内测社区功能,增加用户粘性。

DeepSeek同样也避免不了被大公司追赶甚至超越的挑战。近期,阿里巴巴在大模型方面展现出了强劲的竞争力。

4月29日,阿里巴巴发布新一代通义千问模型Qwen3,该模型被称作*“混合推理模型”,是“快思考”和“慢思考”集成的一个模型,参数量仅为DeepSeek-R1的1/3,性能全面超越R1、OpenAI o1等同行产品。

此前,蔡崇信评价DeepSeek,它告诉了我们开源的价值。根据公开数据,阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,已超越美国Llama,成为全球*开源模型。

一位AI创业者告诉《中国企业家》,DeepSeek受到了过多的关注,被赋予过多光环,中国大模型产业需要两三个世界*的大模型,而不是一个,这时候应鼓励这个领域的竞争和创业。

“DeepSeek*的问题是慢和贵,中国市场上绝大多数大模型API的价格都更低,而且反应速度更快。”李彦宏在发布会上说。

尽管如此,百度仍决定学习DeepSeek,今年2月,百度决定在6月30日开源文心大模型4.5系列。

越来越多的玩家参与大模型开源竞赛,但只有技术*进的玩家才能定义标准。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

  
  • 居然智家:2024年营业收入129.66亿元

    近日,居然智家新零售集团股份有限公司发布2025年一季度报告和2024年年度报告摘要。 公告显示,截至2024年12月31日,居然智家在国内30个省、区、市及海外经营407家家居...

    2025-05-04 16:57

  • 年轻人结伴体验潮流文化游戏动漫展亮相新国展

    迎来一场时尚与潮流的盛会——首届微博游戏动漫展。展览现场,50余家热门游戏、动漫IP厂商聚集,数百名游戏主播、电竞选手、Coser(角色扮演者)与观众热情互动,引得众多年轻人结伴前...

    2025-05-04 12:11

  • 屯昌:油画展办到“油画村”

    “不同于其他市县的画展,屯昌这次把油画展厅设在乡村里既有创意,又接地气。”近日,在屯昌县南吕镇“油画村”咸六村“乡野艺术部落”油画展厅,前来参加活动的万宁市、陵水黎族自治县美术家协...

    2025-05-04 09:14

  • 广东两名个人、一个集体荣获2025年度中国青

    记者鄢敏、通讯员岳青报道:4月30日,2025年度中国青年五四奖章评选结果揭晓,广东两名个人、一个集体上榜。他们分别是:广东省机械技师学院教师龙伟杰、乐聚机器人技术有限公司董事长冷...

    2025-05-02 09:53

  • 打造更多“数智+”文旅场景

    当前,数智技术的深度应用为文旅产业带来新机遇。如何进一步创新和丰富消费场景,加快数字、绿色、智能等新型消费发展,推动数智技术与文旅产业深度融合,释放文旅消费潜力,受到关注。 数智...

    2025-05-02 07:48

  • 李佳琦直播间举办线下市集,助力上海“赏花经济

    在前滩友城公园,由美腕打造的“所有女生的快乐市集·‘李’想街区”占地超6000平方米,以拍照打卡和集章为游览主线。现场汇集多家李佳琦直播间团队精选品牌摊位,如法国品牌娇韵诗带来首发...

    2025-05-02 03:35

  • 五一档新片破2亿,《大风杀》来沪路演

    据灯塔专业版,截至5月1日17时24分,2025年五一档新片总票房(含点映及预售)突破2亿元,影片《水饺皇后》《雷霆特攻队*》《猎金·游戏》《人生开门红》《幽灵公主》《苍茫的天涯是...

    2025-05-02 00:42

  • 焕发新动能!创建助力“百千万”系列活动启动

    文/羊城晚报全媒体记者罗仕黎秋玲李焕坤郭思琦 今年是“百千万工程”实现“三年初见成效”目标重要节点。省委宣传部、省文明办联合省“百千万工程”指挥部办公室、省委农办、省文化和旅游厅...

    2025-05-01 22:40

  • 五一假期,跟着京剧电影游千年运河

    为推动京剧艺术的创新传播,积极响应“跟着电影去旅游”倡导,日前,“运河梨园夜·光影映万家”京杭大运河沿线京剧电影巡游展映活动启幕。 4月28日起,在京杭大运河流经的6座城市,中影...

    2025-05-01 20:18

  • 湖北咸安采摘游“多点开花”农旅融合赋能乡村振

    近日,随着气温回升,湖北咸宁咸安区多个乡村果蔬基地迎来丰收热潮,采摘经济与农旅融合交相辉映,成为乡村振兴的亮丽画卷。 马桥镇高赛村:科技大棚结出"致富瓜" 在咸安区马桥镇高赛村...

    2025-05-01 17:32