计算机行业周报:DeepSeek-Prover-V2创数学推理新高,阿里通义千问推出Qwen3模型
投资要点
算力:算力租赁价格平稳,DeepSeek-Prover-V2创数学推理新高
4月30日,DeepSeek发布名为DeepSeek-Prover-V2的数学推理模型,提供7B和671B两种参数规模。在多个标准基准测试中,DeepSeek-Prover-V2-671B都取得了神经定理证明领域的最先进性能水平。并且,面对从著名的AIME竞赛(2024-2025年)中挑选的15个问题,该模型成功解出了其中的6个。
DeepSeek-Prover-V2通过两阶段训练流程开发,建立了两种互补的证明生成模式:(1)高效非思维链(non-CoT)模式:此模式针对快速生成形式化Lean证明代码进行了优化,专注于在不显示中间推理步骤的情况下生成简洁的证明。(2)高精度思维链(CoT)模式:此模式在构建最终形式化证明之前,系统地阐述中间推理步骤,强调透明度和逻辑进展。
与DeepSeek-Prover-V1.5一致,DeepSeek-Prover-V2的两种生成模式由两个不同的引导提示控制。在第一阶段,DeepSeek团队在课程学习框架内使用专家迭代范式来训练非思维链证明模型,同时通过基于子目标的递归证明为难题合成证明。选择非思维链生成模式是为了加速迭代训练和数据收集过程,因为它提供了明显更快的推理和验证周期。在此基础上,第二阶段利用了通过将DeepSeek-V3复杂的数学推理模式与合成形式证明相结合而生成的冷启动链式思维链数据。CoT模式通过进一步的强化学习阶段得到增强,遵循推理模型常用的标准训练流程。
在性能测评环节中,DeepSeek团队用定理证明基准数据集,对DeepSeek-Prover-V2进行系统评估,测试覆盖高中竞赛和本科数学知识。结果显示,即便训练数据多为高中数学题,该模型仍能良好泛化到大学水平问题,体现出强大的形式化推理能力。
AI应用:Gemini平均停留时长环比+3.45%,阿里通义千问推出Qwen3模型
4月29日,阿里通义千问宣布推出Qwen系列大型语言模型的最新成员——Qwen3。阿里通义千问的旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,表现出极具竞争力的结果。此外,小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%,表现更胜一筹,甚至像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。
Qwen3模型支持两种思考模式:思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如,复杂的问题可以通过扩展推理步骤来解决,而简单的问题则可以直接快速作答,无需延迟。至关重要的是,这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。
Qwen3预训练数据集规模大幅提升,相比Qwen2.5近乎翻倍,达约36万亿个token,覆盖119种语言。数据源于网络与PDF文档,经多模型提取、优化。预训练分三阶段,先构建基础能力,再强化知识数据训练,最后扩展上下文长度以处理长输入。
Qwen3的发布是阿里通义千问的又一里程碑。对比Llama4系列模型得到的社区反馈,Qwen系列无疑已经成为全球第一的开源模型。据了解,阿里通义已开源了200余个模型,全球下载量超3亿次,Qwen衍生模型数超10万个,已超越Llama,成为全球最大的开源模型族群。
AI融资动向:身份验证平台Persona获2亿美元融资,估值达20亿
5月1日,身份验证初创公司Persona Identities Inc.宣布完成2亿美元D轮融资。本轮融资由Founders Fund和Ribbit Capital领投,原有投资方BOND、Coatue、FirstRound Capital和Index Ventures跟投。此轮融资后,Persona估值达到20亿美元。
作为一家总部位于旧金山的创业公司,Persona为包括OpenAI、Instacart在内的3000多家客户提供云端身份验证解决方案。该平台提供预制组件,帮助开发者快速构建注册表单,并可根据风险等级动态调整验证步骤。
Persona利用人工智能技术扫描上传文件,检测篡改痕迹和过期证件。系统还会分析设备信息、用户行为特征等多维数据,并提供恶意账号集群识别等高级功能。该公司在2024年完成了超过3亿次身份验证,客户数量和营收均实现翻倍增长。
Persona联合创始人兼CEO Rick Song表示:"在AI Agent时代,身份验证的挑战不仅会增长,还会倍增。真正的难点不再是识别机器人,而是验证每个行为背后的身份,以及他们是否值得信任。"
在AI Agent崛起的背景下,身份验证正从简单的人机识别,升级为更复杂的可信度评估体系。Persona通过AI技术整合多维数据,打造智能化身份验证基础设施,为元宇宙、Web3等新兴场景提供关键支撑。这反映了SaaS赛道在AI时代的演进方向-从工具化向智能化升级。
投资建议
微软和Meta最新财报双双超预期,云业务和AI成增长引擎。微软第三财季营收达到701亿美元,同比增长13%,净利润为258亿美元,同比增长18%。强劲的云业务是推动增长的关键引擎。微软的商业云(Commercial Cloud)总收入达到424亿美元,略高于市场预期的422亿美元,包含Azure云服务的智能云部门贡献了267.5亿美元的收入,同比增长约21%,超预期,Azure自身收入增长达到了33%。AI在Azure的增长中扮演了重要角色,本季度Azure增长中有16个百分点由AI服务贡献,这一数字略高于此前预期的15.6个百分点。Meta在2025年第一季度同样超预期,公司营收达到423.1亿美元,同比增长16%;净利润为166.4亿美元,同比大幅增长35%,合每股收益6.43美元,均超预期。在核心业务强劲势头的推动下,Meta正全力推进人工智能投资,显著提高了资本支出预期。公司将2025年的资本支出预测从原先的600亿-650亿美元上调至640亿-720亿美元。Meta在财报中明确指出,增加的投入是为了“支持人工智能(AI)计划而增加的数据中心投资,以及基础设施硬件预期成本的上升”。我们认为全球算力有望节后共振,微软和Meta的超预期表现给Ai需求打上强心针。
建议关注临床AI产品成功落地验证的嘉和美康(688246.SH)、以AI为核心的龙头厂商科大讯飞(002230.SZ)、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。
风险提示
1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。
本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。