计算机：AI动态跟踪系列（六）-OpenAI o3、豆包新品首发，关注原生Agent与多模态推理

股票资讯阅读：247 2025-04-18 09:01:00 评论：0

　　事项：

　　4月17日，OpenAI公司发布o系列模型中的最新款o3和o4-mini，火山引擎发布豆包1.5·深度思考模型等新品。

　　平安观点：

　　OpenAI o3、o4-mini新增图像深度思考与Agent能力，Codex CLI智能体开源推动AI编程生态开放。o3和o4-mini被称为是OpenAI迄今为止发布的最智能的模型，我们认为，在o1优越能力的背后，核心突破在于运用思维链（chain ofthought）方法来处理复杂任务，而o3和o4-mini的主要突破在于两个能力：1）图像深度思考。首次实现在思维链中用图像来思考，结合高级推理与Web搜索、图像处理等工具（自动缩放、裁剪、翻转或增强图像）。2）Agent能力（代理能力）。OpenAI推理模型首次可以代理使用和组合ChatGPT中的各个工具，包括搜索网络、使用Python分析上传的文件和其他数据、对视觉输入进行深入推理，甚至生成图像。此外，OpenAI进一步推动AI编程生态开放，开源了轻量级编程智能体Codex CLI，仅需OpenAI API key即可零配置启动，开发者可直接从命令行体验多模态推理。

　　豆包1.5·深度思考模型对标全球推理模型第一梯队，视觉理解模型实现更强视觉定位能力。火山引擎在4月17日FORCE LINK AI创新巡展·杭州站上，发布豆包1.5·深度思考模型等新品，我们认为以下进展值得重点关注：1）推理模型。性能上，豆包1.5·深度思考模型在数学、代码、科学等专业领域推理任务中表现已经达到或接近全球第一梯队水平，对标DeepSeek R1、QWQ-32B等顶尖模型，并增加了视觉理解能力；功能上，豆包APP基于豆包1.5·深度思考模型进行了定向训练，可以实现“边想边搜”。2）多模态。升级的豆包·文生图模型3.0在最新的文生图领域权威榜单Artificial Analysis竞技场中排名全球第一梯队；新版本豆包·视觉理解模型实现更强的视觉定位能力，可应用于线下门店的巡检场景、GUIagent、机器人训练、自动驾驶训练等。3）企业级服务。面向Agent服务，发布OS Agent、GUI Agent大模型（豆包1.5·UI-TARS），面向大规模推理，发布AI云原生·ServingKit推理套件。

　　投资建议：我们认为，近期包括OpenAI、豆包在内发布的新模型，解题思路在此前思维链CoT基础上，更多体现对模型原生Agent能力（即工具使用）以及多模态推理能力的重视。全球大模型领域的竞争依然白热化，我们坚定看好AI主题的投资机会，当前Agent在企业端落地进度较为靠前，AI应用建议关注OA/ERP/编程/办公等领域；算力方面，Agent将带来更多的推理端应用需求，从而拉动推理端算力乃至整体算力需求向上。当前全球贸易摩擦持续演化，从性价比以及供应链安全的角度，我国国产AI算力在国内AI算力市场的接受度将进一步提高，市占率有望进一步提升，我们坚定看好国产AI算力产业链。标的方面：1）AI应用：AI+企服，建议关注泛微网络、致远互联、卓易信息、金蝶国际、税友股份、博思软件、普联软件；AI+办公，推荐金山办公、福昕软件、万兴科技，建议关注合合信息。2）AI算力：推荐海光信息、龙芯中科、浪潮信息、紫光股份、中科曙光、神州数码、工业富联、深信服，建议关注寒武纪、景嘉微、华勤技术、软通动力、拓维信息。

　　风险提示：1）AI算力供应链风险上升。2）大模型产品的应用落地低于预期。3）国内大模型算法发展可能不及预期。

平安证券闫磊,黄韦涵,王佳一

声明

本站内容源自互联网，如有内容侵犯了您的权益，请联系删除相关内容。本站不提供任何金融服务，站内链接均来自开放网络，本站力求但不保证数据的完全准确，由此引起的一切法律责任均与本站无关，请自行识别判断，谨慎投资。