OpenAI o3-pro 震撼发布，史上最强 AI 来袭，却暗藏这些 “槽点”？

2025年6月11日 11:03

来源：36氪

作者：山自

OpenAI o3-proAI模型Deepseek R2

OpenAI正式推出全新AI模型o3-pro，官方宣称这是其有史以来最强大的模型，具备卓越的推理能力和丰富的功能亮点，尽管存在一些不足，但在AI基准测试中表现优异。

新闻简报

在AI领域的激烈竞争中，OpenAI再次投下重磅炸弹！近日，OpenAI正式推出了全新AI模型o3-pro，官方自信宣称这是其有史以来最强大的模型。消息一出，立刻在全球科技圈掀起轩然大波。o3-pro是OpenAI今年早些时候推出的推理模型o3的升级版，其核心优势在于能够像人类一样，一步一步地拆解和解决问题，这种“思考”方式打破了传统AI模型的局限。传统AI模型往往是基于大量数据的模式匹配来给出答案，而推理模型则更注重逻辑推导。以数学领域为例，当面对一道复杂的几何证明题时，o3-pro会先分析题目给出的条件，再调用已有的几何定理，通过严谨的步骤推导，最终得出正确结论；在编程方面，它可以深入理解代码需求，从功能实现逻辑出发，逐步编写和优化代码，大幅减少代码中的错误和漏洞。这种独特的推理能力，让o3-pro在物理、数学和编程等对逻辑要求极高的领域，表现得比传统模型更加可靠和精准。从6月10日（周二）起，ChatGPT Pro和Team用户已经可以率先体验o3-pro，它直接取代了之前的o1-pro模型。而Enterprise和Edu用户则需要再等一周才能使用。同时，o3-pro也于当天下午在OpenAI的开发者API中上线。在API中，o3-pro的定价为每百万输入tokens 20美元，每百万输出tokens 80美元。OpenAI在更新日志中透露，在专家评估中，评审人员在所有测试类别中都一致更青睐o3-pro，尤其是在科学、教育、编程、商业和写作辅助等关键领域。在科学研究方面，o3-pro能够帮助科研人员快速分析大量实验数据，提出新的研究假设；教育领域中，它可以根据学生的学习情况，生成个性化的学习方案和习题解析；商业场景里，能为企业提供精准的市场分析和商业策略建议。而且，评审人员还认为o3-pro在表达清晰度、内容全面性、指令遵循度和回答准确性等方面都要优于以往的模型。此外，o3-pro还具备强大的工具调用能力，堪称“全能助手”。它可以进行网页搜索，实时获取最新的信息和数据，为用户提供更全面的回答；能够分析各类文件，无论是文档、表格还是代码文件，都能准确提取关键信息并进行解读；支持处理视觉输入，比如对图片中的物体、场景进行分析和描述；熟练使用Python编程，满足开发者各种编程需求；甚至能利用记忆功能实现个性化回复，根据用户之前的提问和交互历史，提供更贴合用户需求的答案，大大提升了交互体验。不过，o3-pro并非十全十美。OpenAI坦言，该模型的响应时间通常比o1-pro更长，也就是说，用户可能需要多等一会儿才能得到它的答案。这对于一些追求即时反馈的场景，如实时聊天、在线客服等，可能会造成一定的体验下降。此外，目前ChatGPT中与o3-pro的临时聊天功能因“技术问题”暂时禁用，这无疑限制了用户在日常交流场景中的使用。o3-pro也无法生成图像，在当下图文结合的信息传播时代，这让它在一些创意设计、营销宣传等领域的应用受到阻碍。而且OpenAI的AI工作空间功能Canvas也不被o3-pro支持，对于依赖Canvas进行团队协作和项目管理的用户来说，不得不继续使用其他模型或工具。尽管存在这些不足，o3-pro在AI基准测试中的表现却十分亮眼。根据OpenAI的内部测试，在评估数学技能的AIME 2024测试中，o3-pro的得分超过了谷歌表现最好的AI模型Gemini 2.5 Pro；在测试博士级科学知识的GPQA Diamond测试中，o3-pro也击败了Anthropic最近发布的Claude 4 Opus。这些成绩不仅证明了o3-pro在专业知识处理上的卓越实力，也凸显了OpenAI在AI技术研发上的领先地位。这也让其他AI研发企业感受到了巨大的压力，促使整个行业加快技术创新的步伐，推动AI技术不断向前发展。o3-pro的发布，标志着AI技术又向前迈出了一大步。它既带来了更强大的功能和更精准的回答，也暴露出一些有待完善的地方。对于广大用户和开发者来说，o3-pro既是一个充满机遇的新工具，也是一个需要进一步探索和适应的新挑战。从企业角度看，如何将o3-pro融入现有的业务流程，提升工作效率和服务质量，是接下来需要思考的问题；对于开发者而言，利用o3-pro的强大功能开发出更具创新性的应用，将成为在竞争中脱颖而出的关键。而对于普通用户，期待o3-pro在未来能够克服现有局限，为我们的生活带来更多便利和惊喜。未来，随着技术的不断迭代，o3-pro能否克服现有局限，持续刷新我们对AI的认知？让我们拭目以待！