作者 | Robert Krzaczyński
译者 | 张卫滨
据 Mistral 表示,OCR 3 相较于前一代产品是一次重大的飞跃。在基于真实客户文档工作流的内部评估中,新模型在整体表现上以 74% 的胜率超越了 Mistral OCR 2,尤其在表单、手写内容和含大量表格的文档上优势更为显著。这些基准测试采用模糊匹配(fuzzy-match)指标与人工标注的真实结果进行比对,旨在反映实际业务场景,而非理想化的合成数据。
图片来源:Mistral 博客
早期用户特别强调了其性能提升和多语言方面的支持能力。ICT 安全负责人兼 AI 安全专家 Patrick Jacobs 评论说:
在速度方面,真的令人印象深刻,而且它处理荷兰语毫无压力。
得益于准确率的大幅提升,Mistral OCR 3 的生产部署正在快速扩展。Techseria 创始人兼首席顾问 Niraj Bhatt 分享了其实际应用的变化:
我们一直在生产环境中使用 Mistral OCR 处理销售和采购发票,实现 ERP 系统的零人工数据录入。现在 v3 在表单和手写内容上准确率提升了 74%,终于让我们能够将覆盖范围扩展到送货单、水电账单以及过去只能靠人工处理的遗留档案。
在定价方面,Mistral OCR 3 的标准费率为每 1000 页 2 美元💵;若使用 Batch API,成本可降至每 1000 页 1 美元💵,使其成为许多企业级 OCR 系统的高性价比替代方案。开发者可通过 API 直接集成模型(标识符为 mistral-ocr-2512),非技术用户则可通过拖放式的 Document AI Playground 界面轻松使用。
对于具有严格数据治理要求的组织,Mistral 提供了私有化的部署选项,确保 OCR 工作负载完全运行在客户可控的基础设施内。
如今,Mistral OCR 3 已经可以使用了,并完全向后兼容 OCR 2。



