Mistral 发布 OCR 3,提升了手写及结构化文档识别的准确率

作者 | Robert Krzaczyński

译者 | 张卫滨

据 Mistral 表示,OCR 3 相较于前一代产品是一次重大的飞跃。在基于真实客户文档工作流的内部评估中,新模型在整体表现上以 74% 的胜率超越了 Mistral OCR 2,尤其在表单、手写内容和含大量表格的文档上优势更为显著。这些基准测试采用模糊匹配(fuzzy-match)指标与人工标注的真实结果进行比对,旨在反映实际业务场景,而非理想化的合成数据。

图片来源:Mistral 博客

早期用户特别强调了其性能提升和多语言方面的支持能力。ICT 安全负责人兼 AI 安全专家 Patrick Jacobs 评论说:

在速度方面,真的令人印象深刻,而且它处理荷兰语毫无压力。

得益于准确率的大幅提升,Mistral OCR 3 的生产部署正在快速扩展。Techseria 创始人兼首席顾问 Niraj Bhatt 分享了其实际应用的变化:

我们一直在生产环境中使用 Mistral OCR 处理销售和采购发票,实现 ERP 系统的零人工数据录入。现在 v3 在表单和手写内容上准确率提升了 74%,终于让我们能够将覆盖范围扩展到送货单、水电账单以及过去只能靠人工处理的遗留档案。

在定价方面,Mistral OCR 3 的标准费率为每 1000 页 2 美元💵;若使用 Batch API,成本可降至每 1000 页 1 美元💵,使其成为许多企业级 OCR 系统的高性价比替代方案。开发者可通过 API 直接集成模型(标识符为 mistral-ocr-2512),非技术用户则可通过拖放式的 Document AI Playground 界面轻松使用。

对于具有严格数据治理要求的组织,Mistral 提供了私有化的部署选项,确保 OCR 工作负载完全运行在客户可控的基础设施内。

如今,Mistral OCR 3 已经可以使用了,并完全向后兼容 OCR 2。

特别声明:[Mistral 发布 OCR 3,提升了手写及结构化文档识别的准确率] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

CK羽绒服被指由波司登代工,门店回应:部分款式是波司登代工,门店暂不了解具体原因(ck羽绒被怎么样)

随后,记者致电Calvin Klein上海一门店,工作人员证实,门店此前售卖的部分羽绒服款式,确实由波司登代工生产。对于品牌为何选择波司登作为代工厂,该工作人员表示,这是品牌公司的决定,门店暂不了解具体原因…

CK羽绒服被指由波司登代工,门店回应:部分款式是波司登代工,门店暂不了解具体原因(ck羽绒被怎么样)

手机外放声音小?清理这几个地方音量直接翻倍(手机外放声音小怎么变大声了)

只需针对性清理关键部位,搭配简单设置优化,就能让外放音量显著提升,听觉体验直接升级。切忌用针、牙签等尖锐物品戳刺,避免划伤防尘网或损坏内部振膜,也可借助气囊吹尘器近距离轻吹,将深层灰尘吹出。若清洁与设置后仍无…

手机外放声音小?清理这几个地方音量直接翻倍(手机外放声音小怎么变大声了)

他只是老了,不是傻了!每次出行,田朴珺都是把王石甩在后边,弄得王石像个跟班的,自己像个女王。(他只是老了全文)

从田朴珺一次次把老王甩身后,无视他的那一刻起,老王眼中已经露出了耐人寻味的的表情,田被废只是迟早的事!只是没有想到老王下手这么快,也没有想到老王这么狠!这个女人的脸相是凶的! 老王在他们那个圈子里估计是调侃甚…

他只是老了,不是傻了!每次出行,田朴珺都是把王石甩在后边,弄得王石像个跟班的,自己像个女王。(他只是老了全文)

太有戏!宁波慈溪400名普通戏迷登台,从桃花林唱到大剧院(宁波慈余饭店)

这场热热闹闹办了近一年的全民戏曲盛会,没门槛、不挑人,让400多个普通老百姓圆了“唱戏梦”,更凭着超60万人次的线上观看、百万次的短视频播放,把慈溪藏了近三百年的姚剧韵味,唱给了更多人听,也给传统戏曲如何“…

太有戏!宁波慈溪400名普通戏迷登台,从桃花林唱到大剧院(宁波慈余饭店)

以人文为舵,以专业为桨 —— 杨君主持与主导纪实节目的全流程实践(以文化人 以文育人(文明的力量))

在纪实节目拍摄现场,杨君既是 “与对象对话的主持人”,也是 “把控全局的主导者”—— 她能在 “倾听采访对象” 与 “调整拍摄节奏”之间自如切换,既不丢失 “生活的真实瞬间”,又能确保拍摄不偏离前期设定的…

以人文为舵,以专业为桨 —— 杨君主持与主导纪实节目的全流程实践(以文化人 以文育人(文明的力量))