AI OCR 工具基于大模型(Mistral OCR)将图片或 PDF 文档提取为结构化 Markdown,支持表格、超链接、嵌入图片等复杂版式的识别,适合扫描件文字提取、文档数字化和结构化内容整理。上传文件后自动运行识别,结果按页返回,可单页复制或全部打包下载。
识别质量与图像要求
大模型 OCR 的识别效果主要受源文件质量影响。扫描件分辨率建议不低于 150 DPI,文字清晰、无遮挡时识别率最高。模糊照片、旋转严重、水印密集或字体过小(6pt 以下)的内容会导致识别偏差。
对于 PDF 文档,每页均会单独处理并返回各自的 Markdown。多页文档处理时间与页数成正比,建议一次处理不超过 50 页的文档。
支持的文件类型
图片格式
- JPEG / PNG / WEBP
- GIF / BMP / TIFF
- SVG(矢量图形)
- 适合单页扫描件和截图
文档格式
- PDF(多页均可)
- 每页独立识别,结果分页展示
- 适合合同、报告、书籍等多页文档
识别结果的结构
每一页识别完成后返回以下内容:
- Markdown 正文:包含标题、段落、列表、代码块等结构化文本
- 表格:以 Markdown 表格格式提取,可单独复制
- 超链接:文档中出现的 URL 会单独列出
- 嵌入图片:文档内的图表、插图会尝试提取为内联图片(base64 编码)
- 页面尺寸与 DPI:显示原始页面的像素尺寸信息
下载与导出选项
单页结果可下载为 .md(Markdown)或 .txt(纯文本)。多页文档可点击「全部下载」将所有页的内容合并为一个文件,页与页之间以 --- 分隔符区分。
隐私说明
识别需要先将文件上传至云端,通过 API 处理后再返回结果。请避免上传含有密码、密钥、身份证号等高度敏感内容的文件。处理完成后的上传文件会在短时间内自动过期删除。