AI OCR 转 Markdown

AI OCR 工具基于大模型（Mistral OCR）将图片或 PDF 文档提取为结构化 Markdown，支持表格、超链接、嵌入图片等复杂版式的识别，适合扫描件文字提取、文档数字化和结构化内容整理。上传文件后自动运行识别，结果按页返回，可单页复制或全部打包下载。

识别质量与图像要求

大模型 OCR 的识别效果主要受源文件质量影响。扫描件分辨率建议不低于 150 DPI，文字清晰、无遮挡时识别率最高。模糊照片、旋转严重、水印密集或字体过小（6pt 以下）的内容会导致识别偏差。

对于 PDF 文档，每页均会单独处理并返回各自的 Markdown。多页文档处理时间与页数成正比，建议一次处理不超过 50 页的文档。

支持的文件类型

JPEG / PNG / WEBP
GIF / BMP / TIFF
SVG（矢量图形）
适合单页扫描件和截图

PDF（多页均可）
每页独立识别，结果分页展示
适合合同、报告、书籍等多页文档

识别结果的结构

每一页识别完成后返回以下内容：

Markdown 正文：包含标题、段落、列表、代码块等结构化文本
表格：以 Markdown 表格格式提取，可单独复制
超链接：文档中出现的 URL 会单独列出
嵌入图片：文档内的图表、插图会尝试提取为内联图片（base64 编码）
页面尺寸与 DPI：显示原始页面的像素尺寸信息

下载与导出选项

单页结果可下载为 .md（Markdown）或 .txt（纯文本）。多页文档可点击「全部下载」将所有页的内容合并为一个文件，页与页之间以 --- 分隔符区分。

隐私说明

识别需要先将文件上传至云端，通过 API 处理后再返回结果。请避免上传含有密码、密钥、身份证号等高度敏感内容的文件。处理完成后的上传文件会在短时间内自动过期删除。