侧边栏壁纸
博主头像
Tool

行动起来,活在当下

  • 累计撰写 60 篇文章
  • 累计创建 1 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

95.AI识别手写PDF内容转Markdown

Jimmie
2026-03-07 / 0 评论 / 0 点赞 / 6 阅读 / 0 字
温馨提示:
收藏保存网址不迷路:www.jimmie.top,若内容或图片失效,请反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。
95.AI识别手写PDF内容转md文档1.png

👋 软件是做什么的?

AI识别手写PDF内容转Markdown 是一款桌面端工具,主要用来把 手写内容 PDF、扫描版 PDF、图片型 PDF 交给 AI 识别,再整理成便于编辑、复制、保存的 Markdown(.md) 文档。

它特别适合下面这些场景:

  • 学生整理笔记

    • 把手写课堂笔记 PDF 转成可编辑文字

  • 老师整理资料

    • 把扫描讲义、练习册、手写批注整理成电子文档

  • 办公归档

    • 把历史纸质资料、扫描文件转成方便检索的文本

  • 知识沉淀

    • 把原本只能“看图”的 PDF,变成可搜索、可复制、可继续加工的 Markdown 文档

简单理解就是:

📄 把“看起来像图片的 PDF” → 变成“可以继续编辑的 Markdown 文本”。


✨ 软件能帮你做什么?

本软件的完整流程大致如下:

  1. 读取你选择的 PDF 文件夹

  2. 逐个处理 PDF 文件

  3. 先把 PDF 每一页转换成图片

  4. 再逐页调用你配置好的 AI 接口进行识别

  5. 把识别结果按页写入同名 .md 文件

  6. 每页识别成功后自动删除已经处理完的图片

  7. 全部完成后自动删除该 PDF 对应的图片文件夹

  8. 最后把已完成的 PDF 自动移动到同目录下的 已完成 文件夹中

这样做的好处是:

  • 识别结果清晰

  • 处理过程可追踪

  • 失败后方便继续重试

  • 完成后的文件自动归档,不容易重复处理


🖥 软件界面说明

软件主要分为 3 个页面:

1. 操作页

这是你最常用的页面,主要负责:

  • 选择 PDF 文件夹

  • 加载文件

  • 选择 Markdown 输出目录

  • 设置并发数量

  • 开始批量处理

  • 查看每个 PDF 的处理状态和进度

95.AI识别手写PDF内容转md文档2.png

2. 配置页

这个页面主要负责填写 AI 接口相关信息:

  • AI 地址(Base URL)

  • API Key

  • 模型名称

  • 提示词文件路径

另外你还可以:

  • 点击按钮选择提示词文件

  • 拖拽提示词文件到输入框

  • 预览提示词文件内容

  • 测试 AI 接口是否可用

3. 教程页

这里主要用于:

  • 查看软件介绍

  • 查看新手使用说明

  • 复制作者微信进行反馈

  • 打开更详细的教程页面


🚀 第一次使用怎么做?

如果你是第一次使用,建议严格按下面步骤来:

第一步:准备 PDF 文件

请先把你要处理的 PDF 整理到一个文件夹中。

例如:

D:\待处理PDF
├─ 语文笔记.pdf
├─ 数学作业.pdf
└─ 英语手写讲义.pdf

建议:

  • 一个文件夹里尽量放同一批次的 PDF

  • 文件名尽量简单清楚

  • 不要把无关文件混在里面


第二步:准备 Markdown 输出文件夹

再准备一个用来保存识别结果的文件夹。

例如:

D:\识别结果

处理完成后,每个 PDF 会生成一个同名的 .md 文件。

例如:

D:\识别结果
├─ 语文笔记.md
├─ 数学作业.md
└─ 英语手写讲义.md

第三步:准备提示词文件

提示词文件就是你希望 AI 按什么方式识别内容的一段说明。

软件支持以下格式:

  • .txt

  • .md

  • .doc

  • .docx

一个简单示例:

请识别图片中的全部文字内容。
如果是手写内容,请尽量保持原意,不要随意补充不存在的内容。
请按自然段整理输出。
如果有标题,请保留标题层级。
如果有表格,请尽量转换成 Markdown 表格。

建议:

  • 提示词尽量明确

  • 不要写得过于含糊

  • 如果你的内容偏数学、公式、表格、试卷,可以专门写更有针对性的提示词


第四步:配置 AI 接口

打开软件后,进入 配置页,填写下面内容:

1)AI 地址

通常是兼容 OpenAI 接口格式的地址,例如:

https://api.example.com/v1

请注意:

  • 地址必须以 http://https:// 开头

  • 一般不要把 /chat/completions 手动写进去,软件会自动拼接

2)API Key

填写你的 AI 平台提供的密钥。

示例:

sk-xxxxxxxxxxxxxxxx

3)模型名称

填写你要调用的模型,例如:

gpt-4o-mini

或者你实际平台提供的模型名。

4)提示词文件路径

选择你准备好的提示词文件。

填写完成后,建议点击 测试接口 按钮确认:

  • 地址是否正确

  • Key 是否有效

  • 模型是否可用


▶ 如何开始批量处理?

完成配置后,回到 操作页,按顺序操作:

1)选择 PDF 文件夹

选择你准备好的待处理目录,例如:

D:\待处理PDF

2)点击“加载文件”

软件会把目录中的 PDF 列表加载到表格里。

注意:

  • 已经移动到 已完成 文件夹中的 PDF,不会再次被加载

  • 这样可以避免重复处理

3)选择 Markdown 保存文件夹

例如:

D:\识别结果

4)设置并发数量

并发数量决定“后续识别阶段”同时处理几个 PDF。

建议:

  • 新手建议先从 1 或 2 开始

  • 如果你的 AI 接口稳定、电脑性能较好,可以逐步提高

  • PDF 转图片阶段目前已经做了串行控制,不会同时多份 PDF 一起疯狂读写硬盘

5)点击“开始处理”

之后软件会自动开始执行。

你可以在表格中看到每个文件的:

  • 当前状态

  • 当前进度

  • 是否成功

  • 是否失败


🔄 软件处理时会发生什么?

为了让你更容易理解,这里用一个例子说明。

假设你处理的是:

D:\待处理PDF\数学作业.pdf

软件大致会这样做:

阶段 1:准备处理

软件先检查:

  • PDF 路径是否存在

  • 输出目录是否存在

  • 提示词文件是否存在

  • AI 配置是否完整

阶段 2:PDF 转图片

软件会把 PDF 逐页转成图片,例如:

D:\待处理PDF\数学作业\1.png
D:\待处理PDF\数学作业\2.png
D:\待处理PDF\数学作业\3.png

阶段 3:AI 逐页识别

软件会按页调用 AI 接口进行识别。

识别结果会写入:

D:\识别结果\数学作业.md

写入格式类似:

## 第1页
第一页的识别内容

## 第2页
第二页的识别内容

阶段 4:边识别边清理

每当一页识别成功后:

  • 对应图片会被删除

  • 这样可以减少磁盘占用

阶段 5:全部完成后归档

当所有页面都成功识别后:

  • 图片文件夹会被删除

  • 原 PDF 会被移动到:

D:\待处理PDF\已完成\数学作业.pdf

如果 已完成 文件夹不存在,软件会自动创建。


⏸ 可以暂停吗?

可以。

如果你正在批量处理多个 PDF,软件支持暂停与继续。

适合这些情况:

  • 你临时不想继续调用 AI 接口

  • 你想暂停观察当前识别结果

  • 你希望在网络恢复后再继续

暂停后:

  • 当前批处理会停下来等待

  • 继续后会从合适的位置恢复


♻ 处理中断了怎么办?

不用太紧张,软件已经考虑了断点续跑的场景。

情况 1:PDF 已经转成图片,但还没识别完

如果:

  • PDF 对应图片文件夹还在

  • 输出目录里已经有同名 .md 文件

那么软件会判断为 断点续跑

也就是说:

  • 不会重复转图

  • 会直接从现有图片继续识别

这对以下场景非常有用:

  • 中途断电

  • AI 接口临时报错

  • 软件被关闭

  • 网络异常


❌ AI 识别失败怎么办?

软件已经内置自动重试机制。

目前每张图片:

  • 最多可重试 100 次

  • 并带有逐步增加的等待时间

这样做的好处是:

  • 接口偶发失败时,更容易自动恢复

  • 避免连续高频轰炸接口

  • 提高长任务成功率

如果最终还是失败:

  • 当前 PDF 会处理失败

  • 错误会尽量详细写入 error.log

日志里会尽量包含:

  • 图片路径

  • 接口地址

  • 模型名称

  • 请求摘要

  • HTTP 状态码

  • AI 返回原文

  • 错误信息

这样方便你排查到底是:

  • Key 问题

  • 模型问题

  • 接口限流

  • 网络异常

  • 返回格式异常


🧾 error.log 在哪里?有什么用?

软件运行时会把重要错误写入项目目录下的:

error.log

它主要用于排查问题。

如果你遇到:

  • 某个 PDF 一直失败

  • 接口一直报错

  • 识别中途停止

  • 教程页/操作页异常

都建议先查看这个文件。

如果需要联系作者反馈问题,最好把:

  • 出问题的 PDF 文件名

  • 你填写的 AI 地址

  • error.log 中相关时间段内容

一起发过去,这样定位会更快。


📦 已完成 文件夹是什么?

当一个 PDF 全部处理完成后,软件会自动把它移到同目录下的 已完成 文件夹。

例如:

处理前:

D:\待处理PDF
├─ 语文笔记.pdf
├─ 数学作业.pdf

处理后:

D:\待处理PDF
├─ 已完成
│  ├─ 语文笔记.pdf
│  └─ 数学作业.pdf

这么做的好处:

  • 避免重复处理

  • 待处理文件和已处理文件分开,更清楚

  • 再次加载文件时,软件会自动忽略 已完成 目录中的 PDF

如果出现同名冲突,软件会自动改名,例如:

数学作业-1.pdf
数学作业-2.pdf

🧠 小白用户最推荐的使用方式

如果你不熟悉这类工具,建议你这样用:

推荐方案

  • 并发数量先设为 1

  • 先拿 1~2 个 PDF 测试

  • 确认识别效果满意后,再批量处理更多文件

  • 提示词尽量先写简单明确

为什么这样更稳?

因为这样更容易发现:

  • 提示词是否适合你的资料

  • AI 模型是否识别得准

  • 接口是否稳定

  • 输出格式是不是你想要的


📝 一个完整使用示例

下面给你一个从头到尾的实际例子。

你的文件准备

待处理目录:

E:\学习资料\手写PDF
├─ 历史笔记.pdf
├─ 化学错题.pdf

输出目录:

E:\学习资料\Markdown结果

提示词文件内容:

请识别图片中的所有文字内容。
保持原意,不要编造不存在的内容。
如果有标题,请保留层级。
如果有列表,请整理成清晰的 Markdown 列表。

操作步骤

  1. 打开软件

  2. 进入配置页

  3. 填写 AI 地址、API Key、模型

  4. 选择提示词文件

  5. 点击测试接口

  6. 回到操作页

  7. 选择 E:\学习资料\手写PDF

  8. 点击加载文件

  9. 选择 E:\学习资料\Markdown结果

  10. 并发数量设为 1

  11. 点击开始处理

最终你会得到

输出目录:

E:\学习资料\Markdown结果
├─ 历史笔记.md
└─ 化学错题.md

原 PDF 会被归档到:

E:\学习资料\手写PDF\已完成
├─ 历史笔记.pdf
└─ 化学错题.pdf

⚠ 使用时的注意事项

1)API Key 不要随意泄露

API Key 属于敏感信息,请不要截图公开,不要发给陌生人。

2)先测试接口,再跑批量

如果接口本身不可用,直接开始批量处理只会浪费时间。

3)提示词会直接影响识别效果

同一个 PDF,换一个提示词,识别结果可能差很多。

4)不是所有手写都能 100% 完美识别

以下情况可能影响识别质量:

  • 字迹非常潦草

  • 图片太模糊

  • 页面歪斜严重

  • 有大量涂改、阴影、污点

5)建议保留原始 PDF

虽然软件会自动归档已完成 PDF,但仍建议你保留原始资料备份。


🛠 常见问题答疑

Q1:为什么加载文件后看不到某些 PDF?

可能原因:

  • 文件不在你选中的目录里

  • 文件被放进了 已完成 文件夹

  • 文件扩展名不在支持范围内

Q2:为什么一直显示失败?

常见原因:

  • AI 地址填错

  • API Key 无效

  • 模型名填错

  • 接口限流或余额不足

  • 网络不稳定

建议:

  • 先点“测试接口”

  • 再查看 error.log

Q3:为什么会生成图片文件夹?

因为软件需要先把 PDF 每一页转成图片,再交给 AI 识别。

Q4:识别到一半软件关闭了怎么办?

如果图片文件夹和 .md 文件还在,重新开始后通常可以继续处理,不一定要从头来。

Q5:为什么处理很慢?

可能原因:

  • PDF 页数很多

  • 图片较大

  • AI 接口响应慢

  • 并发设置较低

  • 网络较慢


💡 提示词示例参考

通用识别提示词

请识别图片中的全部文字内容。
保持原文含义,不要编造不存在的内容。
按自然段整理输出。
如有标题,请保留层级。
输出使用 Markdown 格式。

适合手写笔记的提示词

请识别这页手写笔记中的所有内容。
如果有标题、小标题、编号、列表,请尽量按原结构整理。
保持原意,不要自行扩写。
输出为易读的 Markdown 格式。

适合试卷/题目的提示词

请识别图片中的题目内容、题号、选项和解析。
尽量保持题目结构完整。
如果有多级编号,请保留层级。
输出为 Markdown。

📬 遇到问题怎么办?

如果你在使用过程中遇到问题,可以:

  1. 先查看教程页说明

  2. 再查看 error.log

  3. 准备好报错信息与文件名

  4. 通过教程页中的作者微信联系反馈

建议反馈时说明:

  • 你在做什么操作

  • 哪个 PDF 出问题

  • 问题是稳定复现还是偶发

  • error.log 里对应的报错内容


🎯 最后给小白用户的建议

如果你是第一次接触这类 AI 识别软件,请记住下面这几句话:

  • 先少量测试,再大量处理

  • 先确认提示词,再追求速度

  • 先看 error.log,再判断是不是软件问题

  • 并发不要一开始就开太大

  • 已完成文件会自动归档,不用担心重复处理

  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin
  3. QQ打赏

    qrcode qq
博主关闭了所有页面的评论