侧边栏壁纸
博主头像
Tool博主等级

行动起来,活在当下

  • 累计撰写 41 篇文章
  • 累计创建 3 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

76.AI 图文提取器

Jimmie
2025-12-09 / 0 评论 / 0 点赞 / 9 阅读 / 16362 字 / 正在检测是否收录...
温馨提示:
收藏保存网址不迷路:www.jimmie.top,若内容或图片失效,请反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

1. 软件是什么?能帮你做什么?

1.1 软件简介

AI 图文提取器是一款桌面小工具,专门帮你把图片里的文字自动识别出来,保存成 TXT 文本文件,方便后续:

  • 复制粘贴 到 Word、PPT、Excel 里继续编辑

  • 全文搜索 某个关键词(例如合同中的某条条款)

  • 长期归档:把扫描件里的文字“解放”出来,保存成可编辑文本

你只需要:

  1. 选中 图片所在文件夹(支持整批图片,支持子文件夹)

  2. 选中 TXT 输出文件夹

  3. 填好 接口密钥(API Key),点击“开始”

软件会自动:

  • 逐张调用 AI 视觉识别接口

  • 把识别到的 全部文字 写入到与你图片同名的 .txt 文件中

  • 文本文件按你指定的 TXT 文件夹组织,方便查看和备份

🔒 隐私说明(重要)

  • 识别需要联网,调用你配置的 AI 接口(例如作者提供的 OpenAI 兼容接口)。

  • 软件本地只会:读取图片文件 → 把识别结果写入 TXT 文件,不会对原始图片做覆盖、修改等操作。

  • 请确保你使用的接口服务可信,并遵守相关法律法规和服务条款。


1.2 适合谁用?

  • 老师 / 教培机构

    • 批量把试卷、教案、练习册扫描件里的文字提取出来,方便改写、排版、出新题。

  • 办公人士 / 行政 / 法务

    • 合同、制度、通知扫描件里的文字一键提取,后续在 Word 里修改更方便。

  • 自媒体 / 运营 / 设计

    • 海量长图、截图里的文案一键提出来,方便改写、做新素材。

  • 个人资料整理爱好者

    • 笔记截图、书页照片、票据等都能转成文本长期保存。

如果你经常需要 对着图片重新打字,这个软件可以帮你节省大量时间 ⏱️。


2. 界面总览(认识一下主界面)

软件主界面分成三大页签:

  • 「操作」页

    • 选择图片文件夹、TXT 文件夹

    • 加载文件、开始处理、暂停/继续

    • 查看文件列表、处理进度和统计

  • 「配置」页

    • 填写 API 密钥(Key)

    • 设置提示词

    • 是否开启失败重试

    • 是否显示文件缩略图预览列

  • 「教程」页

    • 软件概述

    • 使用流程、常见问题说明

    • 按钮直达在线完整教程

2.1 顶部标签栏

  • 左侧是三个页签:操作 / 配置 / 教程

  • 右上角有一个 「置顶」按钮

    • 点击后窗口会置顶,方便你一边看文件夹一边操作软件。

2.2 操作页主要区域

  • 图片文件夹:选择你要识别的图片所在的文件夹

    • 可点击“选择”按钮打开系统对话框

    • 也可以把文件夹直接拖拽到输入框里

  • TXT 文件夹:选择识别结果要保存到的文件夹

    • 建议提前新建一个空文件夹,例如:D:\图文提取结果

  • 按钮区

    • 加载文件:从图片文件夹读取图片列表

    • 开始 / 开始自动循环:启动识别

    • 暂停 / 继续:处理中途可暂停,再继续

    • 清空列表:清空当前文件列表和状态

  • 右侧开关

    • 包含子文件夹

      • 开:会把子文件夹里的图片一起加载

      • 关:只处理当前文件夹下的图片

    • 自动循环处理

      • 用于“监控某个文件夹,有新图就自动处理”的场景,后文有详细说明。

  • 文件列表 & 统计

    • 上方会显示:总文件数 / 成功数 / 失败数

    • 下方表格中,每一行是一张图片,对应一个处理状态:

      • 等待中 / 处理中 / 已完成 / 失败


3. 第一次使用:从零开始完整操作一遍

下面以 “把一批 JPG 图片里的文字提取成 TXT 文本” 为例,手把手带你完成一次完整操作。

步骤 1:准备两个文件夹 📁

  1. 在任意磁盘(例如 D:)新建两个文件夹:

    • D:\图文提取\图片文件夹

    • D:\图文提取\TXT文件夹

  2. 把你要识别的图片复制到 图片文件夹 里。

    • 支持格式:JPG / JPEG / PNG / GIF / BMP / WebP / SVG / ICO / TIF / TIFF

    • 单张图片大小 ≤ 50MB

小提示:建议先准备 3~5 张图片做测试,确认识别效果和费用都能接受,再往里放大量图片。

步骤 2:配置 API 密钥 🔑

  1. 在软件中切换到 「配置」 页。

  2. 在“密钥”输入框中,填入你从作者处获取的 API Key

  3. 可选:点击 「测试连接」 按钮:

    • 成功:会弹出“连接成功”的提示。

    • 失败:检查 Key 是否填写正确、网络是否正常。

  4. “模型”一般已经固定为 img-ocr,你无需修改。

⚠️ 识别图片会消耗一定费用(例如每张约 0.04 元,具体以实际接口计费为准)。请合理控制识别数量。

步骤 3:设置提示词(可选)💬

在“配置”页中有一个 「提示词」 文本框:

  • 默认提示词大意是:

    • “请识别图片中的所有文字,只回复识别到的文字,不要回复其他内容。”

  • 你可以根据需要修改,例如:

    • “请识别图片中的所有中文与数字,保持原有换行,不要自行增删文字。”

若不清楚如何写,留空或使用默认提示词即可,软件会自动使用内置提示词。

步骤 4:选择图片文件夹和 TXT 文件夹 📂

  1. 切换到 「操作」 页。

  2. 在“图片文件夹”一行:

    • 点击“选择”按钮

    • 选择刚才的 D:\图文提取\图片文件夹

  3. 在“TXT 文件夹”一行:

    • 点击“选择”按钮

    • 选择 D:\图文提取\TXT文件夹

一定要确保两个路径都选对,否则会提示“未选择图片文件夹 / TXT 文件夹”。

步骤 5:加载文件 👀

  1. 点击“加载文件”按钮。

  2. 稍等片刻,下方“文件列表”中会显示当前文件夹下的所有图片名称。

  3. 顶部统计区域会显示“总文件数:X”。

  • 如果勾选了“包含子文件夹”:

    • 会把子文件夹中的图片一起统计进来。

步骤 6:开始处理 🏃

  1. 再次确认:

    • API Key 已填写并通过测试(推荐先测试一次)。

    • 图片文件夹 / TXT 文件夹都已经正确选择。

  2. 点击蓝色的 “开始” 按钮:

    • 按钮文案会变为“处理中...”。

    • 列表中的每一行会依次变成“处理中 / 已完成 / 失败”。

处理过程说明:

  • 对每一张图片,软件会:

    1. 读取本地图片

    2. 编码后发给 AI 识别接口

    3. 获取文本结果

    4. 在你设置的 TXT 文件夹中,按图片同名 生成一个 .txt 文件并写入识别结果

  • 若中途出现网络波动且你在“配置”页开启了“失败重试”,软件会自动进行一定次数的重试。

处理过程中如果需要暂时停一下,可以点击“暂停”;再次点击会“继续”。

步骤 7:查看识别结果 📄

  1. 打开你之前选择的 TXT 文件夹(例如 D:\图文提取\TXT文件夹)。

  2. 可以看到多个 .txt 文本文件:

    • 图片A.jpg图片A.txt

    • 合同第一页.png合同第一页.txt

  3. 用记事本 / Notepad++ / VS Code 等工具打开 .txt 文件,就能看到识别出来的全部文字。

如果你对结果不满意,可以:

  • 换一张清晰度更高的图片

  • 调整提示词(例如强调“不要编造内容”)

  • 重新运行一次处理


4. 示例:批量处理一个资料文件夹

假设你有一个资料文件夹:

  • E:\资料\扫描文件 中有 200 张扫描件(试卷、合同、通知等)

  • 你希望把所有文字提取出来,方便后续搜索和编辑。

可以这样做:

  1. E:\资料 下新建 文字版 文件夹:E:\资料\文字版

  2. 在软件中:

    • 图片文件夹:选 E:\资料\扫描文件

    • TXT 文件夹:选 E:\资料\文字版

    • 勾选“包含子文件夹”(如果扫描文件中还有子目录)

  3. 点击“加载文件”,再点击“开始”。

  4. 稍等一段时间后,去 E:\资料\文字版 中查看生成的 .txt 文件。

这样,你就多了一份 可全文检索、可编辑的“文字版资料库” 📚。


5. 进阶功能说明

5.1 自动循环处理(监控文件夹新图片) 🔁

适用场景

  • 你有一个“待识别图片”文件夹,不定期会有新图片被保存进来(例如扫描仪输出目录、截图工具保存目录)。

  • 希望软件 自动、持续 帮你处理新进来的图片,而不是每次手动点击“开始”。

使用步骤

  1. 正常选好“图片文件夹”和“TXT 文件夹”,并“加载文件”。

  2. 在“操作”页右侧勾选:自动循环处理

  3. 点击“开始自动循环”。

  4. 软件会:

    • 先处理当前文件列表

    • 每轮处理完成后:

      • 自动清空列表

      • 自动重新加载同一个图片文件夹

    • 如果暂时 没有新图片

      • 会每隔一段时间(如 30 秒)自动重试加载

停止自动循环的方式

  • 取消勾选“自动循环处理”,或

  • 点击“暂停”,或

  • 直接关闭软件窗口。

5.2 失败重试机制 🧱

在“配置”页中有一个 「失败重试」 开关:

  • 开启后:

    • 当接口返回网络错误、限流或服务器 5xx 错误等可恢复错误时,软件会 自动重试最多 3 次

    • 能在网络不稳定时明显提高整体成功率。

  • 关闭后:

    • 每张图片只请求一次,失败就直接标记为“失败”。

⚠️ 注意:开启重试在“失败场景”下会多发几次请求,也就意味着可能多花一点费用。请按自己的稳定性要求和预算权衡。

5.3 文件预览列 🖼️

  • 在“配置”页中可选择是否显示 文件缩略图预览列

    • 开启:列表中会多一列小缩略图,方便肉眼确认图片内容。

    • 关闭:只显示文件名、状态和结果,适合追求极简和性能的用户。

5.4 包含子文件夹 ✅

  • 位于“操作”页按钮区右侧。

  • 勾选后:

    • 软件会递归遍历你选择的图片文件夹下的所有子目录,将里面的图片一并处理。

  • 不勾选:

    • 只处理当前这一层文件夹下的图片。


6. 常见问题(FAQ)❓

Q1:支持哪些图片格式?单张图片最大多大?

  • 支持格式:JPG / JPEG / PNG / GIF / BMP / WebP / SVG / ICO / TIF / TIFF

  • 单张图片体积:

    • 最大约 50 MB,超过会被视为“图片过大”。

Q2:软件会不会修改或删除我的原始图片?

  • 当前版本只会 读取原图,不会修改、移动或删除你的图片。

  • 识别结果会写入到你指定的 TXT 文件夹中,生成新的 .txt 文本文件。

  • 为了安全起见,仍然强烈建议你提前做好图片备份

Q3:识别出来的文字不准确怎么办?

可以从几个方面排查:

  • 图片本身是否:

    • 太模糊 / 分辨率太低

    • 倾斜严重 / 有阴影

  • 提示词是否太模糊:

    • 可以在提示词里强调“请尽量逐字识别,不要编造内容”。

  • 内容本身是否:

    • 含有大量手写字、特殊字体或极端排版(这类内容天生更难识别)。

适当调整提示词、多尝试几种图片样本,能明显改善效果。

Q4:为什么一直提示“未配置 API Key”?

  • 请到“配置”页检查:

    • 是否已经填入完整的 Key

    • 前后是否有多余空格

  • 填完后 按一下回车或点击其他位置,再试一次“测试连接”。

Q5:软件能离线使用吗?

  • 目前 不能离线使用

  • 图文识别依赖在线 AI 接口,需要稳定网络连接。

Q6:识别结果是保存在云端还是本地?

  • 识别过程在云端(你的 AI 服务商)完成。

  • 最终的识别结果文本是由软件 写到你本地磁盘上的 TXT 文件 中。


7. 使用建议与注意事项 📌

  • 建议一:务必先做小批量测试

    • 先选 3~5 张典型图片跑一轮,确认:

      • 识别质量是否可接受

      • 费用是否在可承受范围

  • 建议二:重要图片请先备份

    • 虽然软件默认不修改原图,但养成备份习惯总是好的。

  • 建议三:按场景规划文件夹结构

    • 例如按“年份 / 项目 / 类型”建立不同的图片与 TXT 文件夹,后期查找会轻松许多。

  • 建议四:保持网络通畅

    • 大批量处理时,尽量在网络稳定的时候执行,能缩短整体耗时并减少失败重试。


8. 遇到问题如何求助?🆘

如果你在使用中遇到:

  • 软件无法启动

  • 一直识别失败

  • 不知道如何配置提示词

  • 想要定制功能(例如支持特定模板、导出为 Word/Excel 等)

可以通过软件中“教程”页里的联系方式(例如作者微信)进行反馈沟通。

感谢使用 AI 图文提取器,祝你从此告别“对着图片慢慢打字”的苦力活!🎉

  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin
  3. QQ打赏

    qrcode qq
博主关闭了所有页面的评论