FineReader 15 OCR 之后导入MarginNote无法识别文字

问题描述

将扫描版的PDF用FineReader做OCR识别后,导入MarginNote,选中文字的时候只有部分文字能被选中,例如:
今天天气真不戳。
选中的效果(粗体表示可以选中):
今天天气真不戳。

问题复现步骤

  1. 将扫描PDF文档用FineReader做OCR,输出 text under image PDF。
  2. 用MarginNote导入文档
  3. 用Text Expert工具选择文字段落。

涉及的相关软件和版本

  • MacOS: 11.4
  • MarginNote Mac: 3.7.5 (3.7.5003)
  • FineReader Mac: 15.0.1 (170)

补充

  1. 用其他PDF工具(例如PDF Expert)打开没有这个问题。
  2. 之前用FineReader12.1.14版本输出的文档没有这个问题。
  3. 猜测是编码的问题。

更新

看了下FineReader Mac 15输出的PDF Version是1.6,而FineReader Mac 12输出的PDF Version是1.5。

Hello

好的,您方便附带一个PDF吗?我们测试一下,另外您尝试别的PDF浏览器中有问题吗?

Kind Regards,
MarginNote-Relight
Support Team

其他PDF浏览器试过PDF Expert和Adobe Acrobat,都没有问题。

1 个赞

Hello

您好,是有问题,那么您详细的导出设置有个截图吗?语言、编码选择的什么呢?

Kind Regards,
MarginNote-Relight
Support Team

  • 导出PDF的选项是默认配置;
  • OCR语言是Chinese Simplified;
  • FineReader没有编码设置。

应该用任何15版本以上的FineReader导出任意一个PDF都是有这个问题的,不光是这一个文档。

Hello

好的~

Kind Regards,
MarginNote-Relight
Support Team

您好,所以这个问题有解决办法了吗,我也遇到了类似的问题。。。

我现在没用marginnote做笔记了,而是直接在PDF里做标注,另外用emacs的org mode做一个大纲和摘抄的笔记。所以我也没有再验证这个问题有没有被解决。

2 个赞