问题描述
将扫描版的PDF用FineReader做OCR识别后,导入MarginNote,选中文字的时候只有部分文字能被选中,例如:
今天天气真不戳。
选中的效果(粗体表示可以选中):
今天天气真不戳。
问题复现步骤
- 将扫描PDF文档用FineReader做OCR,输出 text under image PDF。
- 用MarginNote导入文档
- 用Text Expert工具选择文字段落。
涉及的相关软件和版本
- MacOS: 11.4
- MarginNote Mac: 3.7.5 (3.7.5003)
- FineReader Mac: 15.0.1 (170)
补充
- 用其他PDF工具(例如PDF Expert)打开没有这个问题。
- 之前用FineReader12.1.14版本输出的文档没有这个问题。
- 猜测是编码的问题。
更新
看了下FineReader Mac 15输出的PDF Version是1.6,而FineReader Mac 12输出的PDF Version是1.5。
Hello
好的,您方便附带一个PDF吗?我们测试一下,另外您尝试别的PDF浏览器中有问题吗?
Kind Regards,
MarginNote-Relight
Support Team
其他PDF浏览器试过PDF Expert和Adobe Acrobat,都没有问题。
1 个赞
Hello
您好,是有问题,那么您详细的导出设置有个截图吗?语言、编码选择的什么呢?
Kind Regards,
MarginNote-Relight
Support Team
- 导出PDF的选项是默认配置;
- OCR语言是Chinese Simplified;
- FineReader没有编码设置。
应该用任何15版本以上的FineReader导出任意一个PDF都是有这个问题的,不光是这一个文档。
Hello
好的~
Kind Regards,
MarginNote-Relight
Support Team
您好,所以这个问题有解决办法了吗,我也遇到了类似的问题。。。
我现在没用marginnote做笔记了,而是直接在PDF里做标注,另外用emacs的org mode做一个大纲和摘抄的笔记。所以我也没有再验证这个问题有没有被解决。
2 个赞