【BUG】PDF文字复制/添加到脑图时中文标点变英文,以及局部乱码

epub文件转化为PDF,从该PDF中选中一段文字,添加脑图节点或复制文字时,复制结果不正确。

这是margin note复制出来的文字(文字不正确):

PQ4R法(Pre?iew-预习,Question-提问,Read-阅读,Reflect-反思,Recite-复述,Re?iew-复习)的一个修改版。

这是Adobe阅读器、pdf expert复制出来的文字(文字正确):

PQ4R法(Preview-预习, Question-提问, Read-阅读, Reflect-反 思,Recite-复述,Review-复习)

存在如下问题:

  1. 提取内容错误,将“v”变成了“?”

  2. 自动将中文符号转为了英文符号,包括逗号、括号等(影响很大,强迫症每次都要手动修改为中文符号。。。)

此问题在iPad和Mac上都有。

你好,出现这个问题的原因是原PDF的文字层质量不高的原因。具体原理可以参见我吗今天发送的微博:
https://weibo.com/6459394864/IA542A8zq?type=like&pcfrom=msgbox

如需解决,可以寻找更高质量的PDF或者订阅我们的OCR Pro功能。

Regards
Scott

这是纯文字版的PDF,不是图片版的,不用OCR​:joy:

我用文字epub转换成PDF,在电脑其他软件上直接复制出来没有问题,但用margin note复制出来,文字就不对啦 :rofl:

如图所示:

这个PDF文件可以下载看下
链接: https://pan.baidu.com/s/1R7BiU0wt74Ar1PDnFHyoog
提取码: 8e78

好像是一个字母的原因,我们会研究下

Regards
Scott

我感觉可能是编码的问题,我之前也遇到过类似的问题。我的一般做法就是直接用OCR软件重新识别文字,再次导出为标准的PDF就不会乱码了。

这真是奇怪了,你那复制出来居然是正常的 :joy:

在我的Mac和iPad上的Margin note 3都出了问题。。。

这个PDF应该没问题,因为在我用的其他所有其他软件上(包括百度云网页端预览、Mac、iPad、Windows、Android所有其他软件)复制出来的文字都是正常的(中文标点、字符正常)。

那可能出问题的地方是:
1、我的Mac和iPad本地配置;
2、Margin note 3 特定版本:Mac Version 3.6.5 (3.6.5003),iPad Version 3.6.5。

@Exodus 你的软件版本是多少呀?

哦,可能是我没有说清楚,使用网盘上的PDF,我的iPad和Mac上出现的情况和你的是一样的,“v”复制粘贴后显示出来也是“?”。上面那张图是经过finereader识别之后的结果。:joy:

第一次遇到这种情况,控制变量法居然失效了,真是奇怪,只能希望开发人员帮忙查查看问题出在哪了 :joy:

下图是百度云复制的结果(文字正确):