关于摘录,有点奇怪(且严峻)的问题,脑图文字出错。

买了mn的iPad版和Mac版,又买了OCR年费。

用Mac版的过程发现一个很怪的现象,文字版PDF,采用文字摘录工具(A按钮),摘录到脑图中居然出错!比如原文为system,在脑图节点中居然成了“svstem”

PDF确认是文字版——粘贴到其它文本编辑器里都完全正常。

难道最新版mn无论原文本身是文字版还是扫描版,都当成图像进行OCR???
(细看摘录过程,采用文本摘录时,被选中的内容有类似于荧光笔的半透明色带,色带高度没有完全覆盖原文字体高度,比如字母y,就只有上半部,下部延伸的一笔未被色带覆盖,正好跟脑图节点中被错误识别的结果v相符)

mn采用的OCR引擎不错,带来了极大的便利——使得扫描版PDF也“可编辑、可查询”,但OCR无论效果再好,准确率也不可能超过文字自身,如果已经是文字版、却当作图像再进行OCR识别,完全是多此一举。

希望这个问题能得到解答。

有些PDF的文字层做的比较差,还是很需要OCR的

Hello

是的,所以提供了可选项,有些PDF是doc转成的PDF,所以没有必要再使用ocr 去校正一下,使用文档本身的会更准确,您可以依照不同PDF选择不同的处理方式。

Kind Regards,
MarginNote-Relight
Support Team

谢谢,我各种方式都试一下。

只是有点奇怪,为什么拷贝到其它文本编辑器上是正确的(说明的确是文字、而非图像),进了脑图就出错。

Hello

这可能是开启了文本校正,您断网下再试试呢?还不行的话您可以发送这个PDF给我们测试下呢

Kind Regards,
MarginNote-Relight
Support Team

文本矫正无论是否关闭都一样。

pdf确实是文字版的,其它地方(其它文本编辑器)都是正确的(文字的拷贝、粘贴),但在MN3里,用A选择后加入脑图就会出错——感觉就像“即使是文字、也当作图像来识别”,而且还识别错误。

例如,p13最右边、最上面一段文字“The second reason why systems are linearized is to reduce the problem of nonlinear instability.”,

在MN里用文字选择、加入脑图,就变成了“Whe second reason why svstems are linearized is to reduce the”

p18标题“Swept Spectrum Analyzer”, 在MN里用文字选择,加入脑图,就变成了“Swept Spectrum Analvzer”——字母y没有了尾巴。FFT DSA-HP-The Fundamentals of Signal Analysis-an243-TTSok.pdf (3.9 MB)

Hello

哦,这个PDF在在MarginNote3中是乱码,所以会自动校正的,我会反馈一下的。

Kind Regards,
MarginNote-Relight
Support Team