需求贴:基于ocr的目录创建

场景:每次使用新的PDF文件,都需要重新的做一个目录,但是往往很繁琐,希望有一个插件可以自动识别PDF书本本身的目录的标题和数字自动生成脑图书签
大概的实现场景:

  1. 目录的识别:ocr加分词将目录的文字与页数识别出来。
  2. 设置一个基础页码偏移数,然后将之前识别出来的页数与基础页码偏移数相加。生成新的页数。
    3.点击树状图后自动跳转。

同时是不是可以使用所谓的同文搜索匹配=相同的文字进行定位。

2 个赞

Hello

感谢您的建议,我们会考虑一下的~主要是目前没有成熟的方案可以借鉴。

Kind Regards,
MarginNote-Edward
Support Team

我要没记错在Mac的OCR解决方案里似乎有这个回答,但前提是PDF要有目录才能提取。感兴趣可以论坛内搜一搜

https://bbs.marginnote.com.cn/t/topic/7333?u=katana

那个我从前看过,其实那个软件我也下过差不多的,哎就是想要一个简单的,自动化的,保包装好的。
其实主要还是自己菜,不会写插件,如果会写的话,我就自己尝试尝试了

请问一下,Mac OCR怎么解决?

abbyy,具体见我转到那个帖子