首页 > 怎么读出pdf里面的字?

怎么读出pdf里面的字?

我在谷歌的时候发现谷歌把我的pdf简历里的字都读出来放在搜索的结果里了?好奇这是怎么做到的?


Google对于PDF是有独特的抓取方式的,有些PDF可以抓字,有些可以用OCR识别。
在以图搜图都可以实现的情况下,巨头搜索引擎要是这点都做不到的话那就太有些说不过去了。


如果pdf的内容是文本,例如你的简历,这些内容是可以被解析出来的。如果pdf内容是图片化的文字,如扫描的书稿,里面的内容是可以通过OCR技术识别出来的。所以你的简历被Google抓取,也很正常。

【热门文章】
【热门文章】