从slidehare幻灯片中抓取文本(用于多个演示文稿)

时间:2017-06-01 12:57:35

标签: python web-scraping scrapy

是否有任何方法/包/框架可以从slidehare上的幻灯片中删除文本?我能想到的唯一方法是将幻灯片下载为pdf,然后运行OCR工具来提取文本。我想知道是否有更优雅的方式来做到这一点?理想情况下,我希望为多个演示文稿执行此操作,我正在寻找一种自动执行此过程的方法。

EDIT : Adding example

一个例子就是说这张幻灯片有很多元素。但是在评论之下,我们只能获得幻灯片的标题。我希望我们可以从这张幻灯片中删除整个文本。

https://developers.google.com/places/ios-api/autocomplete

This is what is shown below the comments

0 个答案:

没有答案