使用jsoup忽略来自网址的垃圾广告/广告

时间:2011-11-15 07:43:41

标签: java jsoup

我正在使用jsoup解析器来加载某些网站的内容。通常,一些网站在页面上有广告和其他不相关的东西。有可能忽略这些 在解析网址时?

2 个答案:

答案 0 :(得分:0)

不,Jsoup中没有内置广告链接功能。你必须手动完成(通过检查每个页面的广告网址并匹配它们,例如使用正则表达式)。

答案 1 :(得分:0)

这不是您问题的直接答案,但您可以使用AlchemyAPI。他们有免费的1,000 API调用程序(如果用于学术目的,则为30,000):

http://www.alchemyapi.com/api/text/