用于从网页或HTML文件获取内容的脚本

时间:2015-07-03 11:53:44

标签: html

通过“从网页获取内容”,我的意思是像Pocket那样,即它从所有无关的链接,社交媒体按钮,广告和其他装饰中剥离页面。问题中的网页大多是文章。任何编程语言的脚本都会有所帮助。

1 个答案:

答案 0 :(得分:0)

你可以使用PHP + cURL相对容易。您必须调查PHP语言和cURL扩展。您可以像操作DOM一样获取HTML,并解析HTML,删除您不想显示的内容。

如果您的脚本出现问题,请尽快与我们联系。

祝你好运。