如何使用java检查URL是Doc还是Web页面

时间:2015-02-05 11:55:48

标签: java web-crawler mime

我正在构建类似于URL抓取工具的应用程序,其中我需要区分普通网页和pdf或img或doc。尝试了MIME TYPE检查的所有方式...... :(

1 个答案:

答案 0 :(得分:0)

那将完成这项工作:

URL url = new URL(adress);
URLConnection u = url.openConnection();
String type = u.getHeaderField("Content-Type");
return type;

返回

  

的text / html;字符集= UTF-8

此页面。

相关问题