从维基百科转储中提取链接信息

时间:2014-12-26 18:44:11

标签: java wikipedia-api

我想处理一个维基百科转储,以便每个维基百科页面,我可以获得一个(超链接文本,页面网址)列表,每个链接(到维基百科)一个页面。例如,对于page

(road racing cyclist,http://en.wikipedia.org/wiki/Road_bicycle_racing)  
(Tour de France,http://en.wikipedia.org/wiki/Tour_de_France)  
Union Cycliste Internationale,http://en.wikipedia.org/wiki/Union_Cycliste_Internationale)  
..

有没有这样做的图书馆?

0 个答案:

没有答案