在维基百科中搜索包含特殊标签的文章

时间:2018-01-13 09:56:59

标签: wikipedia

我想使用标记<chem><math chem>查找所有维基百科文章。 Searching in Wikipedia不考虑<>。我怎么能实现我的目标呢?

1 个答案:

答案 0 :(得分:2)

如果您要查找特定的数学标记,可以使用正则表达式insource:/\<math(.*)\>(.*)\\hat H(.*)\<\/math\>/ 1

我写了一个简短的脚本,从wikidump中提取包含数学和化学标签的所有页面

https://github.com/physikerwelt/wikiFilter

最新结果在这里

https://github.com/physikerwelt/wikiMath17/releases

包括仅包含公式的列表,但不包括整个页面文本。