我想使用标记<chem>
和<math chem>
查找所有维基百科文章。 Searching in Wikipedia不考虑<
和>
。我怎么能实现我的目标呢?
答案 0 :(得分:2)
如果您要查找特定的数学标记,可以使用正则表达式insource:/\<math(.*)\>(.*)\\hat H(.*)\<\/math\>/
1。
我写了一个简短的脚本,从wikidump中提取包含数学和化学标签的所有页面
https://github.com/physikerwelt/wikiFilter
最新结果在这里
https://github.com/physikerwelt/wikiMath17/releases
包括仅包含公式的列表,但不包括整个页面文本。