我正试图通过访问编辑页面从旧的MediaWiki网站上获取内容。要做到这一点,我需要登录。这应该意味着我将能够在textarea字段中没有任何html的情况下获取内容和标记。
该网站似乎没有启用api,而且它似乎是一个相当旧的版本,至少自2010年以来未升级。
当我尝试POST登录
时,会发送wikidb_mw__session
个Cookie
/w/index.php?title=Special:Userlogin&action=submitlogin&type=login
使用wpName=usrname&wpPassword=userpass&wpLoginattempt=Log+in
但是当我提供此cookie并尝试使用POST再次登录时 返回的内容说我提供的用户名不正确。
如果我使用浏览器登录,我会根据实时标头发回wikidb_mw_UserID
,wikidb_mw_UserName
和wikidb_mw_Token
个Cookie。
只是想知道还有什么其他会话cookie允许我登录。
答案 0 :(得分:1)
使用编辑页面导出内容不是一个好主意。您可以使用Special:Export
来获取XML。
例如,要从Wikipedia导出有关StackOverflow的文章,请替换它的URL
与