wget不显示所有网站数据

时间:2015-06-12 01:49:22

标签: html shell cygwin wget

输入:wget -qO- http://runescape.com/community | grep -i playerCount

输出:<li class="header-top__right-option"><strong id="playerCount">0</strong> Online</li>

在浏览器中:enter image description here

使用cygwin ..我正在尝试使用wget从网页中提取一个数字。如上例所示,playerCount为0.如果您实际加载网页并查看相同的代码,则它是一个完全不同的数字。我怎样才能得到实数?我被告知可能是饼干或用户代理。这在几周前才开始起作用。

2 个答案:

答案 0 :(得分:3)

该值似乎是通过javascript填充的(尽管我无法快速找到请求)。如果是这种情况,那么您就无法通过这种方式获得wgetcurl之类的内容。您需要找到具体请求并发送。

考虑到aadarshs指出的URL(我在第一次看到它时看到但是发现了错误)这样的事情应该有效。

curl -s 'http://www.runescape.com/player_count.js?varname=iPlayerCount&callback=jQuery000000000000000000000_0000000000000' | awk -F '[()]' '{print $2}'

答案 1 :(得分:2)

这对我有用

curl http://runescape.com/community | grep -i playercount

编辑:添加玩家计数链接

curl http://www.runescape.com/player_count.js\?varname\=iPlayerCount\&callback\=jQuery111004241600367240608_1434074587842\&_\=1434074587843