如何获取页面的html源正确?

时间:2014-03-09 16:23:51

标签: php

我使用此代码获取HTML源代码:

    <?php
header('Content-Type: text/html; charset=utf-8');
$html = file_get_html("http://www.google.com/");
echo $html;

但是当我想从here获取源代码时,我没有正确回复,我得到了类似这些字符的内容:

���moY�&�9����i�[S$%ٲ�9������l�l/���F"H�H�VDPJ����˲59��[��v���R�Vɖ3KY��_A����_�  ��so�1�N��T�E"#nܸ��s��=�  ��������?�?�������  ���|������0Vk��Z�2o��E۪  ү�XF�ny���;v�R�ܦ���F�Ƨe˷  ��g����{�������}

1 个答案:

答案 0 :(得分:0)

默认情况下,来自Google的内容会使用某种HTTP压缩方式。两种常用的压缩模式是gzipdeflate。在这里阅读更多相关信息:

http://en.m.wikipedia.org/wiki/HTTP_compression