如何从CURL响应中删除HTTP标头?

时间:2011-02-28 13:55:40

标签: php curl http-headers

我有一个PHP脚本只返回纯文本没有任何HTML。现在我想对该脚本发出cURL请求,我得到以下响应:

HTTP/1.1 200 OK
Date: Mon, 28 Feb 2011 14:21:51 GMT
Server: Apache/2.2.14 (Ubuntu)
X-Powered-By: PHP/5.2.12-nmm2
Vary: Accept-Encoding
Content-Length: 6
Content-Type: text/html

6.8320

实际响应仅为 6.8320 ,因为没有任何HTML的文本。我想通过删除标题信息从上面的响应中检索它。

我已经将脚本缩小了一点:

$url = $_GET['url'];

if ( !$url ) {

  // Passed url not specified.
  $contents = 'ERROR: url not specified';
  $status = array( 'http_code' => 'ERROR' );

} else if ( !preg_match( $valid_url_regex, $url ) ) {

  // Passed url doesn't match $valid_url_regex.
  $contents = 'ERROR: invalid url';
  $status = array( 'http_code' => 'ERROR' );

} else {
  $ch = curl_init( $url );

  if ( strtolower($_SERVER['REQUEST_METHOD']) == 'post' ) {
    curl_setopt( $ch, CURLOPT_POST, true );
    curl_setopt( $ch, CURLOPT_POSTFIELDS, $_POST );
  }

  curl_setopt( $ch, CURLOPT_FOLLOWLOCATION, true );
  curl_setopt( $ch, CURLOPT_HEADER, true );
  curl_setopt( $ch, CURLOPT_RETURNTRANSFER, true );

  curl_setopt( $ch, CURLOPT_USERAGENT, $_GET['user_agent'] ? $_GET['user_agent'] : $_SERVER['HTTP_USER_AGENT'] );

  list( $header, $contents ) = preg_split( '/([\r\n][\r\n])\\1/', curl_exec( $ch ), 2 );

  $status = curl_getinfo( $ch );

  curl_close( $ch );
}

// Split header text into an array.
$header_text = preg_split( '/[\r\n]+/', $header );

if ( true ) {
  if ( !$enable_native ) {
    $contents = 'ERROR: invalid mode';
    $status = array( 'http_code' => 'ERROR' );
  }

  // Propagate headers to response.
  foreach ( $header_text as $header ) {
    if ( preg_match( '/^(?:Content-Type|Content-Language|Set-Cookie):/i', $header ) ) {
      header( $header );
    }
  }
  print $contents;
}

知道我需要更改什么才能从响应中删除标头信息吗?

10 个答案:

答案 0 :(得分:73)

只需将CURLOPT_HEADER设为false。

答案 1 :(得分:48)

在你的卷曲电话之后这样做:

$header_size = curl_getinfo($ch, CURLINFO_HEADER_SIZE);
$header = substr($response, 0, $header_size);
$body = substr($response, $header_size);

答案 2 :(得分:4)

如果有其他人需要,只是为了以后使用。我遇到了同样的情况,但只需删除标题文本,而不是内容。我在标题中得到的回应是(包括空格):

HTTP/1.1 200 OK
Cache-Control: private, no-cache, no-store, must-revalidate
Content-Language: en
Content-Type: text/html
Date: Tue, 25 Feb 2014 20:59:29 GMT
Expires: Sat, 01 Jan 2000 00:00:00 GMT
Pragma: no-cache
Server: nginx
Vary: Cookie, Accept-Language, Accept-Encoding
transfer-encoding: chunked
Connection: keep-alive

我想从HTTP开始删除,直到使用空格保持活动:

$contents = preg_replace('/HTTP(.*)alive/s',"",$contents);

这对我有用。

答案 3 :(得分:2)

将CURLOPT_HEADER的值更新为0表示错误

curl_setopt($ch, CURLOPT_HEADER, 0);

答案 4 :(得分:1)

如果您使用的是nuSoap,则可以访问包含$nsoap->responseData$nsoap->response标题的数据,如果您需要完整的标题。

以防有人需要。

答案 5 :(得分:1)

如果由于某种原因你必须以curl_setopt($ch, CURLOPT_HEADER, 1);来获取cookie,以下内容对我有用。不确定它是否100%可靠但值得一试

$foo = preg_replace('/HTTP(.*)html/s',"",$curlresult);

答案 6 :(得分:0)

$content = null;

$ch = curl_init();
$rs = curl_exec($ch);

if (CURLE_OK == curl_errno($ch)) {
  $content = substr($rs, curl_getinfo($ch, CURLINFO_HEADER_SIZE));
}

curl_close($ch);

echo $content;

答案 7 :(得分:0)

如果有人已经将curl响应保存到文件中(例如我),因此不知道使用substr的标题有多大,请尝试:

$file = '/path/to/file/with/headers';
file_put_contents($file, preg_replace('~.*\r\n\r\n~s', '', file_get_contents($file)));

答案 8 :(得分:-2)

请勿设置CURLOPT_HEADER

答案 9 :(得分:-2)

只是不要在curl请求中设置curl_header或将其设置为z or false
像这样 curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_HEADER, false);