PHP 中的cURL库

Jackey PHP 3,150 次浏览 , 没有评论

概述

在设计之初, cURL Client URL Library )是一种作为使用 URL 语法传输数据的命令行工具。通过 cURL 库,我们可以在 PHP 脚本中自由地使用某种协议来获取或者提交数据,比如获取 HTTP 请求数据。简单的来说,cURL 是客户端向服务器请求资源的工具。

curl的优势

PHP 中,想要获取某个 URL 的内容其实很简单,有多种实现方法,比如使用file_get_contents() 函数:

  1. <?php
  2. $content = file_get_contents("https://ijackey.com");
  3. var_dump($content);

 

虽然 file_get_contents() 函数使用起来很方便,但是不够灵活,也没法进行错误处理。在一些复杂的请求中,不能够设置请求头、 Cookie 、代理、认证等相关信息,更不能向某个服务器提交表单数据,上传文件。

cURl 库不但支持丰富的网络协议,而且提供了设置各种 URL 请求参数的方法,功能强大。 cURL 的使用场景有很多,比如访问网页资源,获取 WebService 接口数据、下载FTP 服务器文件。

curl命令行常见用法

1.获取页面内容
当我们不加任何选项使用
curl 时,默认会发送 GET 请求来获取链接内容到标准输出。

curl http://www.baidu.com

2.显示 HTTP
如果我们只想要显示
HTTP 头,而不显示文件内容,可以使用 -I 选项:

curl -I http://www.baidu.com

输出为:

HTTP/1.1 200 OK
Server: nginx/
1.10.3
Date: Thu, 11 May 2017 08:24:45 GMT
Content-Type: text/html; charset=utf-
8
Content-Length: 24206
Connection: keep-alive
X-Powered-By: Express
Cache-Contro
l: public, max-age=0
ETag: W/"5e8e-Yw5ZdnVVly9/aEnMX7fVXQ"
Vary: Accept-Encoding

也可以同时显示 HTTP 头和文件内容,使用 -i 选项:

curl -i http://www.baidu.com

输出为:

HTTP/1.1 200 OK
Server: nginx/
1.10.3
Date: Thu, 11 May 2017 08:25:46 GMT
Content-Type: text/html; charset=utf-
8
Content-Length: 24206
Connection: keep-alive
X-Powered-By: Express
Cache-Contro
l: public, max-age=0
ETag: W/"5e8e-Yw5ZdnVVly9/aEnMX7fVXQ"
Vary: Accept-Encoding
<!DOCTYPE html>
<html lang=
"en">
......
</html>

3.将链接保存到文件
我们可以使用
> 符号将输出重定向到本地文件中。

curl http://www.codebelief.com > index.html

也可以通过 curl 自带的 -o/-O 选项将内容保存到文件中。

-o(小写的 o):结果会被保存到命令行中提供的文件名
-O(大写的 O):URL 中的文件名会被用作保存输出的文件名
curl -o index.html http://www.codebelief.com
curl -O http://www.codebelief.com/page/2/

4.同时下载多个文件
我们可以使用
-o -O 选项来同时指定多个链接,按照以下格式编写命令:

curl -O http://www.codebelief.com/page/2/ -O http://www.codebelief.com/page/3/

或者:

curl -o page1.html http://www.codebelief.com/page/1/ -o page2.html http://www.codebelief.com/page/2/

5.使用 -A 自定义 User-Agent
我们可以使用 -A 来自定义用户代理,例如下面的命令将伪装成安卓火狐浏览器对网页进行请求:

curl -A “Mozilla/5.0 (Android; Mobile; rv:35.0) Gecko/35.0 Firefox/35.0” http://www.baidu.com

6.使用 -H 自定义 header
当我们需要传递特定的 header 的时候,可以仿照以下命令来写:

curl -H “Referer: www.example.com” -H “User-Agent: Custom-User-Agent” http://www.baidu.com

可以看到,当我们使用 -H 来自定义 User-Agent 时,需要使用 “User-Agent:xxx” 的格式。
我们能够直接在
header 中传递 Cookie,格式与上面的例子一样:

curl -H “Cookie: JSESSIONID=D0112A5063D938586B659EF8F939BE24” http://www.example.com

另一种方式会在下面介绍。

7.使用 -c 保存 Cookie
当我们使用 cURL 访问页面的时候,默认是不会保存 Cookie 的。有些情况下我们希望保存 Cookie 以便下次访问时使用。例如登陆了某个网站,我们希望再次访问该网站时保持登陆的状态,这时就可以现将登陆时的 Cookie 保存起来,下次访问时再读取。
-c 后面跟上要保存的文件名。

curl -c "cookie-example" http://www.baidu.com

8.使用 -b 读取 Cookie

curl -b “cookie-example” http://www.example.com

-b 后面既可以是 Cookie 字符串,也可以是保存了 Cookie 的文件名。

9.使用 -d 发送 POST 请求
我们以登陆网页为例来进行说明使用
cURL 发送 POST 请求的方法。假设有一个登录页面www.example.com/login,只需要提交用户名和密码便可登录。我们可以使用 cURL 来完成这一 POST 请求,
-d 用于指定发送的数据,-X 用于指定发送数据的方式:

curl -d “userName=tom&passwd=123456” -X POST http://www.example.com/login

在使用 -d 的情况下,如果省略 -X,则默认为 POST 方式:

curl -d “userName=tom&passwd=123456” http://www.example.com/login

10.强制使用 GET 方式
发送数据时,不仅可以使用
POST 方式,也可以使用 GET 方式,例如:

curl -d “somedata” -X GET http://www.example.com/api

或者使用 -G 选项:

curl -d “somedata” -G http://www.example.com/api

11.Cookie 登录
当然,如果我们再次访问该网站,仍然会变成未登录的状态。我们可以用之前提到的方法保存
Cookie,在每次访问网站时都带上该 Cookie 以保持登录状态。

curl -c “cookie-login” -d “userName=tom&passwd=123456” http://www.example.com/login

再次访问该网站时,使用以下命令:

curl -b “cookie-login” http://www.example.com/login

这样,就能保持访问的是登录后的页面了。

curl库的使用

基本步骤

要使用 cURL 来发送 URL 请求,步骤大体分为以下四步:

  • 初始化 cURL 会话;
  • 设置请求选项;
  • 执行 cURL 会话;
  • 关闭 cURL 会话;

  1. // 1. 初始化 cURL 会话
  2. $ch = curl_init();
  3. // 2. 设置请求选项
  4. curl_setopt($ch, CURLOPT_URL, "https://segmentfault.com");
  5. curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); # 获取的信息以字符串返
  6. 回,而不是直接输出
  7. curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0); # 禁止 cURL 验证对等证
  8. 书,从而支持 HTTPS 访问
  9. // 3. 执行 cURL 会话
  10. $response = curl_exec($ch);
  11. var_dump($response);
  12. // 4. 关闭 cURL 会话

cURL 主要通过 curl_setopt() 函数设置请求选项,具体的每个选项说明请见
https://secure.php.net/manual/zh/function.curl-setopt.php

错误处理

通过 curl_error() 函数可以查看 cURL 会话错误详情,而 curl_getinfo() 函数可以查看响应信息。因此,通过这两个函数我们可以实现一个简单的错误处理程序,比如我们现在访问一个不存在的 URL 地址:

  1. <?php
  2. // 1. 初始化 cURL 会话
  3. $ch = curl_init();
  4. // 2. 设置请求选项
  5. curl_setopt($ch, CURLOPT_URL, "https://segmentfault.com/test.php");
  6. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); # 获取的信息以字符串返回,而不是直接输出
  7. curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0); # 禁止 cURL 验证对等证书,从而支持 HTTPS 访问
  8. // 3. 执行 cURL 会话
  9. $response = curl_exec($ch);
  10. if ($response === FALSE) {
  11. echo "cURL connert error: " . curl_error($ch);
  12. }
  13. $info = curl_getinfo($ch);
  14. if ($info['http_code'] == 404) {
  15. echo 'HTTP 404';
  16. }
  17. var_dump($response);
  18. // 4. 关闭 cURL 会话

常见案例

POST请求

  1. <?php
  2. function curl_post($url, $data)
  3. {
  4. $ch = curl_init();
  5. CURLOPT_URL => $url,
  6. CURLOPT_RETURNTRANSFER => 1, # 获取的信息以字符串返回
  7. CURLOPT_POST => 1, # 发送 POST 请求
  8. CURLOPT_POSTFIELDS => $data, # POST 请求数据
  9. ]);
  10. $response = curl_exec($ch);
  11. curl_close($ch);
  12. return $response;
  13. }
  14.  
  15. $url = 'http://localhost/test.php';
  16. $data = ['id' => 1, 'username' => 'jochen'];
  17. echo curl_post($url, $data);

cURL 封装库

curl class (https://github.com/php-curl-class/php-curl-class)是一个编写得很好的 cURL 封装库,它可以非常方便地发送 HTTP 请求并与任何类型的 Web API 集成。PHP Curl Class 封装库适用于 PHP 5.35.45.55.67.07.1 HHVM。这个库是众所周知的,并提供了一个非常简单的语法:

  1. <?php
  2. require __DIR__ . '/vendor/autoload.php';
  3.  
  4. use \Curl\Curl;
  5.  
  6. $curl = new Curl();
  7. $curl->get('https://www.example.com/');
  8. if ($curl->error) {
  9. echo 'Error: ' . $curl->errorCode . ': ' . $curl->errorMessage . "\n";
  10. } else {
  11. echo 'Response:' . "\n";
  12. var_dump($curl->response);
  13. }

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

Go