c - 如何使用libcurl登录安全网站并获取登录后面的html

在粗略浏览登录页面后，可以使用libcurl，将用户名/密码组合发布到其身份验证页面，并假设他们使用cookie来表示登录会话。第一步是确保您已设置以下选项：

CURLOPT_FOLLOWLOCATION - 服务器可能在验证后重定向，这很常见。
CURLOPT_POST - 这告诉libcurl切换到帖子模式。
CURLOPT_POSTFIELDS - 这告诉libcurl要为帖子字段设置的值。将此选项设置为“userId=<insert username>&password=<insert password>”。该值来自该页面的源代码。
CURLOPT_USERAGENT - 设置一个简单的用户代理，这样Web服务器就不会抛弃它（一些严格的用户代理会这样做）。

然后，一旦帖子完成，libcurl实例应该包含某种类型的授权cookie，用于识别登录用户。 Curl应该跟踪给定实例中的cookie。如果你想调整cookie的行为方式，Curl有很多选项。

确保一旦“登录”，该帐户下的每个请求都使用相同的libcurl实例，否则会看到您已注销。

至于解析生成的页面，有很多用于c的HTML解析器 - 只是google。我唯一要说的是不要自己编写HTML解析器。众所周知，这很棘手，因为很多网站都没有产生好的（甚至是工作的）HTML。