是否可以使用纯粹的javascript登录网站 - 在客户端

时间:2018-03-13 07:32:54

标签: javascript web-scraping

我设法抓住了不需要使用js登录的网站,以及允许我传递CORS问题的网站的一些帮助(如allorigins),但我无法设法通过登录问题。 我已经看到很多帖子讨论过使用node.js和python beautifulsoup来做这件事,但没有关于如何用javascript做这件事。

那我该怎么做呢? 它甚至可以纯粹在客户端进行吗?

我愿意做所有需要的学习和搜索,但我需要在这个广阔的主题中有一些方向。

2 个答案:

答案 0 :(得分:1)

假设您的意思是使用浏览器内的JavaScript,那么您是如何解决CORS的?如果你这样做了,那么一旦成功登录后页面刷新,你的代码就会停止运行,除非你是浏览器扩展。

如果您的意思是在您的计算机上,那么Node 您正在寻找的内容,但除非您使用Headless Chrome这样的项目,否则您将遇到保存该问题的问题请求之间的cookie,用于跟踪会话并实际保持您的登录状态。

答案 1 :(得分:1)

登录需要与浏览器直接交互,例如保存cookie,返回安全令牌等。

如果您使用html页面中的JavaScript,理论上理论上需要访问其他页面,至少在iFrame中。在iFrame中使用javascript可以做多少限制。

换句话说,你试图模仿像Selenium这样的东西。试试看。它适用于Java。您可以控制浏览器,告诉您该做什么,比如真实用户,并获取结果,甚至制作屏幕截图。

相关问题