W4J音乐热评一Puppeteer设置代理IP
- 当频繁的爬取难免会被网站发现被封锁IP,这个时候代理IP就显得很重要.
- 毕竟,魔高一尺,道高一丈.知己知彼,百战不殆.🤓
阿布云HTTP隧道
- 经过百般筛选,我最终选择阿布云服务,详细信息可点击查看.
- 选择其中的
HTTP隧道(动态版)
,动态版HTTP隧道会为每个请求从IP池中挑选一个随机IP。 - 也就是说我们的每次爬取都将从一个随机ip发出请求。
- HTTP隧道基于HTTP协议,支持HTTP/HTTPS协议的数据接入。
- 平台在云端维护一个全局IP池供HTTP隧道使用,池中的IP会不间断更新,以保证IP池中有足够多的IP供用户使用。
购买隧道服务
- 进入到管理页面,选择
HTTP隧道=>动态版
,点击右上角选购隧道
- 首先选择时间单位,可小时,天,月,周,季,年.我一般选择时,2个小时足以.
- 隧道数为1即可,但下面的请求数建议按照并发数来设置,比如并发的浏览器示例为5,设置请求数为5,因为他会默认2个请求数,这样就7个.
- 保证每个浏览器示例使用的ip不冲突.
- 随用随买,贼方便,购买完成后会需要
通行证书
和通行密钥
两个参数,保留好我们接下来会使用.
隧道服务使用方法
- 需要登陆到HTTP隧道服务器,一般是
http://http-dyn.abuyun.com:9020
这个地址. - 这就需要用到我们上面提到的
通行证书
和通行密钥
- 改造一下我们的代码.
|
- 简单三步,设置完成,要想验证一下是否成功.
- 先不设置代理,
headless
设置false
显示浏览器,在打开的浏览器中,百度搜过ip查看一下默认ip.- 本机IP: 123.1*9.17.6 北京市北京市 联通
- 再设置上代理,保持
headless
设置不变,查看ip地址.- 本机IP: 120.2.5.0 河北省保定市 联通
- 多试几次会发现,设置的ip都是随机的.
- 先不设置代理,
- 至此我们的设置代理ip就完成了.