puppeteer | Tags | EvaCoder

「 puppeteer 」从puppeteer谈前端爬虫检测和绕过

Posted on 2019年2月14日

检测Headless Chrome/ webdriver/ selenium/ puppeteer 爬虫检测是一个攻防的过程，js是裸露在外的，在坏人手里的，我们只能想办法提高作恶的成本。各处搜集整理信息了很久，后来发现这篇文章讲的非常清楚，本地化一下，加上一些自己的理解。 phantom，webdriver，puppeteer等爬虫都有设置的方法，本

「 puppeteer 」puppeteer初尝试

Posted on 2019年2月13日

上一篇中我们通过自己手写代码完成了抓取list页中的基本数据，可是沙沙又提出了新的需求，如何抓取到每个酒店的装修时间和客房数量呢？我让她自己去研究八爪鱼去了，但是如果是真的撩妹，这可不就前功尽弃了。正好最近在研究反作弊中判断是否是webdriver，headless chrome，发现一个神器puppeteer，不需要学习python，用nodeJS就可以

「 puppeteer 」前端如何爬虫

Posted on 2019年2月12日

本文又名十行代码帮你撩妹。需求今天沙沙在群里向我们紧急求助，领导让她整理【携程江湾五角场地区的260家酒店的名称，价格，地址，网址，评分信息制成excel】。 PM（也是前php开发者）咕咕推荐了【八爪鱼】这个工具，不懂技术的小白也能抓取数据。作为一个程序员，很惭愧的说自己其实没接触过爬虫，之前说的要学python也没学几天就放弃了，现学肯定来不及了，