爬虫与诡异的字体
本来吧,这节课准备写我自己期待很久的Javascript对抗的,但是发现上节课讲了偏技术的Cookie感觉反响一般,所以还是准备再插几节闲聊猎奇型的反爬技巧,再到最终的Javascript吧,放最后一篇文章写,不然我害怕写完那篇,就写不动了。好了,同
阅读全文→本来吧,这节课准备写我自己期待很久的Javascript对抗的,但是发现上节课讲了偏技术的Cookie感觉反响一般,所以还是准备再插几节闲聊猎奇型的反爬技巧,再到最终的Javascript吧,放最后一篇文章写,不然我害怕写完那篇,就写不动了。好了,同
阅读全文→前两篇文章算是讲了最常规的两种反爬,本篇文章理论上应该说说登录,因为基本上这三个反爬套路结束之后,其他都是小众了。不过登录这个东西真的没太多可讲的,因为严格来说登录并不是反爬,只是一种保护手段,后面有时间简单说说吧。今天咱们要聊的这位主角跟登录倒也有
阅读全文→上一课带大家聊了聊反爬与反反爬最基础的对抗-代理ip,别看这个简单,真正处理好了代理ip基本上解决大半的爬虫问题,包括本节的验证码。很多网站弹出验证码也是因为发现ip重复过多,比如搜狗微信搜索,如果在合理的时间切换ip,就可以完美的躲避掉搜狗微信中的
阅读全文→最近有很多朋友跟我说,“爬虫这东西很简单啊,好像还没学就已经会了,没啥深奥的东西哦。看了你之前的教程,不就是一个队列加一些Http请求吗,不就是写写XPath和正则吗,你们还做个神箭手云爬虫出来?我自己上个厕所就写完了啊。”看来是时候拿出我们压箱底多
阅读全文→本周又和大家见面了,没什么特殊情况,一般是一周一篇原创。发布的时间基本上是在周末,平时还是比较忙碌的。最近在开发自己的博客,过段时间可以和大家分享开发博客中的技术点。如果大家想及时的和我交流的话,可以关注文章最后的微信公众号,这样我可以比较及时的知道
阅读全文→不仅是人,其实老鼠也难以放弃「沉没成本」。明尼苏达大学的神经科学博士 Brian Sweis 及团队设计了一个非常有意思的实验来研究老鼠的沉没成本,并且给这个实验取了一个名字叫「餐厅探险」:具体的操作是:把老鼠放在一个设置了四个「鼠食餐厅」的迷宫里,
阅读全文→最近,发现个人博客的Linux服务器,数据库服务经常挂掉,导致需要重启,才能正常访问,极其恶心,于是决心开始解决问题,解放我的时间和精力(我可不想经常出问题,然后人工重启,费力费时)。分析问题发现问题以后,首先使用 free -mh 指令查看当前服务
阅读全文→阿里巴巴在UCAN 2019设计大会上,推出免费可商用字体——“阿里巴巴普惠体”的事。也就是说,除了思源黑体外,我们终于又有了另一种免费字体选择。而在阿里巴巴的官方声明中,也明确写明了:“阿里巴巴普惠体允许任何个人和企业免费使用,包括商用用途,但禁止
阅读全文→在过去的工作中,我曾经面对过5w每秒的高并发秒杀功能,在这个过程中,整个Web系统遇到了很多的问题和挑战。如果Web系统不做针对性的优化,会轻而易举地陷入到异常状态。现在我们一起来讨论下,优化的思路和方法。 1. 请求接口的合理设计一个秒杀
阅读全文→target定义:target 属性规定哪个 DOM 元素触发了该事件。target 事件属性可返回事件的目标节点(触发该事件的节点),如生成事件的元素、文档或窗口。语法:event.targetevent.target.nodeName //获
阅读全文→