应朋友需求,帮他写一个这样的工具,时间挺久了,出于各方面自身及其它的原因,一直没有能够帮他去做,也挺内疚的。这次辞职了,有几天时间,从今天起,打算帮他做一下,期间的困难和突破会持续更新在这篇文章里面,看看自己会花多久。
刚上来就给我出了一个题:
抓取豆瓣首页居然是这样子的,查了一些别人的解决方案,发现请求中加一个header就好了,就像这样:
暂时还不明白为什么,先mark一下,原因后面再查。{mark1}
{mark1} 关于原因这篇文章讲得不错
涉及到的知识点有以下这些:
1.用nodejs下载文件
2.上传验证码图片,处理multi-part的表单数据时,需要构造http的body,必须严格到每一个字符,一丝不差,不然图片就会上传失败