前段时间从新浪的接口获取数据一直采用单线程请求《读:我用爬虫一天时间“偷了”知乎一百万用户,只为证明PHP是世界上最好的语言》
首页 >
http请求
解决http请求字符乱码的bug
上次介绍的http请求函数足够用了,可是在某些时候从浏览器打开url是正常的,使用request_url却只得到一堆乱码,于是翻看手册发现,是由于该url所在的服务器开启了gzip压缩导致。使用curl扩展进行请求时记得开启gzip自动解压
前段时间从新浪的接口获取数据一直采用单线程请求《读:我用爬虫一天时间“偷了”知乎一百万用户,只为证明PHP是世界上最好的语言》
上次介绍的http请求函数足够用了,可是在某些时候从浏览器打开url是正常的,使用request_url却只得到一堆乱码,于是翻看手册发现,是由于该url所在的服务器开启了gzip压缩导致。使用curl扩展进行请求时记得开启gzip自动解压