mdsk.net
当前位置:首页 >> 新手用python3写网络爬虫可是下载总不成功 >>

新手用python3写网络爬虫可是下载总不成功

urllib.request.urlretrieve(imgurl,'d://google.png') 不是html是png,PNG格式用ASCII编码打开当然是乱码啦

知乎 有个不错的答案 http://www.zhihu.com/question/20899988 关于爬虫入门的回答 很详细了~~~~

python3中print不再是关键字,需要使用括号 print(response.read()) url那个是因为你后面没有用冒号引起来,应该是 url="http://www.douban.com"

requests.get返回的网页编码是utf8 在控制台输出的时候需要转换成gbk print html.text.encode('gbk')

都差不多,不行就两个都安上,开发嘛,谁没个十几二十个解释器呢,

有没有编程基础?如果以前学过其他语言,底子比较好,那么从开始学Python到写出一个最简单的爬虫几天就可以搞定。如果没有编程基础,对普通人来说需要的时间就长了,光是学Python就很费时间,因为要打基矗

写了个爬虫

可能是python中print不再是关键字,需要使用括号 print(response.read()) url那个是因为你后面没有用冒号引起来,应该是 url="http://www.douban.com"

以前有过类似的问题 可以参考下: https://www.zhihu.com/question/55941190

了解html和简单的js,只有了解你要抓取的页面,在获取后才能有效分析。建议系统学习html这个很简单;js较复杂不必多看,可以边分析边百度资料学习。 python方面,了解urllib和urllib2两个库,在抓取页面要用到。Cookielib这个库配合urllib2可以...

网站首页 | 网站地图
All rights reserved Powered by www.mdsk.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com