最近在 Python 爬虫入门,发现各种书籍写法不一样,该看(用)哪一个呢?

2019-05-24 03:27:46 +08:00
 storypanda

关于爬虫的话,《 Python 网络采集》一书在介绍 BbeautifulSoup 时写

from urllib.request import urlopen

同样这本书,随后

from bs4 import BeautifulSoup
html = urlopen("http://www......")
bsObj = BeautifulSoup(html.read())
print(bsObj.h1)

《用 Python 写网络爬虫》写

import urllib.request

还是这本书:

def download(url): 
    return urllib.request.urlopen(url).read() 

#感觉是之前代码( html = )的简写?此处也没有定义 url,可能 urlopen 可以直接定义

之前崔大的 Python 2.7 的文章:

import urllib2
response = urllib2.urlopen(url) #此处突然出现 response 等内容,第一个书里的代码直接就有 read 了
print response.read() 

感觉 Python 写法多种多样,自己的博客Python 爬虫初见里也总结了一下from … import …与 import 的区别,以及得出

urllib 通用库>urllib.quest>urlopen 函数

但是 import 在没有 from 的情况下也可以直接导入一个 urllib.quest 等,就很奇特?

这个是和其他语言一样,每个人的写法不一样,根据自己的风格来还是?

这是目前单看爬虫书籍学习的疑惑,求指点以及避坑~

4334 次点击
所在节点    Python
26 条回复
testeststs
2019-05-24 10:53:32 +08:00
这些写法没区别吧,先学点 python 基础的,自然就懂了。
要是不想学,只想完成项目,那就抄。
Root1997
2019-05-24 11:00:59 +08:00
requests 是真的爽。
JimmyTinsley
2019-05-24 11:20:38 +08:00
用 requests 啊
LIBQ
2019-05-24 11:28:43 +08:00
说到底 他们都是一样的 条条大路通罗马 随便一种都可以
lonelygo
2019-05-24 11:59:41 +08:00
大家聚焦 import 的问题,楼主还无法想出来 requests 为啥是 humans http,一直用一直爽。
Qzier
2019-05-24 12:10:01 +08:00
先别写了,先从头开始学

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/567139

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX