python爬虫——爬取小说

Python74

一、导入requests和parsel库

requests是一个HTTP请求库,像浏览器一样发送THHP请求来获取网站信息。

parsel是对 HTML 和 XML 进行解析库,

import requests
import parsel

二、获取小说网站内容

通过 url = "https://www.777zw.net/1/1429/" 爬取小说网站内容。

```
url = "https://www.777zw.net/1/1429/"
response = requests.get(url)
responses = response.text.encode('iso-8859-1').decode('gbk')
print(responses)

输入验证码查看隐藏内容

扫描二维码关注本站微信公众号 Johngo学长
或者在微信里搜索 Johngo学长
回复 svip 获取验证码
wechat Johngo学长

相关文章
Python

模块

模块介绍 在Python中,一个py文件就是一个模块,文件名为xxx.py模块名则是xxx,导入模块可以引用模块中已经写好的功能。如果把开发程序比喻成制造一台电脑,编写模块就像是在制造电脑的零部件,准...
Python

字典(dict)

4.7 字典(dict) 字典是Python中一种非常重要的数据类型。字典和之前的列表、元组不同,里面的元素使用 键-值对进行存储。通常字典中元素的 &am...
Python

线程

一、线程概念的引入 进程 之前我们已经了解了操作系统中进程的概念,程序并不能单独运行,只有将程序装载到内存中,系统为它分配资源才能运行,而这种执行的程序就称之为进程。程序和进程的区别就在于:程序是指令...
Python

python包合集-cffi

cffi是连接Python与c的桥梁,可实现在Python中调用c文件。cffi为c语言的外部接口,在Python中使用该接口可以实现在Python中使用外部c文件的数据结构及函数。 1、先通过pip...
Python

读书笔记_python网络编程3_(7)

7.0.网络服务的编写需要面对两个挑战: 只使用一个小节的篇幅来介绍部署的问题,把重点放在如何构建网络Serv软件上。 可将网络Serv分为3大类: 1)单线程Serv(类似于UDP和TCP),着重讨...
Python

流程控制

顺序结构:程序从头到尾顺序依次执行每一个 分支结构:判断看看程序往哪个方向走 循环结构:程序会循环,不断地重复执行同一段代码 分支结构 if 如果 elif 否则如果 # 可多个 可0个 else 否...
Python

python_时间序列_时期及算数运算

Periods and Period Arithmetic# 11.5 时期及其算术运算# 时期(period)表示的是时间区间,⽐如数⽇、数⽉、数季、数# 年等。Period类所表示的就是这种数据类...
Python

Python中的Super详解

这篇文章我们来介绍一下 super,我相信大部分的人使用 super 都是使用这种方式; 就是我有一个 class 比如说是 Male,然后继承另外一个 class 比如是 Person,然后我在这个...
Python

python—总结所学元素及方法

python---总结所学元素及方法 原创 夕陌2022-07-19 11:25:57©著作权 文章标签 警告框 元素定位 参数说明 文章分类 Python 编程语言 ©著作权归作者所有:来自51CT...
Python

python教程:函数的return语句运用

return语句用于退出函数,向调用方返回一个表达式。 return在不带参数的情况下(或者没有写return语句),默认返回None。 None是一个特殊的值,它的数据类型是NoneType。Non...