异步请求
三月 04, 2025
tetle:python2
异步请求
- 发送请求时,程序不会等待响应,而是回直接返回继续执行其他任务,当请求先赢回来时,程序会收到回调通知来处理这个响应
- 使用aiohttp和asyncio来实现异步请求
- async用于定义异步函数,表示改函数为协程函数(协程函数是可以暂停和恢复的程序)
- await用于等等异步操作完成,当异步程序遇到await时会暂停等待await后面操作完成,不会影响其他异步执行
- asyncio是标准库,用于事件的循环实现,通过asyncio来启动事件循环
爬虫
- 发送HTTP请求
- 解析HTML内容
- 提取数据
- 储存数据
使用beautifulsoup库来提取网页数据,对于html和xml文件非常实用
如果发生中文乱码问题可以通过chardet来自动检测编码,在知道编码的情况下可以通过response.encoding=‘ ’来设置
查找标签:通过find()和find-all()方法,find返回一个匹配标签,但是find-all返回所有匹配标签
通过grt-text()方法查看标签文本内容
还可以通过parent和children属性来访问父与子标签
还可以通过传递属性来查找所有具有特定属性的标签
查看评论