异步请求

异步请求

三月 04, 2025

tetle:python2

异步请求

  • 发送请求时,程序不会等待响应,而是回直接返回继续执行其他任务,当请求先赢回来时,程序会收到回调通知来处理这个响应
  • 使用aiohttp和asyncio来实现异步请求
  • async用于定义异步函数,表示改函数为协程函数(协程函数是可以暂停和恢复的程序
  • await用于等等异步操作完成,当异步程序遇到await时会暂停等待await后面操作完成,不会影响其他异步执行
  • asyncio是标准库,用于事件的循环实现,通过asyncio来启动事件循环

爬虫

  • 发送HTTP请求
  • 解析HTML内容
  • 提取数据
  • 储存数据

使用beautifulsoup库来提取网页数据,对于html和xml文件非常实用

如果发生中文乱码问题可以通过chardet来自动检测编码,在知道编码的情况下可以通过response.encoding=‘ ’来设置

查找标签:通过find()和find-all()方法,find返回一个匹配标签,但是find-all返回所有匹配标签

通过grt-text()方法查看标签文本内容

还可以通过parent和children属性来访问父与子标签

还可以通过传递属性来查找所有具有特定属性的标签