Python并发编程06 /同步/异步调用/异步调用+回调函数

发布时间：2020-12-20 10:51:59 所属栏目：Python 来源：网络整理

导读：目录 Python并发编程06 /同步/异步调用/异步调用+回调函数 1.如何看源码 2.昨日回顾 3.阻塞、同步调用、异步调用 3.1概念 3.2异步调用 3.3同步调用 3.4异步如何取结果 4.异步调用+回调函数 4.1浏览器工作原理 4.2什么叫爬虫 4.3异步调用+回调函数 Python并发

Python并发编程06 /同步/异步调用/异步调用+回调函数
- 1.如何看源码
- 2.昨日回顾
- 3.阻塞、同步调用、异步调用
  - 3.1概念
  - 3.2异步调用
  - 3.3同步调用
  - 3.4异步如何取结果
- 4.异步调用+回调函数
  - 4.1浏览器工作原理
  - 4.2什么叫爬虫
  - 4.3异步调用+回调函数

Python并发编程06 /同步/异步调用/异步调用+回调函数

1.如何看源码

2.昨日回顾

#1.递归锁：RLock，同一把锁，引用一次计数+1，释放一次计数-1，只要计数不为零，其他线程就抢不到，能解决死锁问题。
#2.信号量：同一时刻可以设置抢锁的线程或者进程的数量
#3.GIL锁：全局解释器锁，同一时刻只能一个线程进入解释器，Cpython解释器具有的。
#   优点：保证了解释器的资源数据的安全
#   缺点：单进程的多线程不能利用多核（并行）
#4.GIL锁与自己的锁的区别联系：
#   相同点：都是互斥锁
#   GIL锁保证了解释器数据资源的安全
#   自己的锁保证的是进程线程中的数据安全
#5.线程池、进程池：控制开启线程或者进程的数量
#6.IO密集型：单进程的多线程并发
#  计算密集型：多进程并发或者并行

3.阻塞、同步调用、异步调用

3.1概念

进程运行的三个状态：运行，就绪，阻塞
执行的角度：
    阻塞：程序运行时，遇到了IO，程序挂起，CPU被切走
    非阻塞：程序没有遇到IO，程序遇到IO但是通过某种手段，让CPU强行运行我的程序
提交任务的角度：
    同步：提交一个任务，自任务开始运行直到此任务结束（可能有IO），返回一个返回值之后，我再提交下一个任务
    异步：一次提交多个任务，然后就执行下一行代码
    返回结果如何回收？
    
#给三个人发布任务:
#同步: 先告知第一个人完成写书的任务,我从原地等待,等他两天之后完成了,告诉完事了,我在发布下一个任务......
#异步: 直接将三个任务告知三个人,我就忙我的我,直到三个人完成之后,告知我.

3.2异步调用

异步调用返回值如何接收？
# from concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor
# import time
# import random
# import os
# 
# def task(i):
#     print(f'{os.getpid()}开始任务')
#     time.sleep(random.randint(1,3))
#     print(f'{os.getpid()}任务结束')
#     return i
# if __name__ == '__main__':
# 
#     # 异步调用
#     pool = ProcessPoolExecutor()
#     for i in range(10):
#         pool.submit(task,i)
# 
#     pool.shutdown(wait=True)
#     # shutdown: 让我的主进程等待进程池中所有的子进程都结束任务之后,在执行. 有点类似与join.
#     # shutdown: 在上一个进程池没有完成所有的任务之前,不允许添加新的任务.
#     # 一个任务是通过一个函数实现的,任务完成了他的返回值就是函数的返回值.
#     print('===主')

3.3同步调用

# from concurrent.futures import ProcessPoolExecutor,3))
#     print(f'{os.getpid()}任务结束')
#     return i
# if __name__ == '__main__':
# 
#     # 同步调用
#     pool = ProcessPoolExecutor()
#     for i in range(10):
#         obj = pool.submit(task,i)
#         # obj是一个动态对象,返回的当前的对象的状态,有可能运行中,可能(就绪阻塞),还可能是结束了.
#         # obj.result() 必须等到这个任务完成后,返回了结果之后,在执行下一个任务.
#         print(f'任务结果:{obj.result()}')
# 
#     pool.shutdown(wait=True)
#     # shutdown: 让我的主进程等待进程池中所有的子进程都结束任务之后,任务完成了他的返回值就是函数的返回值.
#     print('===主')

3.4异步如何取结果

方式一: 异步调用,统一回收结果.
# from concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor
# import time
# import random
# import os
#
# def task(i):
#     print(f'{os.getpid()}开始任务')
#     time.sleep(random.randint(1,3))
#     print(f'{os.getpid()}任务结束')
#     return i
#
# if __name__ == '__main__':
#
#     # 异步调用
#     pool = ProcessPoolExecutor()
#     l1 = []
#     for i in range(10):
#         obj = pool.submit(task,i)
#         l1.append(obj)
#
#     pool.shutdown(wait=True)
#     print(l1)
#     for i in l1:
#         print(i.result())
#     print('===主')
# 统一回收结果: 我不能马上收到任何一个已经完成的任务的返回值,我只能等到所有的任务全部结束统一回收.

4.异步调用+回调函数

4.1浏览器工作原理

#向服务器发送一个请求，服务端验证你的请求，如果正确，给你的浏览器返回一个文件
#浏览器接收到文件，将文件里面的代码渲染成你看到的好看的模样。

4.2什么叫爬虫

#1.利用代码模拟一个浏览器，进行浏览器的工作流程得到一堆源代码
#2.对源代码进行数据清洗得到想要的数据

4.3异步调用+回调函数

# 版本一:
# from concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor
# import time
# import random
# import os
# import requests
# def task(url):
#     '''模拟的就是爬取多个源代码 一定有IO操作'''
#     ret = requests.get(url)
#     if ret.status_code == 200:
#         return ret.text
# def parse(content):
#     '''模拟对数据进行分析 一般没有IO'''
#     return len(content)
# if __name__ == '__main__':
#     # 开启线程池,并发并行的执行
#     url_list = [
#         'http://www.baidu.com',#         'http://www.JD.com',#         'http://www.taobao.com',#         'https://www.cnblogs.com/jin-xin/articles/7459977.html',#         'https://www.luffycity.com/',#         'https://www.cnblogs.com/jin-xin/articles/9811379.html',#         'https://www.cnblogs.com/jin-xin/articles/11245654.html',#         'https://www.sina.com.cn/',#     ]
#     pool = ThreadPoolExecutor(4)
#     obj_list = []
#     for url in url_list:
#         obj = pool.submit(task,url)
#         obj_list.append(obj)
#     pool.shutdown(wait=True)
#     for res in obj_list:
#         print(parse(res.result()))
# # '''
# parse(res.result())
# parse(res.result())
# parse(res.result())
# parse(res.result())
# parse(res.result())
# parse(res.result())
# parse(res.result())
# parse(res.result())
# parse(res.result())
# print('===主')
# 版本一:
#     1. 异步发出10个任务,并发的执行,但是统一的接收所有的任务的返回值.(效率低,不能实时的获取结果)
#     2. 分析结果流程是串行,影响效率.

版本二: 针对版本一的缺点2,改进,让串行编程并发或者并行.
# from concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor
# import time
# import random
# import os
# import requests
#
# def task(url):
#     '''模拟的就是爬取多个源代码 一定有IO操作'''
#     ret = requests.get(url)
#     if ret.status_code == 200:
#         return parse(ret.text)
# def parse(content):
#     '''模拟对数据进行分析 一般没有IO'''
#     return len(content)
# if __name__ == '__main__':
#     # 开启线程池,url)
#         obj_list.append(obj)
#     '''
#     # 1 在开一个线程进程池,并发并行的处理. 再开一个线程进程池,开销大.
#     # 2 将原来的任务扩大,#     版本一:
#         线程池设置4个线程,异步发起10个任务,每个任务是通过网页获取源码,并发执行,#         最后统一用列表回收10个任务,串行着分析源码.
#     版本二:
#         线程池设置4个线程,每个任务是通过网页获取源码+数据分析,#         最后将所有的结果展示出来.
#         耦合性增强了.
#         并发执行任务,此任务最好是IO阻塞,才能发挥最大的效果
#     '''
#     pool.shutdown(wait=True)
#     for res in obj_list:  # [obj1,obj2,obj3....obj10]
#         print(res.result())

版本三:
# 基于 异步调用回收所有任务的结果我要做到实时回收结果,# 并发执行任务每个任务只是处理IO阻塞的,不能增加新得功能.
# 异步调用 + 回调函数
# from concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor
# import time
# import random
# import os
# import requests
# 
# def task(url):
#     '''模拟的就是爬取多个源代码 一定有IO操作'''
#     ret = requests.get(url)
#     if ret.status_code == 200:
#         return ret.text
# def parse(obj):
#     '''模拟对数据进行分析 一般没有IO'''
#     print(len(obj.result()))
# 
# if __name__ == '__main__':
#     # 开启线程池,#     ]
#     pool = ThreadPoolExecutor(4)
#     for url in url_list:
#         obj = pool.submit(task,url)
#         obj.add_done_callback(parse)
# 
#     '''
#     线程池设置4个线程,#     当一个任务完成之后,将parse这个分析代码的任务交由剩余的空闲的线程去执行,你这个线程继续去处理其他任务.
#     如果进程池+回调: 回调函数由主进程去执行.
#     如果线程池+回调: 回到函数由空闲的线程去执行.

# 异步 回调是一回事儿?
# 异步站在发布任务的角度,# 站在接收结果的角度: 回调函数 按顺序接收每个任务的结果,进行下一步处理.

# 异步 + 回调:
# 异步处理的IO类型.
# 回调处理非IO

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!