python - 进程
一,理论知识1,什么是进程进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是结构的基础。在早期面向进程设计的计算机结构中,进程是程序的基本执行实体;在当代面向线程设计的计算机结构中,进程是线程的容器。程序是指令、数据及其组织形式的描述,进程是程序的实体。 3
注意:同一个程序执行两次,就会在操作系统中出现两个进程,所以我们可以同时运行一个软件,分别做不同的事情也不会混乱。 2,进程调度要想多个进程交替运行,操作系统必须对这些进程进行调度,这个调度也不是随即进行的,而是需要遵循一定的法则,由此就有了进程的调度算法。 <div class="cnblogs_code" onclick="cnblogs_code_show('464db11a-4bf5-4e4c-b2f6-df77a23092fc')"> 先来先服务(FCFS)调度算法是一种最简单的调度算法,该算法既可用于作业调度,也可用于进程调度。FCFS算法比较有利于长作业(进程),而不利于短作业(进程)。由此可知,本算法适合于CPU繁忙型作业,而不利于I/O繁忙型的作业(进程)。 短作业(进程)优先调度算法(SJ/PF)是指对短作业或短进程优先调度的算法,该算法既可用于作业调度,也可用于进程调度。但其对长作业不利;不能保证紧迫性作业(进程)被及时处理;作业的长短只是被估算出来的。
/
1) 应设置多个就绪队列,并为各个队列赋予不同的优先级。第一个队列的优先级最高,第二个队列次之,其余各队列的优先权逐个降低。该算法赋予各个队列中进程执行时间片的大小也各不相同,在优先权愈高的队列中,为每个进程所规定的执行时间片就愈小。例如,第二个队列的时间片要比第一个队列的时间片长一倍,……,第i+2(3) 仅当第一队列空闲时,调度程序才调度第二队列中的进程运行;仅当第1~(i-1)队列均空时,才会调度第i队列中的进程运行。如果处理机正在第i队列中为某进程服务时,又有新进程进入优先权较高的队列(第1~(i-1)中的任何一个队列),则此时新进程将抢占正在运行进程的处理机,即由调度程序把正在运行的进程放回到第i队列的末尾,把处理机分配给新到的高优先权进程。
3,进程的并行与并发并行?:?并行是指两者同时执行,比如赛跑,两个人都在不停的往前跑;(资源够用,比如三个线程,四核的CPU ) 并发?:?并发是指资源有限的情况下,两者交替轮流使用资源,比如一段路(单核CPU资源)同时只能过一个人,A走一段后,让给B,B用完继续给A ,交替使用,目的是提高效率。 区别: 并行是从微观上,也就是在一个精确的时间片刻,有不同的程序在执行,这就要求必须有多个处理器。并发是从宏观上,在一个时间段上可以看出是同时执行的,比如一个服务器同时处理多个session。 ? 4,同步 异步 阻塞 非阻塞状态介绍在了解其他概念之前,首先要了解进程的几个状态。在程序运行的过程中,由于被操作系统的调度算法控制,程序会进入几个状态:就绪,运行和阻塞。 (1)就绪(Ready)状态 当进程已分配到除CPU以外的所有必要的资源,只要获得处理机便可立即执行,这时的进程状态称为就绪状态。 (2)执行/运行(Running)状态当进程已获得处理机,其程序正在处理机上执行,此时的进程状态称为执行状态。 (3)阻塞(Blocked)状态正在执行的进程,由于等待某个事件发生而无法执行时,便放弃处理机而处于阻塞状态。引起进程阻塞的事件可有多种,例如,等待I/O完成、申请缓冲区不能满足、等待信件(信号)等。 ? 同步和异步? ? ??
第一种:前者(排队等候)就是同步等待消息通知,也就是我要一直在等待银行办理业务情况;
第二种:后者(等待别人通知)就是异步等待消息通知。在异步消息处理中,等待消息通知者(在这个例子中就是等待办理业务的人)往往注册一个回调机制,在所等待的事件被触发时由触发机制(在这里是柜台的人)通过某种机制(在这里是写在小纸条上的号码,喊号)找到等待该事件的人。 阻塞和非阻塞? ? ?? 注意:同步非阻塞形式实际上是效率低下的,想象一下你一边打着电话一边还需要抬头看到底队伍排到你了没有。如果把打电话和观察排队的位置看成是程序的两个操作的话,这个程序需要在这两种不同的行为之间来回的切换,效率可想而知是低下的;而异步非阻塞形式却没有这样的问题,因为打电话是你(等待者)的事情,而通知你则是柜台(消息触发机制)的事情,程序没有在两种不同的操作中来回切换。
同步/异步与阻塞/非阻塞
效率最低。拿上面的例子来说,就是你专心排队,什么别的事都不做。
如果在银行等待办理业务的人
实际上是效率低下的。 想象一下你一边打着电话一边还需要抬头看到底队伍排到你了没有,如果把打电话和观察排队的位置看成是程序的两个操作的话,
效率更高, 因为打电话是你(等待者)的事情,而通知你则是柜台(消息触发机制)的事情, 比如说,这个人突然发觉自己烟瘾犯了,需要出去抽根烟,于是他告诉大堂经理说,排到我这个号码的时候麻烦到外面通知我一下,那么他就没有被阻塞在这个等待的操作上面,自然这个就是异步+非阻塞的方式了。
很多人会把同步和阻塞混淆,是 5,进程的创建与结束进程的创建但凡是硬件,都需要有操作系统去管理,只要有操作系统,就有进程的概念,就需要有创建进程的方式,一些操作系统只为一个应用程序设计,比如微波炉中的控制器,一旦启动微波炉,所有的进程都已经存在。 而对于通用系统(跑很多应用程序),需要有系统运行过程中创建或撤销进程的能力,主要分为4中形式创建新的进程: 1. 系统初始化(查看进程linux中用ps命令,windows中用任务管理器,前台进程负责与用户交互,后台运行的进程与用户无关,运行在后台并且只在需要时才唤醒的进程,称为守护进程,如电子邮件、web页面、新闻、打印) 2. 一个进程在运行过程中开启了子进程(如nginx开启多进程,os.fork,subprocess.Popen等) 3. 用户的交互式请求,而创建一个新进程(如用户双击暴风影音) 4. 一个批处理作业的初始化(只在大型机的批处理系统中应用) 无论哪一种,新进程的创建都是由一个已经存在的进程执行了一个用于创建进程的系统调用而创建的。 1 2<span style="color: #000000;">. 在windows中该系统调用是:CreateProcess,CreateProcess既处理进程的创建,也负责把正确的程序装入新进程。
关于创建子进程,UNIX和windows 1<span style="color: #000000;">.相同的是:进程创建后,父进程和子进程有各自不同的地址空间(多道技术要求物理层面实现进程之间内存的隔离),任何一个进程的在其地址空间中的修改都不会影响到另外一个进程。 2.不同的是:在UNIX中,子进程的初始地址空间是父进程的一个副本,提示:子进程和父进程是可以有只读的共享内存区的。但是对于windows系统来说,从一开始父进程与子进程的地址空间就是不同的。 进程的结束1. 正常退出(自愿,如用户点击交互式页面的叉号,或程序执行完毕调用发起系统调用正常退出,在linux中用exit,在windows中用ExitProcess) 2. 出错退出(自愿,python a.py中a.py不存在) 3. 严重错误(非自愿,执行非法指令,如引用不存在的内存,1/0等,可以捕捉异常,try...except...) 4. 被其他进程杀死(非自愿,如kill -9) 二,在python程序中的进程操作之前我们已经了解了一些进程相关的理论知识,了解进程是什么应该不再困难了,刚刚我们已经了解了,运行中的程序就是一个进程。所有的进程都是通过它的父进程来创建的。因此,运行起来的python程序也是一个进程,那么我们也可以在程序中再创建进程。多个进程可以实现并发效果,也就是说,当我们的程序中存在多个进程的时候,在某些时候,就会让程序的执行速度变快。以我们之前所学的知识,并不能实现创建进程这个功能,所以我们就需要借助python中强大的模块。 1,multiprocessing模块仔细说来,multiprocess不是一个模块而是python中一个操作、管理进程的包。 之所以叫multi是取自multiple的多功能的意思,在这个包中几乎包含了和进程有关的所有子模块。由于提供的子模块非常多,为了方便大家归类记忆,我将这部分大致分为四个部分:创建进程部分,进程同步部分,进程池部分,进程之间数据共享。 ?2,multiprocessing.Process模块Process模块介绍process模块是一个创建进程的模块,借助这个模块,就可以完成进程的创建。 强调:
1<span style="color: #000000;">. 需要使用关键字的方式来指定参数 2<span style="color: #000000;">. args指定的为传给target函数的位置参数,是一个元组形式,必须有逗号 参数介绍: 12345 p.join([timeout]):主线程等待p终止(强调:是主线程处于等的状态,而p是处于运行的状态)。timeout是可选的超时时间,需要强调的是,p.join只能join住start开启的进程,而不能join住run开启的进程
12345 p.authkey:进程的身份验证键,默认是由os.urandom()随机生成的32字符的字符串。这个键的用途是为涉及网络连接的底层进程间通信提供安全性,这类连接只有在具有相同的身份验证键时才能成功(了解即可)
在Windows操作系统中由于没有fork(linux操作系统中创建进程的机制),在创建子进程的时候会自动 启动它的这个文件,而在 的时候又执行了整个文件。因此如果将process()直接写在文件中就会无限递归创建子进程报错。所以必须把创建子进程的部分使用if ==‘’ 判断保护起来, 的时候 ,就不会递归运行了。
?使用Process模块创建进程在一个python进程中开启子进程,start方法和并发效果。 multiprocessing (( == = Process(target=func,args=(1()
multiprocessing (1( == = Process(target=func,))
p.start()
p.join()
()
multiprocessing (%os.getpid(),%<span style="color: #0000ff;">if <span style="color: #800080;">name == <span style="color: #800000;">'<span style="color: #800000;">main<span style="color: #800000;">'<span style="color: #000000;">:
<span style="color: #0000ff;">print(<span style="color: #800000;">"<span style="color: #800000;">主进程id:<span style="color: #800000;">"<span style="color: #000000;">,os.getpid()) p = Process(target=<span style="color: #000000;">func) p.start() 进阶,多个进程同时运行(注意,子进程的执行顺序不是根据启动顺序决定的) multiprocessing (1 == i range(10= Process(target=func,i))
p.start()
multiprocessing (%1<span style="color: #0000ff;">if <span style="color: #800080;">name == <span style="color: #800000;">'<span style="color: #800000;">main<span style="color: #800000;">'<span style="color: #000000;">:
p_lst =<span style="color: #000000;"> [] <span style="color: #0000ff;">for i <span style="color: #0000ff;">in range(10<span style="color: #000000;">): p = Process(target=func,args=<span style="color: #000000;">(i,)) p.start() p_lst.append(p) <span style="color: #0000ff;">for p <span style="color: #0000ff;">in<span style="color: #000000;"> p_lst:p.join() <span style="color: #0000ff;">print(<span style="color: #800000;">"<span style="color: #800000;">最后再执行父进程:%s<span style="color: #800000;">"%os.getppid()) 除了上面这些开启进程的方法,还有一种以继承Process类的形式开启进程的方式
multiprocessing (,os.getpid(),<span style="color: #0000ff;">if <span style="color: #800080;">name == <span style="color: #800000;">'<span style="color: #800000;">main<span style="color: #800000;">'<span style="color: #000000;">:
p =<span style="color: #000000;"> MyProcess() p.start() <span style="color: #008000;">#<span style="color: #008000;"> 开启一个子进程,让这个子进程执行run方法 <span style="color: #000000;"> p.join() <span style="color: #0000ff;">print(<span style="color: #800000;">'<span style="color: #800000;">主进程:<span style="color: #800000;">'<span style="color: #000000;">,os.getpid()) ============================================ <span style="color: #008000;"># <span style="color: #008000;"> 开启进程的第二种方式 给子进程传参数<span style="color: #0000ff;">import<span style="color: #000000;"> time,os <span style="color: #0000ff;">from multiprocessing <span style="color: #0000ff;">import<span style="color: #000000;"> Process <span style="color: #0000ff;">class<span style="color: #000000;"> MyProcess(Process): <span style="color: #0000ff;">def <span style="color: #800080;">init<span style="color: #000000;">(self,arg): super().<span style="color: #800080;">init<span style="color: #000000;">() self.arg =<span style="color: #000000;"> arg <span style="color: #0000ff;">def<span style="color: #000000;"> run(self): time.sleep(1<span style="color: #000000;">) <span style="color: #0000ff;">print(<span style="color: #800000;">'<span style="color: #800000;">子进程:<span style="color: #800000;">'<span style="color: #000000;">,os.getppid(),self.arg) <span style="color: #0000ff;">if <span style="color: #800080;">name == <span style="color: #800000;">'<span style="color: #800000;">main<span style="color: #800000;">'<span style="color: #000000;">:
?进程间的数据是隔离的 multiprocessing =(<span style="color: #0000ff;">if <span style="color: #800080;">name == <span style="color: #800000;">'<span style="color: #800000;">main<span style="color: #800000;">'<span style="color: #000000;">:
n = 100<span style="color: #000000;"> p = Process(target=<span style="color: #000000;">work) p.start() p.join() <span style="color: #0000ff;">print(<span style="color: #800000;">"<span style="color: #800000;">主进程:<span style="color: #800000;">",n) 守护进程守护进程会随着主进程的结束而结束。 主进程创建守护进程 其一:守护进程会在主进程代码执行结束后就终止 其二:守护进程内无法再开启子进程,否则抛出异常:AssertionError: daemonic processes are not allowed to have children 注意:进程之间是互相独立的,主进程代码运行结束,守护进程随即终止 multiprocessing =( % == = Myprocess(= True
10)
()
multiprocessing (1231((4563( == = Process(target== Process(target==0.2()
socket聊天并发实例 socket *
multiprocessing = socket(type=1,9080= conn.recv(1024
</span><span style="color: #0000ff;">if</span> <span style="color: #0000ff;">not</span><span style="color: #000000;"> msg:
</span><span style="color: #0000ff;">break</span>
<span style="color: #0000ff;">print</span>(<span style="color: #800000;">"</span><span style="color: #800000;">来自[%s:%s]的一条消息:%s</span><span style="color: #800000;">"</span>%(client_addr[0],client_addr[1<span style="color: #000000;">],msg))
conn.send(msg.upper())
</span><span style="color: #0000ff;">except</span><span style="color: #000000;"> Exception:
</span><span style="color: #0000ff;">break</span>
<span style="color: #0000ff;">if <span style="color: #800080;">name == <span style="color: #800000;">'<span style="color: #800000;">main<span style="color: #800000;">': <span style="color: #008000;">#<span style="color: #008000;"> #windows下start进程一定要写到这下面<span style="color: #0000ff;">while<span style="color: #000000;"> True: conn,client_addr =<span style="color: #000000;"> server.accept() p = Process(target=talk,args=<span style="color: #000000;">(conn,client_addr)) p.start() socket *client = socket(type=<span style="color: #000000;">SOCK_STREAM)
client.connect((<span style="color: #800000;">"<span style="color: #800000;">127.0.0.1<span style="color: #800000;">",9080<span style="color: #000000;">)) <span style="color: #0000ff;">while<span style="color: #000000;"> True:
多进程中的其他方法 multiprocessing <span style="color: #0000ff;">class<span style="color: #000000;"> Myprocess(Process):
<span style="color: #0000ff;">def <span style="color: #800080;">init<span style="color: #000000;">(self,person): super().<span style="color: #800080;">init<span style="color: #000000;">() self.name =<span style="color: #000000;"> person
<span style="color: #0000ff;">if <span style="color: #800080;">name == <span style="color: #800000;">'<span style="color: #800000;">main<span style="color: #800000;">'<span style="color: #000000;">: multiprocessing <span style="color: #0000ff;">class<span style="color: #000000;"> Myprocess(Process):
<span style="color: #0000ff;">def <span style="color: #800080;">init<span style="color: #000000;">(self,person): self.name=person <span style="color: #008000;">#<span style="color: #008000;"> name属性是Process中的属性,标示进程的名字 super().<span style="color: #800080;">init() <span style="color: #008000;">#<span style="color: #008000;"> 执行父类的初始化方法会覆盖name属性 <span style="color: #008000;">#<span style="color: #008000;"> self.name = person # 在这里设置就可以修改进程名字了 <span style="color: #008000;">#<span style="color: #008000;"> self.person = person #如果不想覆盖进程名,就修改属性名称就可以了 <span style="color: #0000ff;">def<span style="color: #000000;"> run(self): <span style="color: #0000ff;">print(<span style="color: #800000;">'<span style="color: #800000;">%s正在学习<span style="color: #800000;">' %<span style="color: #000000;"> self.name) <span style="color: #008000;">#<span style="color: #008000;"> print('%s正在和网红脸聊天' %self.person) time.sleep(random.randrange(1,5<span style="color: #000000;">)) <span style="color: #0000ff;">print(<span style="color: #800000;">'<span style="color: #800000;">%s正在学习<span style="color: #800000;">' %<span style="color: #000000;"> self.name) <span style="color: #008000;">#<span style="color: #008000;"> print('%s正在和网红脸聊天' %self.person) <span style="color: #0000ff;">if <span style="color: #800080;">name == <span style="color: #800000;">'<span style="color: #800000;">main<span style="color: #800000;">'<span style="color: #000000;">: 3,进程同步(multiprocessing.LockSemaphoreEvent)锁 - multiorocessing.Lock通过刚刚的学习,我们千方百计实现了程序的异步,让多个任务可以同时在几个进程中并发处理,他们之间的运行没有顺序,一旦开启也不受我们控制。尽管并发编程让我们能更加充分的利用IO资源,但是也给我们带来了新的问题。 当多个进程使用同一份数据资源的时候,就会引发数据安全或顺序混乱问题。 multiprocessing <span style="color: #0000ff;">def<span style="color: #000000;"> work(n):
<span style="color: #0000ff;">print(<span style="color: #800000;">"<span style="color: #800000;">%s: %s in running<span style="color: #800000;">" %<span style="color: #000000;"> (n,os.getpid())) time.sleep(random.random()) <span style="color: #0000ff;">print(<span style="color: #800000;">"<span style="color: #800000;">%s: %s is dime<span style="color: #800000;">" %<span style="color: #000000;"> (n,os.getpid())) <span style="color: #0000ff;">if <span style="color: #800080;">name == <span style="color: #800000;">'<span style="color: #800000;">main<span style="color: #800000;">'<span style="color: #000000;">:
multiprocessing ( % == = i range(5= Process(target=work,lock))
p.start()
上面这种情况虽然使用加锁的形式实现了顺序的执行,但是程序又重新变成串行了,这样确实会浪费了时间,却保证了数据的安全。 接下来,我们以模拟抢票为例,来看看数据安全的重要性。
multiprocessing =json.load(open(( |