c语言多线程详解?
概念
线程:线程是程序中的一个执行流,每个线程都有自己的专有寄存器(栈指针、程序计数器等),但代码区是共享的,即不同的线程可以执行同样的函数。
多线程:多线程是指程序中包含多个执行流,即在一个程序中可以同时运行多个不同的线程来执行不同的任务,也就是说允许单个程序创建多个并行执行的线程来完成各自的任务。
C语言的开始设计,并未设计多线程的机制,由于随着软硬件的发展及需求的发展。后来C语言才开发了线程库以支持多线程的操作、应用。
主要基于Linux介绍C多线程。在编译C的多线程时候,一方面必须指定Linux C语言线程库多线程库pthread,才可以正确编译(例如:gcc test.c -o test -lpthread);另一方面要包含有关线程头文件#include <pthread.h>。
linux怎么查看一个进程的所有线程?
使用ps命令
常用参数:
-a显示所有进程(等价于-e)(utility)
-a显示一个终端的所有进程,除了会话引线
-n忽略选择。
-d显示所有进程,但省略所有的会话引线(utility)
-x显示没有控制终端的进程,同时显示各个命令的具体路径。dx不可合用。(utility)
-ppid进程使用cpu的时间
-uuidorusername选择有效的用户id或者是用户名
-ggidorgroupname显示组的所有进程。
uusername显示该用户下的所有进程,且显示各个命令的详细路径。如:psuzhang;(utility)
-f全部列出,通常和其他选项联用。如:ps-faorps-fxandsoon.
-l长格式(有f,wchan,c等字段)
-j作业格式
-o用户自定义格式。
v以虚拟存储器格式显示
s以信号格式显示
-m显示所有的线程
-h显示进程的层次(和其它的命令合用,如:ps-ha)(utility)
e命令之后显示环境(如:ps-de;ps-ae)(utility)
h不显示第一行
ps命令常用用法:
1)psa显示现行终端机下的所有程序,包括其他用户的程序。
2)ps-a显示所有进程。
3)psc列出程序时,显示每个程序真正的指令名称,而不包含路径,参数或常驻服务的标示。
4)ps-e此参数的效果和指定”a”参数相同。
5)pse列出程序时,显示每个程序所使用的环境变量。
6)psf用ascii字符显示树状结构,表达程序间的相互关系。
7)ps-h显示树状结构,表示程序间的相互关系。
8)ps-n显示所有的程序,除了执行ps指令终端机下的程序之外。
9)pss采用程序信号的格式显示程序状况。
10)pss列出程序时,包括已中断的子程序资料。
11)ps-t指定终端机编号,并列出属于该终端机的程序的状况。
12)psu以用户为主的格式来显示程序状况。
13)psx显示所有程序,不以终端机来区分。
最常用的方法是ps-aux或ps-ef,然后再利用一个管道符号导向到grep去查找特定的进程,然后再对特定的进程进行操作。
Linux多线程通信?
PIPE和FIFO用来实现进程间相互发送非常短小的、频率很高的消息;
这两种方式通常适用于两个进程间的通信。
共享内存用来实现进程间共享的、非常庞大的、读写操作频率很高的数据(配合信号量使用);
这种方式通常适用于多进程间通信。
其他考虑用socket。这里的“其他情况”,其实是今天主要会碰到的情况:
分布式开发。
在多进程、多线程、多模块所构成的今天最常见的分布式系统开发中,
socket是第一选择
。
消息队列,现在建议不要使用了 —- 因为找不到使用它们的理由。
在实际中,我个人感觉,PIPE和FIFO可以偶尔使用下,共享内存都用的不多了。在效率上说,socket有包装数据和解包数据的过程,所以理论上来说socket是没有PIPE/FIFO快,不过现在计算机上真心不计较这么一点点速度损失的。你费劲纠结半天,不如我把socket设计好了,多插一块CPU来得更划算。
另外,进程间通信的数据一般来说我们都会存入数据库的,这样万一某个进程突然死掉或者整个服务器死了,也不至于丢失重要数据、便于回滚到之前的状态。从这个角度考虑,适用共享内存的情况也更少了,所以socket使用得更多。再多说一点关于共享内存的:共享内存的效率确实高,但它的重点在“共享”二字上。如果的确有好些进程共享一大块数据(如果把每个进程都看做是类的对象的话,那么共享数据就是这个类的static数据成员),那么共享内存就是一个不二的选择了。但是在面向对象的今天,我们更多的时候是多线程+锁+线程间共享数据。因此共享进程在今天使用的也越来越少了。
不过,在面对一些极度追求效率的需求时,共享内存就会成为唯一的选择,比如高频交易系统。除此以外,一般是不需要特意使用共享内存的。另外,
PIPE和共享内存是不能跨LAN的
(FIFO可以但FIFO只能用于两个进程通信)
。
如果你的分布式系统随着需求的增加而越来越大所以你想把不同的模块放在不同机器上而你之前开发的时候用了PIPE或者共享内存,那么你将不得不对代码进行大幅修改……同时,即使FIFO可以跨越LAN,其代码的可读性、易操作性和可移植性、适应性也远没有socket大。这也就是为什么一开始说socket是第一选择的原因。
最后还有个信号简单说一下。
请注意,是信号,不是信号量。
信号量是用于同步线程间的对象的使用的(建议题主看我的答案,自认为比较通俗易懂:
semaphore和mutex的区别? – Linux – 知乎
)。
信号也是进程间通信的一种方式。比如在Linux系统下,一个进程正在执行时,你用键盘按Ctrl+c,就是给这个进程发送了一个信号。进程在捕捉到这个信号后会做相应的动作。
虽然信号是可以自定义的,但这并不能改变信号的局限性:不能跨LAN、信息量极其有限
。
在现代的分布式系统中,通常都是消息驱动:
即进程受到某个消息后,通过对消息的内容的分析然后做相应的动作。如果你把你的分布式系统设置成信号驱动的,这就表示你收到一个信号就要做一个动作而一个信号的本质其实就是一个数字而已。这样系统稍微大一点的话,系统将变得异常难以维护;甚至在很多时候,信号驱动是无法满足我们的需求的。
因此现在我们一般也不用信号了。因此,请记住:
除非你有非常有说服力的理由,否则请用socket。
顺便给你推荐个基于socket的轻量级的消息库:ZeroMQ。