当前位置 : 主页 > 操作系统 > centos >

Linux 进程运行的各项指标的监测和一些管理命令的应用

来源:互联网 收集:自由互联 发布时间:2022-06-20
进程(Process)是程序运行的一个实例,是定义在多用户、多任务操作系统环境下用于表示应用程序在内存环境中基本执行单元。系统分配资源的基本单位。 CPU 数量有限,而系统上要运行的

       进程(Process)是程序运行的一个实例,是定义在多用户、多任务操作系统环境下用于表示应用程序在内存环境中基本执行单元。系统分配资源的基本单位。
        CPU 数量有限,而系统上要运行的任务(进程)很多,在任意时刻CPU只能运行一个进程。采用分时机制,把CPU的运算时间进行分片,让每个进程都获得CPU的时间片(time slice).由于进程运行的时间片很短,所以从表面看来所有进程是在同时运行着。意思是说,进程A使用完它的CPU时间后,内核根据调度算法把进程B调度到CPU上来运行,等到进程B使用完它的CPU时间后,内核根据调度策略又把另外一个进程调度到CPU上运行,就此类推。而该过程就叫做:进程的上下文切换(context switches)
        Linux 内核用数据结构 task_struct(任务数据结构) 表示一个进程,taks_struct 是在创建进程时候,内核为了追踪一个进程而使用的数据结构。
        操作系统使用 task_struct 保持跟踪进程运行所需的所有状态信息。这种状态,也就是”上下文“。它包括许多信息,例如 PC(指令计数器) 和寄存器文件的当前值,以及主存的内容。在任何一个时刻,单处理器系统都只能执行一个进程的代码。当操作系统决定要把控制权从当前进程转移到某一个新进程时,就会进行“上下文切换”,即保存当前进程的上下文、恢复用户进程的上下文,然后将控制权传递到新进程。新进程就会从上次停止的地方开始执行。


监测指定的进程的运行状况:页请求错误、虚拟内存的大小、常驻内存的大小等:

[root@node2 ~]# watch -n 1 'ps axo pid,comm,min_flt,maj_flt,trs,drs,vsize,size,rss | grep httpd' Every 1.0s: ps axo pid,comm,min_flt,maj_flt,trs,drs,vsize,size,rss | grep httpd                       Sat Jun 14 03:14:09 2014  3521 httpd             1169      2  387 35384  35772 13288 10248  3524 httpd             3194     55  387 37672  38060 15576 12300  3525 httpd             2179      6  387 37136  37524 15040 11524  3527 httpd              356      2  387 35384  35772 13288  9160  3528 httpd             1618      5  387 37908  38296 15812 12036  4539 httpd             1540      5  387 37656  38044 15560 11816  4549 httpd             4552     87  387 36860  37248 14764 11376  4550 httpd             2311     10  387 38928  39316 16832 13352  4551 httpd             3790     12  387 37656  38044 15560 12220  4552 httpd              363      3  387 35384  35772 13288  9184  4629 httpd              355      1  387 35384  35772 13288  9156

说明:
         min_flt(minor fault)         表示程序的页请求错误次数.内存中已经缓存有进程所需要的页面数据

                                                  了。只要把该页面数据与进程的虚拟地址空间建立映射关系就可以了。
          maj_flt(major fault)         表示程序的页请求错误次数。内存中没有缓存有进程所需要的页面数

                                                    据。内核必需要通知CPU从磁盘中把页面数据加载到内存中来。
                                 TRS            表示程序所拥有的可执行虚拟内存的大小(KB);
                                 DRS           表示程序数据段和用户态的栈的大小(KB);
                                vsize            表示程序使用的虚拟内存大小(KB) total vm size in KB.
                                  size            表示程序使用的内存大小(KB) memory size in kilobytes.
                                    rss             表示程序常驻内存的大小。常驻内存指的是,该进程占据的页面是不可

                                                       以从物理内存交换出去的。
                                                      TRS + DRS = vsize

通过 /proc接口 查看进程(应用程序)所能使用的系统资源:

[root@node2 ~]# cat /proc/3521/limits Limit                     Soft Limit           Hard Limit           Units Max cpu time              unlimited            unlimited            seconds Max file size             unlimited            unlimited            bytes Max data size             unlimited            unlimited            bytes Max stack size            10485760             unlimited            bytes Max core file size        0                    unlimited            bytes Max resident set          unlimited            unlimited            bytes Max processes             4096                 4096                 processes Max open files            1024                 1024                 files Max locked memory         32768                32768                bytes Max address space         unlimited            unlimited            bytes Max file locks            unlimited            unlimited            locks Max pending signals       4096                 4096                 signals Max msgqueue size         819200               819200               bytes Max nice priority         0                    0 Max realtime priority     0                    0

说明:
         Max cpu time           能使用的CPU时间
         Max stack size         能使用的最大栈(stack)大小(bytes)
         Max processes        父进程最多同时能 fork 多少个进程。
         Max open files         最多同时可以打开多少个文件。像 Nginx 服务器,使用 一个进程响应N个请

                                            求,那么只能并发1024个用户请求。
  一个套接字文件表示一个用户请求。所以,想要 Nginx 并发更大的请求数,首先要修改它能同时打开的文件数量。

 

动态监控系统中占用物理内存最大的任务(进程)。方法:使用命令【top】,再与top进程交互,按"M"键,命令【top】显示的结果就按照占用物理内存大小进行
排序。

[root@node2 ~]# top top - 04:08:05 up  2:06,  3 users,  load average: 0.02, 0.03, 0.00 Tasks: 106 total,   1 running, 105 sleeping,   0 stopped,   0 zombie Cpu(s):  0.3%us,  3.0%sy,  0.0%ni, 96.0%id,  0.3%wa,  0.0%hi,  0.3%si,  0.0%st Mem:    255412k total,   233208k used,    22204k free,    31548k buffers Swap:   128512k total,        0k used,   128512k free,    87048k cached   PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND  3141 mysql     15   0  304m  35m 5280 S  0.0 14.3   0:00.77 mysqld  4550 daemon    15   0 39316  13m 2856 S  0.0  5.2   0:00.13 httpd  3524 daemon    15   0 38060  12m 2884 S  0.0  4.8   0:00.29 httpd  4551 daemon    15   0 38044  11m 2856 S  0.0  4.8   0:00.27 httpd  3528 daemon    15   0 38296  11m 2860 S  0.0  4.7   0:00.09 httpd  4539 daemon    15   0 38044  11m 2852 S  0.0  4.6   0:00.07 httpd  3525 daemon    15   0 37524  11m 2856 S  0.0  4.5   0:00.16 httpd  4549 daemon    15   0 37248  11m 2880 S  0.0  4.5   0:00.36 httpd  3394 root      34  19 25448  10m 2104 S  0.0  4.0   0:00.03 yum-updatesd  3521 root      18   0 35772  10m 3496 S  0.0  4.0   0:00.10 httpd  4552 daemon    15   0 35772 9184 2384 S  0.0  3.6   0:00.05 httpd  3527 daemon    15   0 35772 9160 2364 S  0.0  3.6   0:00.01 httpd  4629 daemon    15   0 35772 9156 2364 S  0.0  3.6   0:00.00 httpd   [root@node2 ~]# top   使用"A"键与【top】交互 1:Def - 04:38:57 up  2:37,  3 users,  load average: 0.11, 0.08, 0.02 Tasks: 107 total,   4 running, 102 sleeping,   0 stopped,   1 zombie Cpu(s):  0.7%us,  2.0%sy,  0.0%ni, 97.0%id,  0.0%wa,  0.0%hi,  0.3%si,  0.0%st Mem:    255412k total,   236148k used,    19264k free,    34488k buffers Swap:   128512k total,        0k used,   128512k free,    87056k cached 1  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND   3141 mysql     15   0  304m  35m 5280 S  0.0 14.3   0:00.87 mysqld   4550 daemon    15   0 39316  13m 2856 S  0.0  5.2   0:00.13 httpd   3524 daemon    15   0 38060  12m 2884 S  0.0  4.8   0:00.29 httpd   4551 daemon    15   0 38044  11m 2856 S  0.0  4.8   0:00.27 httpd   3528 daemon    15   0 38296  11m 2860 S  0.0  4.7   0:00.09 httpd 2  PID  PPID    TIME+  %CPU %MEM  PR  NI S  VIRT SWAP  RES  UID COMMAND  19730  7719   0:00.00  0.0  0.0  19   0 Z     0    0    0    0 sh <defunct>  19121  3654   0:01.11  0.0  0.4  15   0 R  2320 1296 1024    0 top  13403 13401   0:00.16  0.0  0.3  15   0 S  4184 3384  800    0 less  13401 13399   0:00.00  0.0  0.4  20   0 S  4488 3504  984    0 sh  13399  3482   0:00.00  0.0  0.3  18   0 S  3900 3128  772    0 man 3  PID %MEM  VIRT SWAP  RES CODE DATA  SHR nFLT nDRT S  PR  NI %CPU COMMAND   3141 14.3  304m 268m  35m 8688 293m 5280   86    0 S  15   0  0.0 mysqld   4550  5.2 39316  25m  13m  388  16m 2856   10    0 S  15   0  0.0 httpd   3524  4.8 38060  25m  12m  388  15m 2884   55    0 S  15   0  0.0 httpd   4551  4.8 38044  25m  11m  388  15m 2856   12    0 S  15   0  0.0 httpd   3528  4.7 38296  25m  11m  388  15m 2860    5    0 S  15   0  0.0 httpd   4539  4.6 38044  25m  11m  388  15m 2852    5    0 S  15   0  0.0 httpd

说明:
    说明:
    VIRT            进程使用的虚拟内存的大小。包括代码段(code)、数据段(data)和共享库以及交换到

                         swap的页面。(KB)
                          VIRT = SWAP + RES
    SWAP          虚拟内存影像的一部分 The swapped out portion of a task's total virtual memory p_w_picpath.

                         (KB)
    RES             进程使用的物理内存的大小,指的是常驻内存的大小。(KB) The non-swapped physical

                          memory a task has used.
                           RES = CODE + DATA
    CODE           Code size (KB) 进程所常驻物理内存大小中用于执行代码的内存的大小,Text segment.
    DATA            Data+Stack size (KB)  数据段Data segment + 栈段 stack segment
    SHR              一个进程使用的共享内存大小 Shared Mem size (KB)
    nFLT              major fault类型的页请求错误数 Page Fault count. The  number  of  major page faults

                           that have occurred for a task.
    nDRT            进程写到磁盘的脏页数 Dirty Pages count

总结:
         如果 Appache 服务器是基于  prefork 模型的话,一个进程就要占据大约 12M 的物理内存空间。还不包括被从物理内存中交换出去的页面。
         基于 prefork 模型的 Appache 服务器,是使用一个进程响应一个用户的请求的。假如并发请求数

为1000,那么我们的 httpd 服务器最少要消耗12M * 1000 = 12000M 也就是大约10GB的内存。

 

使用命令 pmap 查看进程的地址空间分布(也可以使用 cat /proc/<pid>/maps):

[root@node2 ~]# pmap 3910 3910:   nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf 002ca000    104K r-x--  /lib/ld-2.5.so 002e4000      4K r-x--  /lib/ld-2.5.so 002e5000      4K rwx--  /lib/ld-2.5.so 002ed000   1276K r-x--  /lib/libc-2.5.so 0042c000      4K --x--  /lib/libc-2.5.so 0042d000      8K r-x--  /lib/libc-2.5.so 0042f000      4K rwx--  /lib/libc-2.5.so 00430000     12K rwx--    [ anon ] ...... 08047000    432K r-x--  /usr/sbin/nginx 080b3000     40K rw---  /usr/sbin/nginx 080bd000     40K rw---    [ anon ] 097fe000    132K rw---    [ anon ] b7fe6000     20K rw---    [ anon ] b7ff4000      4K rw-s-  /dev/zero (deleted) bff8f000     84K rw---    [ stack ]  total     5740K

说明:
        第一列为内存区域起始地址,第二列为内存区域大小(虚拟内存),第三列为属性,第四列为内存映

        射的文件。
        一个进程运行的时候,其用到文件的代码段、数据段等都是映射到内存地址区域的。这个功能是

       通过系统调用 mmap() 来完成的。
       进程占用的虚拟内存为:5740KB.

[root@node2 ~]# pmap -x 3910 3910:   nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf Address   Kbytes     RSS   Dirty Mode   Mapping 002ca000     104       0       0 r-x--  ld-2.5.so 002e4000       4       4       4 r-x--  ld-2.5.so 002e5000       4       4       4 rwx--  ld-2.5.so 002ed000    1276      48       0 r-x--  libc-2.5.so 0042c000       4       0       0 --x--  libc-2.5.so 0042d000       8       8       4 r-x--  libc-2.5.so 0042f000       4       4       4 rwx--  libc-2.5.so 00430000      12      12      12 rwx--    [ anon ] ...... 08047000     432      68       0 r-x--  nginx 080b3000      40      40      36 rw---  nginx 080bd000      40      12      12 rw---    [ anon ] 097fe000     132     124     124 rw---    [ anon ] b7fe6000      20      20      20 rw---    [ anon ] b7ff4000       4       0       0 rw-s-  zero (deleted) bff8f000      84      12      12 rw---    [ stack ] -------- ------- ------- ------- ------- total kB    5740       -       -       -

说明:
       该进程所占据的虚拟地址空间为: 5740KB;
       RSS 表示该进程的常驻内存的大小(KB);
        Dirty 表示脏页。
       可以看得出,它们的地址是连续的。

使用接口 /proc

[root@node2 ~]# cat /proc/3910/maps 002ca000-002e4000 r-xp 00000000 08:02 67212      /lib/ld-2.5.so 002e4000-002e5000 r-xp 00019000 08:02 67212      /lib/ld-2.5.so 002e5000-002e6000 rwxp 0001a000 08:02 67212      /lib/ld-2.5.so 002ed000-0042c000 r-xp 00000000 08:02 67213      /lib/libc-2.5.so 0042c000-0042d000 --xp 0013f000 08:02 67213      /lib/libc-2.5.so 0042d000-0042f000 r-xp 0013f000 08:02 67213      /lib/libc-2.5.so 0042f000-00430000 rwxp 00141000 08:02 67213      /lib/libc-2.5.so 00430000-00433000 rwxp 00430000 00:00 0 ...... 08047000-080b3000 r-xp 00000000 08:02 1525801    /usr/sbin/nginx 080b3000-080bd000 rw-p 0006b000 08:02 1525801    /usr/sbin/nginx 080bd000-080c7000 rw-p 080bd000 00:00 0 097fe000-0981f000 rw-p 097fe000 00:00 0          [heap] b7fe6000-b7feb000 rw-p b7fe6000 00:00 0 b7ff4000-b7ff5000 rw-s 00000000 00:09 17042      /dev/zero (deleted) bff8f000-bffa4000 rw-p bffea000 00:00 0          [stack]

通过 /proc 接口查看进程的状态

[root@node2 ~]# cat /proc/3521/status 。。。 VmPeak:    35772 kB VmSize:    35772 kB VmLck:         0 kB VmHWM:     10248 kB VmRSS:     10248 kB VmData:    13204 kB VmStk:        84 kB VmExe:       388 kB VmLib:     21016 kB VmPTE:        68 kB StaBrk: 085f7000 kB Brk:    08846000 kB StaStk: bfd6bc20 kB 。。。 Cpus_allowed:   00000001 Mems_allowed:   1

查看一个可执行二进制程序所依赖的库文件。

[root@node2 ~]# ldd /usr/local/apache2/bin/httpd         linux-gate.so.1 =>  (0x00f40000)         libm.so.6 => /lib/libm.so.6 (0x00455000)         libaprutil-1.so.0 => /usr/lib/libaprutil-1.so.0 (0x007b4000)         libcrypt.so.1 => /lib/libcrypt.so.1 (0x00c79000)         libldap-2.3.so.0 => /usr/lib/libldap-2.3.so.0 (0x001f2000)         liblber-2.3.so.0 => /usr/lib/liblber-2.3.so.0 (0x0025a000)         ......

追踪一个已经启动的进程

[root@node2 ~]# strace -p 3521

追踪启动一个进程启动的时间、发生的系统调用、是否有错误等等

[root@node2 ~]# strace -c /usr/local/apache2/bin/httpd % time     seconds  usecs/call     calls    errors syscall ------ ----------- ----------- --------- --------- ----------------  59.55    0.002931         183        16           mprotect  12.21    0.000601           9        65           munmap  11.40    0.000561         561         1           clone  11.19    0.000551           3       178           read   1.36    0.000067           0       292           mmap2   1.20    0.000059           0       180        27 open   0.95    0.000047           0       151           fstat64   0.93    0.000046           0       114           time   0.45    0.000022           4         6           write   0.41    0.000020           0       164           close   0.00    0.000000           0         1           execve   0.00    0.000000           0         1           chdir   0.00    0.000000           0         1           lseek   0.00    0.000000           0         2         1 access 。。。   0.00    0.000000           0        12           socket   0.00    0.000000           0         3           bind   0.00    0.000000           0         8         6 connect 。。。   0.00    0.000000           0         1           semget   0.00    0.000000           0         2           semctl ------ ----------- ----------- --------- --------- ---------------- 100.00    0.004922                  1293        50 total

 查看一个进程打开的文件

[root@node2 ~]# lsof -p 3910 COMMAND  PID USER   FD   TYPE     DEVICE     SIZE    NODE NAME nginx   3910 root  cwd    DIR        8,2     4096       2 / nginx   3910 root  rtd    DIR        8,2     4096       2 / nginx   3910 root  txt    REG        8,2  3923026 1525801 /usr/sbin/nginx nginx   3910 root  mem    REG        8,2   125736   67212 /lib/ld-2.5.so nginx   3910 root  mem    REG        8,2  1611564   67213 /lib/libc-2.5.so nginx   3910 root  mem    REG        8,2    16428   67217 /lib/libdl-2.5.so ......

通过 /proc 接口查看进程打开的文件

[root@node2 ~]# ll /proc/3910/fd/ total 0 lrwx------ 1 root root 64 Jun 14 10:09 0 -> /dev/null lrwx------ 1 root root 64 Jun 14 10:09 1 -> /dev/null l-wx------ 1 root root 64 Jun 14 10:09 2 -> /var/log/nginx_error.log lrwx------ 1 root root 64 Jun 14 10:09 3 -> socket:[17044] l-wx------ 1 root root 64 Jun 14 10:09 4 -> /var/log/nginx_error.log l-wx------ 1 root root 64 Jun 14 10:09 5 -> /var/log/nginx/access.log lrwx------ 1 root root 64 Jun 14 10:09 6 -> socket:[17041] lrwx------ 1 root root 64 Jun 14 10:09 7 -> socket:[17045]

 

【文章原创作者:高防cdn http://www.558idc.com/gfcdn.html提供,感恩】
网友评论