[问题]超弱的:系统负载是怎么计算的,有时候是比1还大的?

系统安装、升级讨论
版面规则
我们都知道新人的确很菜,也喜欢抱怨,并且带有浓厚的Windows习惯,但既然在这里询问,我们就应该有责任帮助他们解决问题,而不是直接泼冷水、简单的否定或发表对解决问题没有任何帮助的帖子。乐于分享,以人为本,这正是Ubuntu的精神所在。
回复
头像
wanzcong
帖子: 201
注册时间: 2007-08-23 3:52

[问题]超弱的:系统负载是怎么计算的,有时候是比1还大的?

#1

帖子 wanzcong » 2007-08-24 12:43

应该不是cpu占用率吧?怎么算的呢?要不怎么能比1大?
头像
Nile
帖子: 990
注册时间: 2006-07-15 11:20
来自: 枫叶刀市

#2

帖子 Nile » 2007-08-24 13:40

我也感到很奇怪,不是cpu占用率,应该是一个衡量系统整体状况的参数(包括IO什么的)

cpu 100%时系统正常运行没什么问题,但负载100%时连鼠标都动不了。。。
Thinkpad T400
头像
bones7456
帖子: 8495
注册时间: 2006-04-12 20:05
来自: 杭州
联系:

#3

帖子 bones7456 » 2007-08-24 13:57

特意google了一下:
  在Linux系统中,uptime、w、top等命令都会有系统平均负载load average的输出,那么什么是系统平均负载呢?
  系统平均负载被定义为在特定时间间隔内运行队列中的平均进程树。如果一个进程满足以下条件则其就会位于运行队列中:
  - 它没有在等待I/O操作的结果
  - 它没有主动进入等待状态(也就是没有调用'wait')
  - 没有被停止(例如:等待终止)
  例如:
  [root@www2 init.d]# uptime
  7:51pm up 2 days, 5:43, 2 users, load average: 8.13, 5.90, 4.94
  命令输出的最后内容表示在过去的1、5、15分钟内运行队列中的平均进程数量。
  一般来说只要每个CPU的当前活动进程数不大于3那么系统的性能就是良好的,如果每个CPU的任务数大于5,那么就表示这台机器的性能有严重问题。对于上面的例子来说,假设系统有两个CPU,那么其每个CPU的当前任务数为:8.13/2=4.065。这表示该系统的性能是可以接受的。
引自 http://www.linuxpk.com/4965.html
关注我的blog: ε==3
头像
xhy
帖子: 3916
注册时间: 2005-12-28 1:16
系统: Ubuntu 12.10 X64
来自: 火星

#4

帖子 xhy » 2007-08-25 1:20

代码: 全选

  使用uptime或者top命令,都可以看到一个负载的输出,形如load average: 0.00, 0.03, 0.00,
这个负载到底是什么东西呢,man文档里只是一笔带过,没有具体的给出负载的定义。

  负载的统计,必然是由内核完成的,因此在内核源码中找答案是再好不过的事情了,找来2.6.21的
内核源码,开始探索。

  节选部分源码
 

//kernel/timer.c

1254 active_tasks = count_active_tasks();

1256 CALC_LOAD(avenrun[0], EXP_1, active_tasks);
1257 CALC_LOAD(avenrun[1], EXP_5, active_tasks);
1258 CALC_LOAD(avenrun[2], EXP_15, active_tasks);


//include/linux/sched.h

 110 #define FSHIFT      11      /* nr of bits of precision */
 111 #define FIXED_1     (1<<FSHIFT) /* 1.0 as fixed-point */
 112 #define LOAD_FREQ   (5*HZ)      /* 5 sec intervals */
 113 #define EXP_1       1884        /* 1/exp(5sec/1min) as fixed-point */
 114 #define EXP_5       2014        /* 1/exp(5sec/5min) */
 115 #define EXP_15      2037        /* 1/exp(5sec/15min) */

 117 #define CALC_LOAD(load,exp,n) \
 118     load *= exp; \
 119     load += n*(FIXED_1-exp); \
 120     load >>= FSHIFT;



load(t) = ( load(t-1)*exp(i) + n(t)*(2048-exp(i)) ) / 2048
load(t-1)为上次计算出的结果
n(t)为t时刻的活动进程数
计算方式是累加各个CPU的运行队列中running和uninterruptible的值 再乘以2048
计算方式如下

1946 unsigned long nr_active(void)
1947 {
1948 unsigned long i, running = 0, uninterruptible = 0;
1949
1950 for_each_online_cpu(i) {
1951 running += cpu_rq(i)->nr_running;
1952 uninterruptible += cpu_rq(i)->nr_uninterruptible;
1953 }
1954
1955 if (unlikely((long)uninterruptible < 0))
1956 uninterruptible = 0;
1957
1958 return running + uninterruptible;
1959 }


1226 static unsigned long count_active_tasks(void)
1227 {
1228 return nr_active() * FIXED_1;
1229 }

exp(1) = 1884
exp(5) = 2014
exp(15) = 2037
exp(i) = 2048 * e^(-1/12/i)

从本质上看
负载是完全由过去的一段时间里每个CPU上的活动进程数决定的
但并不是在数值上等同于每秒钟需要进行调度的进程数
具体的计算过程是个比较复杂的过程
目前负债150多万
头像
wanzcong
帖子: 201
注册时间: 2007-08-23 3:52

#5

帖子 wanzcong » 2007-08-26 3:34

哦,看来还行,负载很少上4.5,多谢了
lisir
帖子: 1187
注册时间: 2006-04-29 14:54
来自: 山东
联系:

#6

帖子 lisir » 2007-08-26 8:38

学习了。 :D :D
学会看置顶帖、精华帖。
学会使用搜索。
常见问题解答和发帖需知
回复