nagios 是强大 的监控框架, 报警功能灵活, 但默认不对检测数据进行量化统计,只是有 正常 / 一般警告 / 严重问题 三类状态。 配合 pnp4nagios工具可以对nagios 采集的数据进行更细化的记录和分析。ubuntu 10.10源中的 nagios是 3.2.1比较新,(刚刚查看 fedora14源 更新到了 3.2.3, 看来竞争的确是进化的动力)
在ubuntu 安装非常简单
用 server 版本,安装过程中选中 lamp server, mail server, openssh server, 安装完成重启后:
代码: 全选
sudo apt-get update
sudo apt-get install gcc rrdweather php5-gd nagios3
期间会提示输入nagios的密码。
至此nagios就安装完成了,然后装 pnp4nagios
#启用 rewrite 模块
代码: 全选
a2enmod rewrite
/etc/init.d/apache reload
https://sourceforge.net/projects/pnp4na ... les/latest
代码: 全选
tar xf pnp4nagios-0.6.11.tar.gz
cd pnp4nagios-0.6.11
./configure
make all
sudo make fullinstall
根据 /etc/apache2/conf.g/pnp4nagios.conf 中 AuthUserFile 行生成验证文件;
我这里将此行修改为
代码: 全选
AuthUserFile /usr/local/pnp4nagios/etc/htpasswd.users
然后生成文件
htpasswd -c /usr/local/pnp4nagios/etc/htpasswd.users pnp4nagiosusername
代码: 全选
process_performance_data=1
host_perfdata_command=process-host-perfdata
service_perfdata_command=process-service-perfdata
代码: 全选
# 'process-host-perfdata' command definition
define command{
command_name process-host-perfdata
#command_line /usr/bin/printf "%b" "$LASTHOSTCHECK$\t$HOSTNAME$\t$HOSTSTATE$\t$HOSTATTEMPT$\t$HOSTSTATETYPE$\t$HOSTEXECUTIONTIME$\t$HOSTOUTPUT$\t$HOSTPERFDATA$\n" >> /var/lib/nagios3/host-perfdata.out
command_line /usr/local/pnp4nagios/libexec/process_perfdata.pl
}
# 'process-service-perfdata' command definition
define command{
command_name process-service-perfdata
#command_line /usr/bin/printf "%b" "$LASTSERVICECHECK$\t$HOSTNAME$\t$SERVICEDESC$\t$SERVICESTATE$\t$SERVICEATTEMPT$\t$SERVICESTATETYPE$\t$SERVICEEXECUTIONTIME$\t$SERVICELATENCY$\t$SERVICEOUTPUT$\t$SERVICEPERFDATA$\n" >> /var/lib/nagios3/service-perfdata.out
command_line /usr/local/pnp4nagios/libexec/process_perfdata.pl
}
代码: 全选
/etc/init.d/nagios3 reload
最后通过 浏览器 访问下 http://ip或者主机名/pnp4nagios 可以看到一个初始化页面, 如果一切依赖都正常 可以 删除或者重命名 /usr/local/pnp4nagios/install.php 这个文件, 然后就可以以此来观察各监控对象的趋势了。