【问题分享】TDH 4.x系列Transwarp Manager或Ganglia页面上曲线消失的最强解决方案


#1

如果你的TDH集群是4.x版本,Manager Web或者Ganglia Web页面上的曲线经常消失,并且通过重启汇聚节点的gmond或gmetad可以临时解决问题。具体方法:
1.集群有N个机柜,意味有N个rack级别的节点,
2.找到分别位于各个机柜上的任意一个节点(共N个),执行grep data_source /etc/ganglia/gmetad.conf 命令查看到该机柜上的rack级别的节点(共N个),
3.先停止所有rack级别的节点的gmond,service gmond stop (centos6.x) / systemctl stop gmond (centos7.x)
4.重启所有节点的gmetad(包括rack级别节点)service gmetad restart (centos6.x) / systemctl restart gmetad (centos7.x)
5.启动所有rack级别的节点的gmond,service gmond start (centos6.x) / systemctl start gmond (centos7.x)

如果以上步骤可以解决曲线消失问题,那么这里有一个秘籍可以一劳永逸地解决这个问题:

  1. 从这里下载一个tar.gz包
    链接:http://pan.baidu.com/s/1bp9vyWJ 密码:pu61
  2. 在集群的 所有 节点上解压压缩包,并执行其中的install.sh,如果最后看到“Done”字样,说明安装成功。这个工具会定时检查Ganglia的状态,并恢复异常的Ganglia。

追加:在脚本部署后,有一个 * * * * * /usr/bin/recover_ganglia.sh 的定时任务,如果服务器没有开启sendmail功能,该脚本的输出内容会存放在/var/spool/clientmqueue/ 目录下,时间久了会有根目录被写满的隐患,因此需要把脚本的输出内容重定向到/dev/null 来避免这种隐患。该定时任务可以写成 * * * * * /usr/bin/recover_ganglia.sh > /dev/null 2>&1


【问题分享】ganglia中有些节点没有显示或者失联
#2

表示遇到过好多次,终于找到解决方案:thumbsup:


#4

好使,已收录到知识库


#5

在脚本部署后,有一个 * * * * * /usr/bin/recover_ganglia.sh 的定时任务,如果服务器没有开启sendmail功能,该脚本的输出内容会存放在/var/spool/clientmqueue/ 目录下,时间久了会有根目录被写满的隐患,因此需要把脚本的输出内容重定向到/dev/null 来避免这种隐患。该定时任务可以写成 * * * * * /usr/bin/recover_ganglia.sh > /dev/null 2>&1


#6

kafa和streamsql没法正常显示


#7

kafa和streamsql


#8

对应install.sh脚本修改两处:

1 CRON_LINE="* * * * * ${TARGET_PATH} > /dev/null 2>&1"

2 crontab -l > /tmp/crontab_igr 这句后面加如下一行,避免其他人重复调用。
sed -i /recover_ganglia.sh/d /tmp/crontab_igr


在线客服
在线客服
微信客服
微信客服