Taobao监控系统之改进——文件传输
在早些的时候,也包括我的书《构建Oracle高可用环境》中的16章,关于监控体系的介绍中,所有的案例都是采用scp从被监控的客户端上拷贝文件到集中分析的Monitor上,类似这样的动作,如
scp $SOURCE_FILE $MONITOR:$TARGET_FILE
当客户端不多的情况下,这么做也是没有什么问题的,而且书写简单,一直在这么用。但是,当客户端的数量上去以后,在大量并发的情况下,有的时候就会出现这样的错误:
ssh_exchange_identification: Connection closed by remote host
lost connection
查看crontab的日志,也可以看到有部分crontab调度失败:
Cron Job with pid: 2859224 Successful
Cron Job with pid: 3154900 Failed
Cron Job with pid: 3027512 Successful
Recent Comments