同城容灾运维:参数配置与管理机制

【摘要】为保证同城容灾环境在出现灾难的时候能够真正的接管业务,不仅要用技术手段完成生产与容灾端配置的校验,同时要在制度运维手册中规定相应的操作规范。

【作者】董立国 银行架构师

生产端与容灾端参数配置

同城容灾环境涉及生产端与容灾端参数配置核对,但并不是所有参数都要求与生产端强一致,有一些类型参数是要求生产端与容灾端不同的,为了保证同城容灾端的参数配置正确,满足容灾切换的要求,需要制定基线版本、标准架构、投产制度以及检查监控方案等。

同城环境搭建完成后,操作系统参数变更的频率并不大,所以主要强调在同城容灾环境搭建过程中,就要保证同城的操作系统相关参数满足容灾需求。如果有变更参数需要通过投产变更流程控制。

图片[1]-同城容灾运维:参数配置与管理机制-JieYingAI捷鹰AI

数据库基础参数在同城搭建完成后,变更的频率不高,所以在同城容灾环境搭建过程中,就要依据数据库安装基线,保证同城的数据库相关参数满足容灾需求。其他参数一般建立共享存储中,同步到容灾端。

图片[2]-同城容灾运维:参数配置与管理机制-JieYingAI捷鹰AI

中间件基础参数在同城搭建完成后,基础参数与配置参数变更的频率不高,所以在同城容灾环境搭建过程中,就要保证同城的相关参数满足容灾需求。数据源配置可根据容灾架构,建议选择解析的方式,不建议选择使用IP地址。

图片[3]-同城容灾运维:参数配置与管理机制-JieYingAI捷鹰AI

在同城搭建完成后,应用程序变更是最频繁的,保证应用程序的生产与容灾环境版本同步与适用是重中之重。有些架构应用程序放置到共享存储同步到容灾环境,但是大部分应用程序尤其是多活应用都将应用程序部署到本地。

图片[4]-同城容灾运维:参数配置与管理机制-JieYingAI捷鹰AI

图片[5]-同城容灾运维:参数配置与管理机制-JieYingAI捷鹰AI

容灾端的环境还涉及一些其他配置,如监控、备份、网络以及定时任务等。为保障容灾环境可用、健壮,需要将其他配置配备完全。

图片[6]-同城容灾运维:参数配置与管理机制-JieYingAI捷鹰AI

容灾配置管理机制

制定投产制度,当生产端进行投产时,需要同时投产容灾环境,并且配置容灾投产包。

配置完善的CMDB,将生产端与容灾端相关配置项,全部更新到CMDB中,如果投产有变更,CMDB中同步变更相关配置项包括每次投产情况。

生产与容灾端均需要配置完备的监控策略,包括配置文件的监控,例如根据生产端与容灾端的配置文件修改时间进行监控,如果时间差距大于24小时,告警提示容灾端配置文件是否同步投产更新。

生产端与容灾端基础配置一致的基础为基线版本的管理,无论生产端与容灾端基础环境版本与配置一定要按基线版本配置,同时上线之前进行基线配置安全漏洞扫描,保证上线系统的基础环境与基线版本要求一致。

总结

完成同城容灾的建设后,为保证同城容灾环境在出现灾难的时候能够真正的接管业务,不仅要用技术手段完成生产与容灾端配置的校验,同时要在制度运维手册中规定相应的操作规范。如果每年的容灾演练都提前几周或几个月去检查环境准备容灾演练的工作,则同城的容灾环境只是一个昂贵的花瓶。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享