运维部门日常工作SOP操作指导手册

前言

为推行工作标准化作业, 加强标准化作业的管理, 规范作业指导书的编制, 实施全过程控制, 特制订本指南.

本指南的附录A、附录B为举例资料.

本指南由运维部提出并归档.

本指南起草单位: 运维部.

本指南由运维部负责解释.

范围

本指南规定了作业指导书的编制原则、依据、结构内容、格式、文本要求及应用管理的基本内容.

本指南适用于公司总部及各子公司, 并在运维部进行试点.

术语和定义

下列术语和定义适用于本指南

标准化作业

SOP(Standard Operation Procedure)即标准作业程序, 就是将某一事件的标准操作步骤和要求以统一的格式描述出来, 用来指导和规范日常的工作.

全过程控制

针对现场作业过程中每一项具体的操作, 按照工作有关法律法规、制度、标准、流程规定的要求, 对现场作业活动的全过程进行细化、量化、标准化, 保证作业过程处于“可控、在控”状态, 不出现偏差和错误, 以获得最佳秩序与效果.

作业指导书

对每一项作业按照全过程控制的要求, 对作业计划、准备、实施、总结等各个环节, 明确具体操作的方法、步骤、措施、标准和人员责任, 依据工作流程组合成的执行文件.

模块归属

对每一项作业归属模块, 目前模块分为几大类,配置变更/运维诊断/运维应急响应/项目审核/监控处理/数据中心变更

SOP文件架构

图片[1]-运维部门日常工作SOP操作指导手册-JieYingAI捷鹰AI

作业指导书的编制原则

以事实为基础, 考虑自身能力和可用资源.

带有一颗持续改善的心, 逐步提升运行标准.

可视化、标准化、行为化

作业指导书的编制依据

法律、法规、制度、流程.

质量管理相关文件.

作业指导书的结构内容及格式

结构

由封面、范围、引用文件、修前准备、流程图、作业程序和标准、验收记录、指导书执行情况评估和附录九项内容组成.

内容及格式

封面

内容

由作业名称、文件编号和版本号、编写人及时间、审核人及时间、批准人及时间、作业负责人、作业工期、编写部门、变更记录、建立时间(变更时间)十项内容组成.

作业名称

包含: 部门名称、工作具体流程.如: “×××部门×××工作标准作业指导书”.

文件编号和版本号

应具有唯一性和可追溯性, 便于查找.可采用企业标准编号, SOP/×××, 位于封面的右上角.

编制人及时间

负责作业指导书的编写.在指导书编写人一栏内签名, 并注明编制时间.

审核人及时间

负责作业指导书的审核, 对编写的正确性负责.在指导书审核人一栏内签名, 并注明审核时间.

批准人及时间

作业指导书执行的许可人.在指导书批准人一栏内签名, 并注明批准时间.

作业负责人

组织执行作业指导书, 对作业的进程、质量负责.在指导书作业负责人一栏内签名.

作业工期(标准工时)

现场作业具体工作时间.

编制部门

指作业指导书的具体编制单位.

变更记录

建立变更日期

格式

见附录B

范围

对作业指导书的应用范围做出具体的规定.如: 本作业指导书针对

×××部门×××组×××工作, 仅适用于该环节工作.

引用文件

明确编写作业指导书所引用的法规、制度、标准、及企业管理规定和文件.

作业指导书的应用与管理

应用

各部门按照本指南, 参照范本, 结合现场实际, 具体编写现场作业指导书.

凡常态化工作应使用作业指导书.

作业指导书须进行专题学习, 作业人员应熟练掌握工作程序和要求.

应严格执行指导书, 逐项打勾或签字,并做好记录, 不得漏项.

指导书在执行过程中, 如发现不符合实际及有关规定等情况, 应立即停止工作, 作业负责人根据实际情况及时修改指导书, 履行审批手续并做好记录后, 按修改后的指导书继续工作.

作业过程中如发现异常, 应立即汇报工作负责人, 并进行详细分析, 制定处理意见后方可进行下一项工作.异常情况及处理结果, 详细记录在指导书内.

流程发生变更, 应根据工作实际情况修改作业指导书, 并履行审批手续.建立新的工作内容, 应提前编制作业指导书.

管理

标准化作业归xxxxx, 负责全过程的推广应用和监督检查.

公司及各部门应制定标准化作业管理制度, 严格按照要求执行.管理制度每年修订一次.

使用过的作业指导书, 经主管部门审核后存档.

作业指导书实施动态管理, 应及时进行检查总结、补充完善.作业人员应及时填写使用评估报告, 对指导书的针对性、可操作性进行评价, 对可操作项、不可操作项、修改项、遗漏项、存在问题做出统计, 并提出改进意见.工作负责人和归口管理部门应作业指导书的执行情况进行监督检查, 并定期对作业指导书及执行情况进行评估, 将评估结果及时反馈编写人员, 指导以后的编写.

作业指导书的操作流程配置

配置变更

运维部-配置变更-puppet操作git-标准操作流程

图片[2]-运维部门日常工作SOP操作指导手册-JieYingAI捷鹰AI

运维操作SOP文档模板.xlsx

运维部-配置变更-项目下线-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-配置变更-项目缩容申请-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-配置变更-虚拟机转容器-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-配置变更-外网端口映射-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-配置变更-域名修改-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-配置变更-项目配置修改-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-配置变更-基础组件配置修改-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-配置变更-流量切换流程-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-配置变更-批处理作业流程-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-配置变更-项目扩容申请-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-数据库变更-工作标准作业指导

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-复制 mysql 实例-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-mysql 主备切换-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-上线mysql从实例-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-下线mysql从实例-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-新增数据库实例-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-初始化 mysql 实例-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-项目数据迁移-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-大表变更-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

故障排查

运维部-故障排查-运维诊断/DNSPOD大量域名告警-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-故障排查-域名5XX-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-故障排查-网站样式异常-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

应急响应

运维部-应急响应-流量切换-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-应急响应-数据库-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-应急响应-RabbitMQ 异常-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-应急响应-调度任务平台异常-流量切换-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-应急响应-专线中断-流量切换-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-应急响应-网络攻击-流量切换-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-应急响应-专线中断-数据库切换-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

数据中心变更

运维部-数据中心变更-物理服务器迁移-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-数据中心变更-物理服务器上架-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-数据中心变更-物理服务器下架-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维部-数据中心变更-服务器巡检-标准操作流程

流程模板图上,只是具体的操作步骤不一样而已,根据具体的实际情况做相应修改即可.

运维规范

权限管理和控制规范

数据库规范

注意:以下规范根据个人经验情况及互联网实践整理而成,可能不是很适用,仅供参考…切勿生搬硬套,如引起的不良后果请自行负责,与本站无关…

数据库库表设计规范

例如:

`create_time` timestamp DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',

`update_time` timestamp DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',

CREATE TABLE `gift_test` (

`id` int UNSIGNED NOT NULL AUTO_INCREMENT,

`gift_id` int(11) DEFAULT NULL COMMENT '礼品类别id',

`gift_number` varchar(100) DEFAULT NULL COMMENT '券号',

`gift_isdelete` int(11) DEFAULT '2' COMMENT '是否删除【1是, 2否】',

`gift_sendstatus` int(11) DEFAULT '1' COMMENT '礼品发送状态【1待发送, 2已发送, 3发送失败】',

`create_time` timestamp DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',

`update_time` timestamp DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',

PRIMARY KEY (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT '礼品发放';

建表语句engine必须设置为innodb, DEFAULT CHARSET建议设置为utf8mb4.

索引设计规范

SQL语句开发规范

项目规范

项目命名

正确的命名:

nodejs-xinzheng-hr-web,

java-life-search-server,

开发语言:

php, java, python, nodejs, lua, shell, go, scala, utopia, html(纯静态), 如新增需通过运维负责人添加

主业务名:

根据自身公司开展的业务范围来定,举例:

3D / Search / Hr /

子业务名:

自定义, 只能使用字母和数字,代表此项目具体属性和作用

应用角色:

web(业务主站, 需对外解析域名),

api(服务化类应用, 需要域名但不对外解析),

boss(管理后台应用, 需对外解析域名),

dubbo(dubbo服务化类应用, 不需要域名),

service(同时支持内部和外部访问的, 以提供数据服务为主),

server(通用定义为项目的后端, 即服务端),

agent(客户端, 一个插件或探针),

res(前端资源) 其他不属于以上类型的应用角色,

如需新增报运维负责人审核后增加;

通常情况下, 对外解析的域名最长步超过3级, 域名的第一个字段应与项目名的第三个字段相同或相近, 原则上不允许单字母、有歧义或者与项目无关联的字母组合, 域名新增, 修改, 取消申请需要发jira流程;

boss后台项目建议取名为boss(子业务名).主域名, 例如bosswiki.baidu.com;

API项目域名请使用(主业务名).(子业务名).(开发语言).api.baidu.com

配置规范

资源控制

非核心业务

PHP/NODEJS/PYTHON:1C1G;

JAVA:1C2G;

核心业务

根据需求调配,默认2C4G

数据库选型规范

目前集团运维提供且只提供Percona、Hbase、Mongodb、Elasticsearch、Solr五种数据库选型. 如需要其他数据库,请与运维负责人联系沟通

项目日志规范

日志规范组件接入

php组件地址:

java组件地址:

nodejs组件地址:

日志轮转

单个文件大小: 50M

同一文件存在备份文件个数: 10

例如: hr-web-trace.log

当前的日志输出文件为: hr-web-trace.log

当一个文件打满后,将 hr-web-trace.log 重命名为 hr-web-trace.log.bak.01(01-10)

日志输出文件为 hr-web-trace.log 不变

JAVA项目

PHP项目

路径: /var/log/php/

文件: dberror *-db-error.log phperror *-php-error.log

业务日志: *-app.log (其余调用,如soa等,日志打到app.log中)

日志格式: yyyy-MM-dd HH:mm:ss.SSS [TxId : %{PtxId} , SpanId : %{PspanId}][loglevel] 日志内容

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享