运维之道:从“白盒运维”到“场景化运维”

作者: 数据中心操作系统      阅读次数: 947     发布时间: 2016-04-18



导读:如果说开放的白盒运维是运维必经之路,那么场景化就是帮助摆脱黑盒运维殇痛的快车。


黑盒运维之殇

黑盒运维与白盒运维的灵感来自软件测试中的黑盒测试与白盒测试的概念。黑盒运维反映了运维的不成熟,可以分为两个阶段和两种表现形式。

第一种阶段是“人肉运维”

表现形式是加班加点依靠人力被动的满足业务部门的需求,基本顾不上运维的自动化改造和精细化管理,更加无法去了解自己所运维的系统。

第二个阶段“管理缺失的自动化”

表现形式是已经拥有各种外购或自研的自动化软件,但是标准化、规范化、配置管理缺失,各种工具系统缺乏统一的规划和整合,最终只能解决一部分操作层面的问题,无法构建闭环的自动化运维体系。

黑盒运维之殇,借用新浪微博的王炜的一句打油诗就是:“数据谁都要,系统无数套。结果无一准,还是人肉搞。”


白盒运维之道

有感于去年的几次运维故障和多年的运维工具建设经验,提出了白盒运维的理念。

白盒运维,摆脱系统信息不透明,运行状态不可控的运维困境,基于配置管理,构建IT系统的全息视图。使用户全面掌控IT系统的处理流程、架构蓝图、配置信息、运行状态、环境变化、演进趋势,配备各类自动化工具和处理手段。做到闭环管理、全面掌控、数字化运营。

但是白盒运维说的毕竟还是还是一个理念和趋势,运维行业早就不缺方法论,大家也都知道配置管理是运维的核心,但依然是知易行难。

所以,白盒运维该如何演进和落地,就成为关键的问题。我们的答案是:场景化运维。



场景化运维的道与术

场景化运维,在IT系统的全息管理视图之上,依据不同的管理场景,构建管理边界,聚焦管理范围,识别场景角色,选取相关角色所需的信息,处理策略和操控工具。

自由组合接口、数据,功能模块、处理流程,形成针对该管理场景的定制化工作平台,不断沉淀专家经验,形成IT运维应用仓库,使IT运维逐步摆脱对人的依赖,从容应对数据中心中的各项任务。

场景化运维不光是道,还是术。如何实现“场景化运维”,我们总了两大关键点:平台化整合与场景化管理。


平台化整合



平台化整合,针对当前运维工具建设中流程割裂、监管控脱节、工具分散的弊端,将运维环节所有的流程、工具整合成通用平台,往下对接适配各种专业运维工具,往上聚合成通用的运维门户和运维社区,形成累积运维最佳实践的工具和场景仓库。


场景化管理

场景化管理,是最终落地的指导策略。针对各个运维工具的烟囱体系和信息孤岛,基于场景进行抽象和层次的整合,最终形成统一的运维入口、交互、处理、数据,最后通过适配接口去对接最终的执行工具,最终实现了基于场景的配置管理,同时这种基于场景的配置管理加入了可视化的要素,把数据和关系的展现从平面扩展成了立体,更清晰直观。

对于运维而言,不同企业的规模、现状、需求都有差异,技术更是在快速演进中,但唯有运维的场景是不会变化的。通过平台化整合和场景化的积累,构建新一代的运维体系,最终实现可视化的白盒运维,必然是运维的演进方向。


PS: 场景化运维理论,以及配套的平台化整合、场景化管理的实现思路,云霁科技CEO智锦在2016年3月26日的“全球运维大会深圳站”上正式发布。演讲的PPT全文、以及和Puppetlabs联合发布的《2015年devops调研报告》请点击这里下载