云霁科技探寻数据中心操作系统实践之路

作者: 云霁科技      阅读次数: 1000     发布时间: 2016-01-20


什么是数据中心操作系统(DCOS)?云计算时代,运维需要什么样的DCOS?以运维为中心的DCOS如何构建和演进?

向历史要答案

信息技术的发展史可以浓缩为“操作系统”的发展史。

最初是“单机操作系统”(如Windows、Linux等);之后的“虚拟化操作系统”,(如VMware等)奠定了公有云的基础。;然后是“云计算操作系统”(如OpenStack、CloudStack等),在虚拟化层之上针对设备和资源提供统一管理。

今天运维更需要的是 “ 数据中心操作系统 ”(Data Center OS, DCOS)。国外以 “mesos” 为代表的数据中心操作系统,侧重于数据中心资源调度层面,个人认为还是狭义的DCOS。云霁科技则从经典单机操作系统架构出发,重新定义了一个更广义的DCOS:统一管理以上三种操作系统,以及数据中心运行的所有流程规范、技术工具、人员组织、业务,形成大一统的数据中心管理平台。



回顾经典的单机操作系统,由硬件,内核,系统接口和应用程序四层组成,最终为用户提供一个可管理,可扩展的完整系统。从单机操作系统演变到数据中心操作系统,各层面的内容都已经发生了变化,硬件由单机的处理器,存储器,I/O变成了数据中心各类计算、存储和网络资源,管理工具由系统的控制面板变成各类IT监管控系统,承载的应用由office等单机应用变成了各种联机应用。

云霁定义的DCOS,有别于标准开发人员视角定义出的PAAS,实际上是从数据中心和运维人员视角出发定义的类PAAS平台。这样的一个DCOS运维平台应该如何架构呢?我们的答案基于以配置管理为核心的“白盒运维体系”。


从白盒黑盒出发

白盒运维这个词是将软件测试领域的“白盒测试”与“黑盒测试”的概念延伸到了运维领域。

在传统的运维模式中,很多企业管理者或业务部门会对运维的重视度不够,认为运维工作只要能支撑业务不出问题就行。开发部门完成功能开发后,非功能性的问题都由运维人员承担。时间长了历史包袱越来越重,运维人员如同面对一个黑盒子一样,往往不完全清楚所维护系统里的业务依赖关系、应用配置关系等。

当系统出现问题了,只能通过查询、分析各种日志文件来定位故障问题,通过积累出现各种问题的现象经验来提高运维水平。“黑盒运维”如同人在黑暗的房间里前进,只能摸索前进,看不见看不清,容易碰壁,是一种被动的运维、不清晰的运维。

“白盒运维”的核心是从配置管理着手,结合相应的工具和平台,从前端到后端应用服务器、数据库,从事前的资源纳管、环境部署,事中的应用发布,到事后的运行维护,全生命周期的实时、有效的监控和分析系统的每一个环节,真正清楚所管理的系统的应用功能和配置,从根本上解决运维的问题,实现主动清晰的运维。



白盒运维核心:配置驱动变更

“配置管理”知易行难,运维人员都清楚配置管理的重要性,无数企业前赴后继的构建自己的CMDB系统(企业级配置管理数据库),但在企业级市场却鲜有成功应用的案列。

云霁提出的“白盒运维”体系,抛弃了以配置项(CI)为核心的传统CMDB体系,创造性的提出了“配置管理驱动变更”的理念,通过自动化将配置管理和变更管理融合在一起,将传统的CMDB升级成统一管理配置、参数、指标、蓝图的CloudDB,实现闭环的自动化变更,并以此为基础构建出了云霁的iDCOS数据中心操作系统。



化云为雨、合作共赢的平台解决方案

iDCOS提供对数据中心资源纳管、环境部署、应用发布、运行维护等全生命周期的支持。由适配层对数据中心基础设施及外部公有云资源进行适配和抽象封装,由调度层统一驱动和管理数据中心的各类任务和流程协调,应用层围绕配置管理,提供监、管、控等管理能力,并通过和各路合作伙伴一起构建内容丰富的iDC STORE(数据中心解决方案商店),为用户持续提供各类创新高效应用。


在具体的技术路线选择上,为贯彻配置管理驱动变更的白盒运维理念,云霁科技和美国自动化运维软件的龙头企业PuppetLab达成了战略合作协议,将Puppet引入到了云霁的iDC STORE体系中,并为中国的企业用户提供Puppet的销售、培训和技术支持。

同时,为了解决网络设备的配置管理难题,云霁科技还和华为、PuppetLab三方达成了合作协议,将Puppet软件管理服务器的能力,延伸到交换机、防火墙等网络设备,实现了一种特殊务实的SDN解决方案:  和华三通信达成了云管理和云运维的合作,化云为雨,以开放平台的方式与合作伙伴一起,共推数据中心自动化。

未来,希望能和运维行业的各位专家、用户、合作伙伴一起,构建出具备4i能力的数据中心操作系统,让天下没有难运维的数据中心,也让运维人员不再苦逼。



资料下载:

2016年1月,金融云初创公司云霁科技,在杭州西溪喜来登酒店成功主办了公司发布会和第一届金融IT运维峰会。本次会议以“make IT easy”为主题,上百位银行、证券、保险等大中型金融机构运维负责人, 以及来自百度、腾讯、阿里,华为、华三、浪潮、联想和众多新兴云计算公司的领导和技术专家,近500人汇聚一堂。


中国银联运维总架构师任明、浙江移动云平台架构师钟储建、中国民航信息网络股份有限公司技术总监赵宇、百度开放云大数据高级架构师沈国龙、蚂蚁金服金融云业务架构师王磊、腾讯社交平台运维团队负责人梁定安、华为数据中心网络营销总监杜阳、H3C云计算咨询服务部总监高雪鹏等演讲嘉宾进行了精彩的技术分享,演讲主题涵盖了云计算、大数据、运维自动化、网络自动化、灾备体系等数据中心领域的技术热点。


本次金融IT运维峰会演讲材料下载地址:

http://pan.baidu.com/s/1jHkvkNk

提取密码:isug