方案背景
依据传统it架构建设的数据中心,数据中心运维的管理对象主要是:机房环境基础设施部分、各种设备、系统与数据、管理工具等,提供多方融合服务,面对复杂的机房环境,如何快速准确定位故障,是很难解决的问题,数据中心包含设备类型多、数量多、压力大,出故障需要在尽可能短的时间内恢复故障,减少对业务系统影响,但运维服务团队水平层次不齐,出故障无法快速处理。
数据中心需要一种智能化具有自动恢复功能的管理工具,自动化运行管理平台,智能化管控运维服务,提到人工检修工作,提高自动化程度及无人值守能力。
应用场景
企业数据中心自动化运行管理平台
方案概述
自动化运行管理平台采用最新技术,融合人工智能、大数据、自动化、机器人等技术,为数据中心提供数字化智能管理服务。自动化运行管理平台建立更为可靠的生产运维保障体系,多层级业务分离,构建一体化、智能化、自动化的运维平台。
主要功能:
一、智能运维:采用一体化平台对数据中心进行智能运维,自适应的故障异常检测,依据机器学习算法,从智能运维算法学习到智能运维技术层面,完成自适应学习的异常状态检测,结合多指标异常根因分析,可以大大减少问题定位时间,并有效提升it管理员问题解决能力,完成巨大工作量的日常运维服务。
二、一体化运维:平台使用可视化脚本管理,支持大文件快传、任务秒级定时、万级开发能力、可溯源操作审计,支持针对不同场景如参观、指挥、值班等进行可视化大屏的定制设计。
三、自动化管理:平台联动感知流程和制度规范,融合稳态和敏态运维,快速解决问题,快速、灵活、迭代完成服务输出,通过反馈环路和持续改进来提升客户体验。平台覆盖云环境、应用、主机网络等全栈运维场景,提供应急自动化服务、标准变更自动化、日常运维自动化、应用变更部署、系统自动化巡检、系统安全加固合规检测等服务。平台可简化流程复杂度,缩短切换时间,保障业务连续性,实现作业调度管理的自动化、标准化、规范化。
方案价值
自动化运行管理平台为数据中心提供新一代数字化智能化管理服务,数据中心运维的不断更新,让数据中心依靠自动化运行管理平台,结合智能巡检机器人,逐渐释放运维人员工作量,提高运维服务效率,最终达到“无人值守”数据中心。