从DevOps到AIOps(六):AIOps简介有些大型独角兽公司拥有数百名开发人员,每天更新代码超过100次,云上有超过4000台虚拟机,每月收集数PB的数据。而DevOps团队人数有限,这对于少量的团队成员来说是一个艰巨且繁重的任务。巨大的挑战终将超过人类的能力范围,而AIOps成为了一种解决方案。
AIOps的概念由Gartner在2016年提出,旨在使用大数据、机器学习等方法来提升运维能力,其目的是进一步降低自动化运维中人为干扰,最终实现运维无人化、完全自动化。随着现在人工智能技术的不断地发展,智能运维有望得以落地,目前许多企业都在积极探索中。
AIOps又称为智能运维或基于算法的IT运维。目前智能运维还处于初步探索阶段,近期在国外已经发起了面向智能运维的研究,但是在国内,大部分IT企业还处于自动化运维的阶段,一部分大型企业正在向智能运维的方向探索。
清华大学裴丹教授把AIOps和自动化运维的关系做了界定,自动化运维需要具有行业领域知识和运维场景的知识,具有实际处理能力。自动化运维基于规则,适用于中小环境。AIOps是去规则化的,尝试通过大量的数据训练,自动琢磨出来规则,因此适用于大型或更复杂的环境。
具体而言,是对我们平时运维工作中长时间积累形成的自动化运维和监控等能力,将其规则配置部分,进行自学习的“去规则化”改造,最终达到终极目标:由AI调度中枢管理的,质量、成本、效率三者兼顾的无人值守运维,力争所运营系统的综合收益最大化。
GAVS、Moogsoft等互联网公司都发布了AIOps的。其中,GAVS在中提出将算法作为有竞争力的工具,并提出了构成智能运维系统的一些主要元素,包括监控生态系统,分析系统,记录系统,自动脚本系统,数据池等关键组件。同时,GAVS也在中提出了对AIOps的愿景,包括提升对业务、信息、网络和设施的可见度;实时分析诊断问题并提供解决方法;实时通知警告存在问题;信息监控和行为预测等。
Moogsoft提出当今的计算能力已经变得高效、便捷、便宜;如今的算法诸如监督学习/无监督学习,已经有能力从大数据中推导出相关的含义,因此可以使用AIOps协助人们进行IT运维。2018年4月,由高效运维社区发起,联合百度、阿里巴巴、腾讯等多家企业人员起草了《企业级AIOps实施建议》V0.6。
阐释了AIOps的目标是“利用大数据、机器学习和其他分析技术,通过预防预测、个性化和动态分析,直接和间接增强IT业务的相关技术能力,实现所维护产品或服务的更高质量、合理成本及高效支撑”。中建议“AIOps的建设可以从无到局部单点探索,再到单点能力完善,形成解决某个局部问题的运维AI‘学件’(也称为AI运维组件),再由多个具有AI能力的单运维能力点组合成一个智能运维流程”。
AIOps是一个总称,用于指代使用复杂的基础设施管理软件和云解决方案监控工具来实现自动化数据分析和日常的DevOps操作。AIOps是运维的终极形式,Devops是AIops的必经之路,AIOps是Devops在运维技术侧的高级实现。DevOps要做得好,必须借助于AI。两个相互不冲突。而且部署AIOps解决方案可以实现以下的积极成果:
(4) 日常任务的自动化,使IT部门能够集中精力于改进基础架构和流程,而不是处理重复且耗时的任务PG电子。
(5) 更好的协作,因为对日志的深入分析有助于显示管理决策的影响,并评估采用的业务战略的效率。
Copyright © 2020-2025 PG电子(中国)官方网站 版权所有鲁ICP备20008350号-1 Xml网站地图 HTML地图 txt地图