彩立方2app下载

海上船组

处理重大IT事件的十个优秀实践流程

时间: 2024-03-12 13:35:58 |   作者: 海上船组


  每当出现重大IT事件(例如勒索软件攻击)时,IT团队就会进入救火模式,并将其解决过程提升到一个全新的水平。如果遵循规范的实践步骤和流程,这些IT事件就不会成为常态。

  而在任何一个时间里都可以从容地解决重大IT事件,采取一些实践是值得的。因此,人们要了解网络安全方面的优秀实践和最新预测。

  当一个问题对很多用户造成巨大的业务影响时,可以将其归类为重大事件。它迫使企业偏离现有的事件管理流程。

  在通常情况下,高优先级IT事件被错误地视为重大事件,许多企业没有针对安全漏洞的事件计划。这可能是由于缺乏明确的ITIL指南。因此为了尽最大可能避免混淆,企业一定根据紧急性、影响和严重性等因素明确定义重大事件。

  实施强大的工作流程可帮企业迅速恢复中断的服务,重大事件的单独工作流程有助于无缝解决实际问题。在为重大事件制定工作流程时,专注于自动化和简化以下工作:

  企业确保其最佳资源正在处理重大IT事件。此外,由于这些事件对业务的影响很大,因此就需要明确定义他们的角色和职责。企业要设立一个专门的或临时的团队,具体取决于重大事件发生的频率。

  一些企业有一个由重大事件管理人员领导的专门处理重大事件的团队,而另一些企业则有一个由各部门专家组成的充满活力的临时团队。企业的主要目标必须是保持其资源参与,并避免时间和优先事项的冲突。

  IT团队并不了解什么时候会出现重大事件,但处理事件的第一步是准备好。公司能够将重大事件管理团队分成几个小组,并对他们进行重大事件管理方面的培训,并通过将技能与需求相对应来分配职责。

  定期运行模拟测试,以确定优势、评估性能,并根据自身的需求解决问题。这也将帮企业的团队应对压力,并在面对实时场景时准备好。企业为团队配备合适的工具,例如具有无缝连接的智能手机、平板手机和平板电脑,以便他们在紧急状况下随时随地工作。

  企业需要为重大IT事件定义严格的服务等级协议(SLA),可设为单独的响应和解决服务等级协议(SLA),并为任何违反流程的行为提供明确的升级点。如果指定的技术人员缺乏解决事件的专业相关知识,需要遵循人工升级的流程。此外,确保备份技术人员始终可用。

  在重大IT事件的整个生命周期中,需要向利益相关者发送公告、通知和状态更新。自助服务门户中的公告将防止最终用户提出重复的问题并使服务台超载。

  此外,在由重大事件引起的服务停机期间,每小时或每两小时发送一次更新。企业还要设立专线,立即响应重大事件,并为利益相关者提供支持。公司能够使用最快的通信方式,例如电话、直接预约、实时聊天和远程桌面控制,而不是依赖电子邮件。

  在解决重大事件之后,通过问题管理办法来进行最终的原因分析。然后,遵循变更管理流程,实施组织范围内的变更,以防止将来发生类似事件。

  通过使用资产管理提供有关所涉及资产的详情信息,加快整个事件、问题和变更管理流程。通过确保事件响应与网络保险政策保持一致,需要覆盖所有资产。

  可以创建简单的知识库文章模板来捕获关键细节,例如文章涉及的重大事件的类型、使用文章解决的最新问题、文章的所有者以及实施解决方案所需的资源。

  记录和分析所有主要的IT事件,以便确定需要改进的地方。这将帮企业的团队在未来有效地处理类似问题。

  此外,生成特定于重大事件的报告,用于分析、评估和决策。可以生成以下报告以帮助进行相对有效的决策:

  最好的做法是记录主要事件流程和工作流程以供参考。这可以捕获详情信息,例如所涉及的人员数量、他们的角色和职责、沟通渠道、用于修复、批准和升级工作流的工具,以及总体战略以及响应和解决的基线指标。

  企业的管理层必须定期评估流程,以检查是不是达到了重大事件管理的目标绩效水平。这能够在一定程度上帮助纠正缺陷,并为持续的服务改进服务。

  虽然出现重大IT事件在所难免,但处理每一次事件都是企业IT团队的学习过程。坚持实施这些优秀实践可能是掌握处理重大事件技能的第一步。

  平台工程(PlatformEngineering)逐渐走入了人们的视野,开发者体验(DX)也慢慢变得受到关注。在此背景下,本文翻译整理了来自FernandoVillalba的《10BestPracticesofEngineeringCommunication》,从文中可见,共情不仅在其它领域,在工程团队也是如此重要。译者还在文末还补充了5点提升团队沟通质量和效率的一般性建议。