1 目的
操作过程的目的是利用系统来提供其服务。
这一过程确立了对操作系统的要求并指派人员,还监控服务和操作系统性能。为了维持服务,它识别并分析与协议、利益相关者 1要求和组织约束有关的操作异常。
运营流程通常旨在控制或降低运营成本,同时维持可接受或更高的服务水平。
软件系统可以拥有专用的基础设施,但通常在分布式环境中运行,其中其他软件系统和服务(例如互联网)处于反应状态。因此,感兴趣的软件系统的安全性 2、可用性和运行性能是大型系统内关注的问题。它可以包括与提供相同或类似服务的其他系统所提供的预先存在的、并发的或持续的服务的协调。
注:ISO/IEC20000‑1:2011(IEEEStd20000‑1) 是一项服务管理体系标准,它规定了管理运营服务的设计、过渡、交付和改进的要求,并支持运营流程实现其目的。
2 结果
成功实施操作流程的结果是:
- 影响系统/软件需求、 架构或设计的操作约束是已识别。
- 操作所需的任何支持系统、 服务和材料均可用。
- 有经过培训的合格操作员。
- 提供满足利益相关者要求的系统产品服务。
- 监控系统产品在运行过程中的性能。
- 向客户提供支持。
3 活动和任务
项目应根据组织运营流程适用的政策和程序实施下列活动和任务。
a)准备操作。此活动包括以下任务:
1)定义运营策略,包括以下考虑:
我) 服务在引入、常规运行和退出服务时的预期或约定的容量、可用性、响应时间和安全性;
二) 人力资源策略,根据需要定义培训和资格要求,培训或获得人员来控制和监控软件系统操作,管理系统访问,并支持客户服务请求和用户协助;
三) 软件系统的发布标准和时间表允许进行维持现有或增强服务的修改;
四) 实施作战概念中的作战模式的方法,包括正常作战以及设想的应急作战类型的准备和测试;
五) 可提供对性能水平洞察的运行措施;
六) 针对操作员和其他在操作过程中使用或接触软件系统的人员制定操作和职业安全策略,考虑安全法规;以及
七) 软件系统运行的环境保护和可持续性策略。
注:ISO/IEC16350信息技术 3 – 系统和软件工程 – 应用管理为操作方面提供了指导。
2)识别系统操作中的约束,并将其纳入系统/软件的变更中需求、架构、设计、实施或转变。
- 识别并规划支持操作所需的必要支持系统或服务。
注:这包括识别操作要求和使能系统的接口。操作软件系统的特殊模式(例如训练模式)有时可以与完整操作模式一起激活,或者代替完整操作模式。使能系统包括对软件系统威胁变化的监控。
- 获取或获得将要使用的支持系统或服务的访问权。
注:验证过程 4用于客观确认操作支持系统是否实现了其预期用途和功能。
5)识别或定义软件系统所需人员的培训和资格要求手术。
注:培训和资格包括对软件系统初始操作环境的认识和对已定义程序的熟悉,以及适当的故障检测和隔离指导。操作员知识、技能和经验要求指导人员选拔标准,并在相关情况下确认其操作授权。资格范围取决于感兴趣的系统及其环境。例如,在某些环境中,监管要求包括操作员认证,而在另一些环境中,则没有认证要求。
6)根据人为干预和控制操作的需要,指派经过培训的合格人员担任操作员。
注意:充分考虑到职责分离,例如对系统访问的管理控制和安全问题的调查,许多现代软件产品尽量减少了对操作员与最终用户的区别的需求,操作员通常支持支持系统,例如云服务、数据库和系统软件、安全监视器、数据存储和帮助台。
b)执行操作。此活动包括以下任务:
- 在预期的操作环境中使用软件系统。
注:如果达成一致,当软件系统取代现有的正在退役的系统或元素时,将保持持续的服务能力和质量。
2)根据需要应用材料和其他资源来操作软件系统并维持其服务。
注意这包括硬件的能源、软件的连接以及人工或自动操作。
3)监控软件系统运行,包括考虑以下内容:
- 管理对运营策略(例如运营程序) 的遵守情况;
二) 记录和报告重大事件,例如可能违反软件和数据机密性和完整性的行为;
三) 以安全的方式操作软件系统并遵守法律准则,例如有关职业安全和环境保护的准则;以及
四) 当软件系统或服务性能不符合可接受的参数时进行记录。
注:这包括由于操作策略、操作启用系统、操作执行或不正确的软件系统定义而导致的异常。当硬件中实现的系统元素性能下降或超出其使用寿命,或系统的运行环境影响软件操作(例如,工作负载超过容量阈值、竞争应用程序的利用率、安全黑客或软件缺陷)时,系统有时会表现出不可接受的性能。
4)根据运营战略 5,制定并在可行的情况下实现运营程序的自动化,以最大限度地降低运营异常的风险。
注:这包括处理常规(预先批准的)变更请求和服务请求、故障射击和事件报告,特别是安全事件。
5)与运营战略一致,分析测量结果以确认:
我) 服务绩效在可接受的参数或约定的服务水平和约定的工作量范围内;
- 系统和服务可用性及响应时间可接受;
三) 运营成本与目标和约束一致;并且
四) 确定潜在的改进并确定其优先顺序。
注意:操作员的反馈和建议通常有助于改进软件系统的操作性能。可以应用质量保证和测量过程。
6)如有必要,执行应急行动。
注意这包括以降级模式操作软件系统、执行退出和恢复操作、系统关闭、实施变通程序(存储操作)或其他特殊条件的模式。
如果需要,操作员执行必要步骤进入应急操作并可能关闭系统。应急操作是根据此类事件的预先设定的程序执行的。通常这些程序伴随着连续性计划。
c)管理运营成果。此项活动包括以下任务:
1)记录操作结果及遇到的异常情况。
注意项目评估、控制和质量保证过程用于分析事件和问题数据,以确定根本原因 6、采取纠正或改进措施,并记录经验教训。
2)记录操作事件和问题并跟踪其解决方案。
注:通过质量保证和项目评估与控制过程 7来处理事件和问题。对其他需求、架构、设计或软件系统元素的变更,则使用其他技术过程来完成。
注:如果在操作期间遇到事件,操作员应记录该事件(或向自动通知发出警报)并执行无效操作程序中规定的操作以恢复正常操作。某些程序允许提供临时解决方法,直到可以执行根本原因分析为止。
注:在软件运行期间,通常记录发生问题的情况,与维护或恢复操作可用性一致,以便如果可能的话,可以在环境中复制问题并确定根本原因。问题解决通常涉及确定问题的严重性和影响,以及是否或何时需要纠正问题或暂时接受问题作为已知错误。
3)保持操作服务和配置项的可追溯性 8。
注:在操作服务与业务或任务需求、 操作概念、 操作概念和利益相关者要求之间保持双向可追溯性。操作配置项可追溯到已发布的版本,并通过 PCA 或 FCA 进行验证。
- 提供已选定的基线关键工件和信息项。
注:此过程确定基线候选者,信息管理过程控制信息项,例如有关运营服务绩效的报告。运营的关键工件(信息项)列于附件 B 中。
d)支持客户。此活动包括以下任务:
1)向顾客和用户商店提供协助和咨询,解决投诉、事件、问题和服务请求。
注:协助和咨询包括提供或推荐培训、文档、漏洞解决、反假冒活动和其他支持有效使用软件系统的服务来源。
注:客户支持包括与服务客户、用户和其他利益相关者的沟通,接收服务请求和变更请求,解决投诉,并提供有关解决事件和问题的信息。
2)记录并监控支持请求和后续行动。
3)确定交付的软件系统或服务满足客户需求的程度顾客和用户。
注:对结果进行分析,并确定所需采取的措施、存储或修改软件系统或服务以提供持续的顾客满意度和软件系统可用性。只要可能,此类行动的益处就应与利益相关者或其代表达成一致。顾客满意度数据也可作为质量管理过程的输入。