欢迎来到格策美文网
更新日期:2025-06-06 09:27
写作核心提示:
撰写网络运维月工作总结时,以下事项需要注意:
1. 结构清晰:确保文章结构合理,层次分明。一般包括开头、正文和结尾三个部分。
2. 内容全面:总结过去一个月的网络运维工作,包括已完成的项目、遇到的问题、解决方案以及取得的成果等。
3. 重点突出:针对本月工作的重点和亮点进行详细描述,使读者对本月工作有清晰的认识。
4. 数据支撑:使用具体数据、图表等形式展示工作成果,增强说服力。
5. 分析问题:对本月工作中遇到的问题进行分析,找出原因,并提出改进措施。
6. 反思与展望:对本月工作进行反思,总结经验教训,为下月工作提供借鉴;同时,对下月工作进行展望,制定工作计划。
7. 语言规范:使用专业术语,避免口语化表达;注意语法、标点符号的正确使用。
8. 格式规范:按照公司或部门的要求,调整文章格式,如字体、字号、行距等。
以下是一份网络运维月工作总结的参考提纲:
一、开头 1. 简要介绍本月工作概况; 2. 明确总结目的。
二、正文 1. 已完成项目及成果 a. 项目一:详细描述项目内容、完成情况及成果; b. 项目二:详细描述项目内容、完成情况及成果; (以此类推) 2. 遇到的问题及解决方案
文/华夏银行广州分行 邹剑云 张五华
随着不断地优化产品、业务模式再造等,多维度服务方案的落地,伴随的问题是如何能保障多元服务方案的高效稳定运作,华夏银行广州分行根据总行制定的数字化智能运维方针要求展开了探索,通过不断地微开发、测试、调试等实践,再结合我行的实际运维环境,总结出一套智能运维的多元服务方案,并于2023年正式上线《数字化基础设施智能运维平台》,为多元化产品服务方案提供了有力的运维保障。
探索“带外为主、带内为辅、统一集中”的智能运维体系
随着业务快速发展和企业信息化程度不断提高,信息业务系统及系统支撑硬件设备的规模越来越庞大,对业务系统及设备运维管理能力的要求也越来越高。
华夏银行广州分行采用自建数据中心机房的方式来承载业务,平台未上线前,基础设施的监管方式还是以人工现场巡检为主,方法效率低下,响应处理时效较滞后,普遍存在以下问题:现场人工巡检,耗人耗时且效率低下,易出现漏巡、误巡问题;24小时安排人员现场值守,管理人员的负担重;出现故障时,安全隐患得不到及时发现与排除;管理分散、缺乏多层面多维度的体系对机房基础资源进行集中统一监控管理。
华夏银行广州分行分别从总行、其他分行以及同行之间进行了调研,并借鉴目前主流的基础设施运维方式,总结了“带外为主、带内为辅、统一集中”的智能运维的探索方向。
带外是当前业界运维管理最常见的一种方式、技术手段,是必备的运维工具。独立的带外网犹如在高速公路上的一条必备“应急车道”。通过带外管理模式,能够将设备管理控制信息网与承载用户业务信息网进行网络隔离,实现在不同的逻辑信道中传送,管理网与业务数据网实现物理隔开。当出现无法通过网络访问承载用户业务的设备时,就可通过带外的管理网络对设备进行监控管理,形成一个设备管理的紧急通道,如当网络设备因网络风暴导致设备宕机了,这时就可通过“带外应急通道,去管控设备,让设备正常恢复运行”,当设备业务网出现异常时,依然可以通过带外网对设备进行监测、管理以及控制。
同时,平台用带内为辅的非Agent监控方式,不依靠部署在被监控端的软件(插件),而通过一些标准的协议或其他途径,实现监控数据,非Agent监控具有对被监控机影响小、部署简单的特点。总而言之,“带外为主、带内为辅、统一集中”的智能运维的探索方向是正确的。
数字化基础设施智能运维平台能够实现设备集中访问控制、设备资产数据读取、操作日志记录、故障告警;能够减少运维成本、提高运维效率、减少宕机时间,在提升数据中心的设备管理水平、加强设备运行维护功能、降低运维成本方面起着很重要的作用,是现在设备运维管理中不可或缺的重要方式(如图所示)。
图 华夏银行广州分行智能运维平台
一是构建集中监控管理平台。平台通过对跨品牌、跨设备类型、跨技术层面的统一监控和集中管理,实现对各种不同类型资源的配置、性能、日志、端口可用性、端口故障、链路问题等统一监控,覆盖了我行硬件资源、软件资源、环境资源的实时日志数据采集、监控告警、性能监测等,并有良好的接口扩展对接能力,与第三方运营平台进行对接,实现异常及时告警。
二是提高各项资源运维管理水平能力。平台主动对各类型资源告警、响应。通过统一集中告警过滤、压缩等清洗处理后发送给相关责任人,由相关人员对告警信息进行数字治理,平台实时、高效、主动地监控设备的工作运行状态,解决了被动救火的服务状态,当设备出现异常时能实时告警、及时发现、准确分析及定位,真正全面监管设备资产的日常运行,从而全面做到对设备资产的集中性、安全性、实时性管理,提升设备整体化集中管理水平。平台通过带外的方式连接设备管理端口,实现对设备进行远程控制,包括快速登入设备管理控制台、查看设备日志、设备配置管理、开/关机、重启以及对服务器进行KVM登入操作系统等,实现远程集中管控、故障根因分析、故障设备快速准确定位等,加快设备维护效率。
三是实现运维管理全流程自动化。平台未上线使用前,我行运维巡检主要依靠人工进行巡检,存在故障发现不及时、响应处理时效滞后、巡检数据靠手工纸质维护等问题。人工巡检存在的问题:人工巡检频率低,故障发现不及时;依赖告警灯,告警灯本身故障时无法发现告警;无法对故障分析定位;部分故障面板灯不告警导致故障发现不及时。
摒弃传统人工巡检方式,通过设置即时、定时定期任务的方式,由平台对设备进行自动巡检,实现有效替代人工机房巡检,减少人力投入,提高巡检效率、巡检质量以及巡检到位率。平台巡检后实时自动生成巡检报表,通知对应运维管理人员查看巡检报告,实时掌握基础设施的运行状态,实现运维管理全流程自动化。
数字化基础设施智能运维平台运用带外、带内等不同技术元素做开发,系统平台具备安全、稳定、监控实时、功能丰富、可扩展性强等特性。从2023年上线至今,实现硬件基础设施、软件基础设施、环境基础设施进行统一管控,对全网资源进行了实时监管控,包括配置、告警信息、性能数据、部件数据、温度能耗等,解决了人工运维工作量大、重复性高、缺少运维数据等问题,进一步提高基础设施的合规性,提升数据信息的准确率能力,实现数字化、智能化、可视化的运维方针,达到“数字化、自动化、智能化”的敏捷管理目标,全面夯实科技发展战略,赋能业务发展,为银行数字化转型提供更加丰富的解决方案,获得的实践收益如下。
监管覆盖行内共73个软、硬件以及环境资源,实现在同一平台全方位管理。
期间多次通过企业微信发送告警,运维人员第一时间处理,一般在2小时内解决,事后排查总结发送的告警均为正确,无误报无漏报。
该系统实用功能丰富,节约了一部分运维人力,节约下的运维人力能够投入其他业务。同时,该系统降低了人员的劳动强度,改善运维人员工作环境,提升了运维人员的积极性。
通过自动化巡检生成巡检结果,取代了纸质巡检报告,实现巡检结果无纸化,促进了分行信息科技运维管理数字化转型工作。
提高安全性。平台通过实时监控和预警,能够及时发现和处理基础资源的安全问题,并同步发送给相应运维人员,减少安全事故的发生。
提高可靠性。平台可以对设备进行实时监测和诊断,及时发现故障并进行修复处理,提高系统的可靠性。
提高稳定性。平台可按设备厂家或故障类型等多维度告警TOP统计,数据化报表分析并给出指导建议,合理采购和报废设备,提高设备稳定性。
提高效率。平台可对多个及不同类型设备进行统一管理和监控,减少了人力资源的浪费,降低劳动强度,提高工作效率。
降低成本。平台可实现对多个及不同类型设备的远程管理和维护,通过自动巡检输出巡检报告,直观的展现资源运行情况,有效减少了人工巡检及维护的成本。
改善运维体验。通过平台可以方便地获取设备状态信息,并能够快速响应问题,加快整体故障发现及处理的实时性,提高运维效率。
平台上线以来,结合实际运维场景需求,华夏银行广州分行的实践经验及部分定制化应用场景,均可成为总行及其他分行可使用的共性场景,包括动环纳管、应用纳管、定制化巡检报表等,同样也可以适用于其他同行的数据中心基础设施运维管理,为实现数据中心基础设施数字化智能运维提供可借鉴案例及实践经验。
未来,我行将在沿用现有系统功能的基础上对平台继续探索开发,通过不断对设施管理、信创适配、流程管理等功能进行优化,进一步提高平台的实用性、易用性、响应性和操作性,把平台融入我行运维生态,助力不断提升智能化数字运维效率。
(此文刊发于《金融电子化》2025年1月下半月刊)
本站部分资源搜集整理于互联网或者网友提供,仅供学习与交流使用,如果不小心侵犯到你的权益,请及时联系我们删除该资源。