人工智能与运维质效提升:工行软件开发中心参数治理建设实践
一、参数治理
随着大数据、人工智能等技术的快速发展,金融行业近年来集中进行数字化转型,数字化技术可以提高企业的核心竞争力,更好地适应市场变化和客户需求,智能运维便是企业数字化转型的关键支撑。
传统应用运维着重于服务器的手工搭建、参数的手工维护和版本的正确安装。就参数而言,随着企业规模的逐渐壮大,应用数量增加,参数数量随之激增,参数规模迅速膨胀。参数量在壮大的同时,也让诸多风险凸显出来,如参数分类不正确、参数描述模糊带来的人工维护成本居高不下、参数值不正确阻碍测试等等。传统手工维护参数并对参数进行人工复核的方式成本消耗巨大,为提升运维质效,中国工商银行软件开发中心利用人工智能技术,结合 DevOps 与 AIOps 思想,运用自动化工具进行参数治理建设,为企业发展注入新的活力。
二、治理流程
1. 运维过程中常见问题:
(1)参数设计不合理,版本安装后反复修改,导致测试效率降低、回退存在风险。
(2)版本带出参数分类错误,导致环境参数数量不准确,运维人员需维护在工具内的规则更复杂,也会导致参数修改权限混乱,可修改参数的人员范围扩张。
(3)环境存在冗余参数,对于已经退出使用的参数未进行删除,或者新增参数时并未合理利用现有可复用参数,导致参数体量越来越大,同时增加运维维护成本。
为解决上述问题,参数治理亟需贯穿于 DevOps 各个环节,研发针对参数治理的自动化工具,从源头开始对参数进行把控,避免参数无序增长及随意被修改、删除。
2. 参数治理的总体框架:
设计及编码阶段:参数的新增、修改需符合各项参数规范,参数描述要准确、控制范围和生效条件要明晰,形成参数设计文档。
参数的修改要由审核者进行审核后发布到Git,避免不合理的参数设计引入各个环境。同时,在提版环节利用大模型创建智能体,提供参数提交指导,如参数分类、参数合理描述等,形成参数文档资产,纳入参数台账。另外,智能体还可在参数提交后辅助审核人员进行检测审核。
构建及部署阶段:管理参数,实现参数的热发布、权限管控、集中管理,提升参数的机密性、完整性、可用性。研发参数自动化检测工具,扫描版本带出的参数,智能识别分类错误、冗余、参数值及描述不合理的参数。
测试阶段:对参数设计文档进行复核并覆盖测试,同时利用自动化检查工具结合分布式配置中心(Apollo)进行测试环境与生产环境的参数比对(含投产前核对),降低版本交付风险。
在各个涉及参数的环节,需遵守相关规范,将安全宗旨贯穿于整个运维流程。同时利用大模型或机器学习收集各个环节的运维数据,并用提供相应指导与检测,降低人为操作频率,提高运维效率。
3. 参数治理的具体实现:
参数设计:参数台账系统为设计人员提供应用存量参数的全局视图,方便设计人员在参数新增时按节点、服务环境、标签等维度灵活查询存量已有的参数信息,避免引入冗余参数。在参数新增环节,针对参数命名、参数描述、参数分类、参数值等列,对标技术参数管理规范强化系统校验,同时训练大模型助手实时提供参数维护建议,便于从源头避免引入不合理的参数设计。同时,参数台账展示了参数的维护记录、人员、原因等,减少了后续问题溯源的时间。
参数审核: 大模型辅助提供参数审核指导,降低审核人员的专业门槛及人工误操作的几率。
参数检测:基于机器学习、文本分析技术打造自动化智能扫描工具,对版本制品、测试环境中的参数进行定时扫描,精准识别分类错误的参数及环境中长时间未被调用的或过于相似的参数,扫描结果基于参数台账推送至应用架构师,架构师基于分析结果确认整改版本计划;自动扫描参数值为弱密码、明文密码等可能带来密码泄露风险的参数,并将上述所有扫描结果返回至大模型进行进一步训练。
参数比对:在版本交付或上线前对版本带出的与各个环境的参数进行差异比对,避免由误删除、参数值不准确等情况导致的测试覆盖不全的问题发生。
环境搭建:在环境准备初期,对环境参数进行自动替换,并生成不同版本间参数的差异便于后期核对。
工商银行软件开发中心通过上述流程机制和工具,在DevOps 各个环节进行参数治理,截至目前已成功治理 2W+ 参数,极大降低了环境搭建中断次数及版本安装中断次数,有效提高了测试效率。
三、展望
参数治理是一个持久的过程,需纳入环境运维的常态化机制,企业可以结合人工智能的不断发展,坚持把防控风险作为金融工作的永恒主题,加强监管和防范化解风险,坚决守住不发生系统性和区域性金融风险的底线。
工商银行软件开发中心将紧跟时代步伐,将人工智能技术继续深入运用到运维体系中,进一步提升运维效率,创造出更智能的自动化工具、更稳妥的工作流程,降低人工操作的风险,实现运维的数字化转型,同时解放人力创造更多价值,为推进金融高质量发展、加快建设金融强国贡献力量。
END