• 回复
  • 收藏

嘉银科技:探索ChatOPS大模型,实现智能告警流程

花之语   论坛守护神 楼主 1 小时前 来自手机   显示全部楼层 来自:广东广州
嘉银科技在全链路监控告警方面的实践经验,包括监控架构设计、告警管理、智能可观测实践和未来展望。

1. 嘉银监控架构设计

- 基础设施概览:拥有大量虚拟机、物理服务器、微服务Pod等。

- 监控告警挑战:面临多地域多环境、监控滞后、工具压力大、数据规模大、指标管理难等问题。

- 智能监控发展历程:从海量告警数据管理到引入CMDB,再到探索大模型应用,逐步提升智能化水平。

- 基于VictoriaMetrics的Prometheus集群架构:介绍了其架构组成及分布。

2. 嘉银告警管理

- 监控告警流程:涵盖监控数据源、告警事件加工、处理、分派等环节,涉及多种工具和策略。

- 统一监控告警平台建设:包括告警事件中心、规则管理、展示、阈值设定等功能,整合多种数据来源。

- 四层监控体系建设:从业务、应用、资源、硬件等层面进行异常定位。

- 告警降噪流程:通过过滤、抑制、关联、合并等方式解决告警噪音、发散、阈值不当等问题,联动CMDB识别告警资源。

3. 嘉银智能可观测实践

- 数据基础:全面优质的数据是智能化的基础,包括链路、剖析、日志、指标数据等,建设统一监控指标数据底座。

- 智能化场景落地

- 先知:通过智能阈值、分级、巡检、趋势预测等实现对业务健康度的智能分析,介绍了相关算法和案例。

- 先决:面临根因分析挑战,介绍了常见方案和嘉银的根因分析流程及案例。

- 先行:设计故障自愈流程,包括告警触发到恢复的各环节,展示了相关案例。

4. 未来展望

- 探索ChatOPS大模型,实现智能告警流程。

- 丰富场景多元化智能巡检、故障诊断和自愈规则,实现多场景提前预警等能力。

- 提升智能运维算法治理能力。(搜狐网)
[发帖际遇]: 查理·芒格对花之语 说:“大部分生活和事业上的成功来自于有意避免了一些东西:早死、错误的婚姻等等。”花之语 听后得到了2 颗宝石。 幸运榜 / 衰神榜
回复

使用道具 举报

大神点评(4)

喜大普奔   论坛守护神 1 小时前 来自手机   显示全部楼层 来自:河北石家庄
探索ChatOPS大模型,实现智能告警流程
参与人数 1宝石 +3 收起 理由
小财神 + 3 解决零回复,赞一个!

查看全部评分总评分 : 宝石 +3

回复 支持

使用道具 举报

行云流水   活跃之星 1 小时前 来自手机   显示全部楼层 来自:山东淄博
了解了一下
参与人数 1宝石 +2 收起 理由
小财神 + 2 解决零回复,赞一个!

查看全部评分总评分 : 宝石 +2

回复 支持

使用道具 举报

julan762   金融寡头 1 小时前 来自手机   显示全部楼层 来自:上海
太好了😄
参与人数 1宝石 +1 收起 理由
小财神 + 1 解决零回复,赞一个!

查看全部评分总评分 : 宝石 +1

回复 支持

使用道具 举报

nwd7p2zewx   世界首富 29 分钟前 来自手机   显示全部楼层 来自:山西晋中
好厉害呀
回复 支持

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版奖励规则

HOT • 推荐

关注326

粉丝1389

帖子111117