当前位置: 首页 > news >正文

tikv故障排查4 - 小镇

tikv故障排查4

下面是TiDB v8.1.0 + 你当前 Grafana dashboards 的完整作用对照表(单表汇总版)


🧭 TiDB / TiKV Grafana Dashboards 作用总表(v8.1.0)

Dashboard层级作用(做什么)主要看什么问题
online-Overview 全局 集群健康总览 是否整体变慢 / CPU / QPS异常
online-Performance-Overview 性能入口 统一性能入口 读写延迟、吞吐、瓶颈初筛
online-Performance-Read SQL读路径 读请求分析 scan / point get / 读延迟
online-Performance-Write SQL写路径 写请求分析 commit / prewrite / 写延迟
online-TiDB SQL引擎 TiDB运行状态 SQL执行、连接、错误
online-TiDB-Summary SQL汇总 TiDB整体指标汇总 延迟/吞吐/错误率
online-TiDB-Runtime 执行层 SQL执行内部瓶颈 executor / GC / runtime
online-TiDB-Resource-Control 资源控制 QoS/限流 资源组是否限速
online-TiKV-Details 存储核心 TiKV内部详细指标 CPU / Raft / RocksDB / 线程
online-TiKV-Raw KV请求层 KV请求类型分析 raw_get / raw_scan / batch
online-TiKV-Summary 存储汇总 TiKV整体状态 QPS / latency / region
online-TiKV-Trouble-Shooting 故障排查 一键定位问题 热点 / IO / Raft / CPU
online-TiKV-FastTune 优化建议 性能调优 参数/热点优化建议
online-TiKV-CDC 数据同步 CDC链路影响 changefeed性能
online-PD 调度中心 Region/Leader管理 热点 / 分布 / 调度
online-Disk-Performance IO层 磁盘性能 IO latency / util / throughput
online-Lightning 导入 批量导入性能 导入速度/瓶颈
online-Backup & Import 数据保护 备份恢复性能 backup/restore速度
online-TiCDC CDC服务 实时同步 CDC延迟/吞吐
online-TiCDC-Summary CDC汇总 CDC整体状态 延迟/积压
online-Binlog Binlog 旧同步系统 binlog延迟
online-TiFlash-Summary 列存 TiFlash整体状态 查询/同步性能
online-TiFlash-Proxy-Summary 列存代理 proxy状态 连接/调度
online-TiFlash-Proxy-Details 列存代理细节 proxy内部指标 执行细节
online-TiProxy-Summary 代理层 连接/负载均衡 连接数/延迟
Cluster-Tiflow 数据流 数据流任务 pipeline状态
Tidb-Cluster-Node_exporter 基础设施 OS资源监控 CPU / MEM / DISK
online-Blackbox_exporter 网络 网络探测 延迟/连通性
online-Kafka-Overview 中间件 Kafka状态 消息堆积/延迟

🎯 一句话总结

TiDB Grafana =
SQL层(Performance) + KV层(TiKV) + 调度层(PD) + 存储层(Disk) + 基础设施(Node) + 数据链路(CDC/Import)


如果你要,我可以再给你升级一版:

👉「CPU / 内存 / IO / scan 问题分别应该点哪些 dashboard(实战定位图)」