Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25:java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

springcloud分布式电商秒杀实战课程

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > Java基础相关 >

TiDB 中文手册tidb stable zh manual PDF 下载


分享到:
时间:2020-08-16 09:31来源:http://www.java1234.com 作者:小锋  侵权举报
TiDB 中文手册tidb stable zh manual PDF 下载
失效链接处理
TiDB 中文手册tidb stable zh manual   PDF 下载


本站整理下载:
提取码:6bvi 
 
 
相关截图:
 
主要内容:

6.3.2 配置 Grafana
本小节介绍如何配置 Grafana。
6.3.2.1 第 1 步:添加 Prometheus 数据源
1. 登录 Grafana 界面。
• 默认地址:http://localhost:3000
• 默认账户:admin
• 默认密码:admin
注意:
Change Password 步骤可以选择 Skip。
2. 点击 Grafana 侧边栏菜单 Configuration 中的 Data Source。
3. 点击 Add data source。
4. 指定数据源的相关信息:
• 在 Name 处,为数据源指定一个名称。
• 在 Type 处,选择 Prometheus。 • 在 URL 处,指定 Prometheus 的 IP 地址。
• 根据需求指定其它字段。
5. 点击 Add 保存新的数据源。
294
6.3.2.2 第 2 步:导入 Grafana 面板
执行以下步骤,为 PD Server、TiKV Server 和 TiDB Server 分别导入 Grafana 面板:
1. 点击侧边栏的 Grafana 图标。
2. 在侧边栏菜单中,依次点击 Dashboards > Import 打开 Import Dashboard 窗口。
3. 点击 Upload .json File 上传对应的 JSON 文件(下载 TiDB Grafana 配置文件)。
注意:
TiKV、PD 和 TiDB 面板对应的 JSON 文件分别为 tikv_summary.json,tikv_details.json,
tikv_trouble_shooting.json,pd.json,tidb.json,tidb_summary.json。
4. 点击 Load。
5. 选择一个 Prometheus 数据源。
6. 点击 Import,Prometheus 面板即导入成功。
6.3.3 查看组件 metrics
在顶部菜单中,点击 New dashboard,选择要查看的面板。
图 65: view dashboard
可查看以下集群组件信息:
• TiDB Server: – query 处理时间,可以看到延迟和吞吐
– ddl 过程监控
– TiKV client 相关的监控
– PD client 相关的监控
295
• PD Server: – 命令执行的总次数
– 某个命令执行失败的总次数
– 某个命令执行成功的耗时统计
– 某个命令执行失败的耗时统计
– 某个命令执行完成并返回结果的耗时统计
• TiKV Server: – GC 监控
– 执行 KV 命令的总次数
– Scheduler 执行命令的耗时统计
– Raft propose 命令的总次数
– Raft 执行命令的耗时统计
– Raft 执行命令失败的总次数
– Raft 处理 ready 状态的总次数
6.4 TiDB 集群报警规则
本文介绍了 TiDB 集群中各组件的报警规则,包括 TiDB、TiKV、PD、TiDB Binlog、Node_exporter 和 Blackbox_exporter
的各报警项的规则描述及处理方法。
6.4.1 TiDB 报警规则
本节介绍了 TiDB 组件的报警项。根据严重级别,报警项可分为三类,按照严重程度由高到低依次为:紧急级
别、重要级别、警告级别。
6.4.1.1 紧急级别报警项
紧急级别的报警通常由于服务停止或节点故障导致,此时需要马上进行人工干预。
6.4.1.1.1 TiDB_schema_error
• 报警规则:
increase(tidb_session_schema_lease_error_total{type="outdated"}[15m])> 0
• 规则描述:
TiDB 在一个 Lease 时间内没有重载到最新的 Schema 信息。如果 TiDB 无法继续对外提供服务,则报警。
• 处理方法:
该问题通常由于 TiKV Region 不可用或超时导致,需要看 TiKV 的监控指标定位问题。
296
6.4.1.1.2 TiDB_tikvclient_region_err_total
• 报警规则:
increase(tidb_tikvclient_region_err_total[10m])> 6000
• 规则描述:
TiDB 访问 TiKV 时发生了 Region 错误。如果在 10 分钟之内该错误多于 6000 次,则报警。
• 处理方法:
查看 TiKV 的监控状态。
6.4.1.1.3 TiDB_domain_load_schema_total
• 报警规则:
increase(tidb_domain_load_schema_total{type="failed"}[10m])> 10
• 规则描述:
TiDB 重载最新的 Schema 信息失败的总次数。如果在 10 分钟之内重载失败次数超过 10 次,则报警。
• 处理方法:
参考TiDB_schema_error 的处理方法。
6.4.1.1.4 TiDB_monitor_keep_alive
• 报警规则:
increase(tidb_monitor_keep_alive_total[10m])< 100
• 规则描述:
表示 TiDB 的进程是否仍然存在。如果在 10 分钟之内 tidb_monitor_keep_alive_total 增加次数少于 100, 则 TiDB 的进程可能已经退出,此时会报警。
• 处理方法:
– 检查 TiDB 进程是否 OOM。 – 检查机器是否发生了重启。
6.4.1.2 重要级别报警项
对于重要级别的报警,需要密切关注异常指标。
297
6.4.1.2.1 TiDB_server_panic_total
• 报警规则:
increase(tidb_server_panic_total[10m])> 0
• 规则描述:
发生崩溃的 TiDB 线程的数量。当出现崩溃的时候会报警。该线程通常会被恢复,否则 TiDB 会频繁重启。
• 处理方法:
收集 panic 日志,定位原因。
6.4.1.3 警告级别报警项
警告级别的报警是对某一问题或错误的提醒。
6.4.1.3.1 TiDB_memory_abnormal
• 报警规则:
go_memstats_heap_inuse_bytes{job="tidb"} > 1e+10
• 规则描述:
对 TiDB 内存使用量的监控。如果内存使用大于 10 G,则报警。
• 处理方法:
通过 HTTP API 来排查 goroutine 泄露的问题。

 

------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐