失效链接处理 |
Prometheus学习手册 PDF 下载
下载地址:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/28546304.html
相关截图: 资料简介:
- 了解对你的应用程序代码进行测控的位置以及对应的测控量级。
- 使用标签来区分指标:*的键值对。
- 对Grafana这个流行的仪表盘工具进行介绍。
- 学习如何使用节点导出器对你的基础设施进行监控。
- 使用服务发现为你的机器和服务提供不同的监控视角。
- 在Kubernetes中使用Prometheus,并测试你可以在容器中使用的导出器。
- 将其他监控系统的数据转换为Prometheus能够识别的格式。
资料目录: 目录前言 1第I 部分 概述第1 章 什么是Prometheus 7什么是监控? 9监控简史 10监控分类 11Prometheus 架构 16客户端库 16导出器 18服务发现 18数据抓取 19存储 20仪表盘 20记录规则和告警 21告警管理 21数据持久化22Prometheus 不是什么 22第2 章 开始使用Prometheus 24运行Prometheus 24使用表达式浏览器 27运行Node Exporter 33告警 35第Ⅱ部分 应用监控第3 章 测控 47一个简单的程序 47Counter 数据类型 49统计异常 52统计大小 53Gauge 数据类型 54使用Gauge 类型 54回调 56summary 数据类型 57histogram 数据类型 59桶 60测控单元测试 63使用测控 64需要测控什么内容 64需要测控多少 66要怎么给指标命名 67第4 章 展示 71Python 72WSGI72Twisted 73Gunicorn 多进程 74Go 77Java 78HTTPServer 78Servlet 80Pushgateway 81桥接 85解析器 86展示格式 86指标类型 87标签 88Escaping 88时间戳 89检查指标 89第5 章 标签 91什么是标签 91测控和目标标签 92测控 93指标 94多标签 95子项 95聚合 97标签模式 99枚举 99信息 101什么时候使用标签 103基数 104第6 章 Grafana 仪表盘 107安装 108数据源 110仪表盘和面板 110避免图形墙 112图形面板 113时间控件 115单一统计面板 116表格面板 118模板变量 119第Ⅲ部分 基础设置监控第7 章 Node 导出器 127CPU 收集器 129文件系统收集器 129磁盘状态收集器 130Netdev 收集器 132Meminfo 收集器 132hwmom 收集器 133stat 收集器 134uname 收集器 134loadavg 收集器 135文本文件收集器 135使用文本文件收集器 136时间戳 138第8 章 服务发现 139服务发现机制 140静态配置 141文件 142Consul 145EC2 146重置标签 147选择要抓取的内容 148目标标签 151如何拉取 159metric_relabel_configs 161标签冲突和honor_labels 164第9 章 容器和Kubernates 166cAdvisor 166CPU 168内存 168标签 169Kubernetes 170在 Kubernetes 中运行 170服务发现 172kube-stat-metrics 182第10 章 常见导出器 183Cousul 184HAProxy 185Grok 导出器 188黑盒 191ICMP 193TCP 196HTTP 198DNS 201Prometheus 配置 203第11 章 与其他监控系统协同 207其他监控系统 207InfluxDB 209StatsD 210第12 章 编写导出器 214Consul 遥测 214自定义收集器 218标签 222指南 223第Ⅵ部分 PromQL第13 章 PromQL 概述 229聚合基础知识 229Gauge 229counter 231summary 232histogram 234选择器 236匹配器 236瞬时向量 238范围向量 239偏移 241HTTP 接口 242query 242query_range 245第14 章 聚合运算符 248分组 248without 249by 250操作符 252sum 252count 253avg 254stddev 和stdvar 255min 和max 256topk 和bottomk 256quantile 257count_values 259第15 章 二元运算符 261处理标量 261算术运算符262比较运算符263向量匹配 266一对一 266多对一和group_left 269多对多和逻辑运算符 272运算优先级 277第16 章 函数 279改变类型 279vector280scalar 280数学函数 281abs 282ln,log2 和log10 282exp 283sqrt 283ceil 和floor 283round 284clamp_max 和 clamp_min 284时间和日期 285time 285minute, hour, day_of_week, day_of_month, days_in_month, month 和year 286timestamp 287标签 288label_replace 288label_join 289缺失系列和absent 290使用sort 和sort_desc 进行排序 290Histogram 类型与histogram_quantile291计数器 292rate 292increase294irate 294resets 295改变gauge 值 296changes 296deriv 297predict_linear 297delta 298idelta 298holt_winters 298随时间聚合 299第17 章 记录规则 301使用记录规则 301何时使用记录规则 304降低基数大小 304编写范围向量函数 306API 规则 307如何不使用规则 307记录规则的命名 309第Ⅴ部分 告警第18 章 告警 315告警规则 316for 318告警标签 321注释和模板323什么是好的告警? 326设置Alertmanager 327外部标签 328第19 章 Alertmanager 330通知管道 330配置文件 331路由树 332接收器 340抑制 350Alertmanager Web 界面 351第Ⅵ部分 部署第20 章 整合 357计划推出 357Prometheus 规模增长 358使用联合机制监控全局 360长期存储 363运行Prometheus 365硬件 365配置管理 367网络和身份验证 369为失败做准备 370Alertmanager 集群 373元监控和交叉监控 374管理性能 375检测问题 376寻找昂贵的指标和目标 376减少负载 378水平分片 379管理变革 380获得帮助 381 |