Prometheus+Grafana+NodeExporter 打造一款出色的监控系统，帅呆了！

prometheus

Prometheus是一个开源的监控和警报工具，用于监控Kubernetes应用程序和云基础设施的性能和可用性。 - 功能：监控；警报；性能管理；可用性管理；Kubernetes应用程序管理。 - 特点：高可用性；高性能；灵活的数据采集；与Kubernetes集成。

项目地址：https://gitcode.com/gh_mirrors/pr/prometheus

免费下载资源

漫走云雾

24415人浏览 · 2024-02-01 20:28:38

漫走云雾 · 2024-02-01 20:28:38 发布

来源：juejin.cn/post/7288961029937070080

👉 欢迎加入小哈的星球，你将获得: 专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡 / 赠书福利

全栈前后端分离博客项目 1.0 版本完结啦，2.0 正在更新中 ... , 演示链接 ： http://116.62.199.48/ ，全程手摸手，后端 + 前端全栈开发，从 0 到 1 讲解每个功能点开发步骤，1v1 答疑，直到项目上线。 目前已更新了189小节，累计30w+字，讲解图：1308张，还在持续爆肝中.. 后续还会上新更多项目，目标是将Java领域典型的项目都整一波，如秒杀系统, 在线商城, IM即时通讯，Spring Cloud Alibaba 等等，戳我加入学习，已有810+小伙伴加入(早鸟价超低)

1概述

本文使用Prometheus+Grafana+Node Exporter搭建Linux主机监控系统：

Prometheus 是一个监控系统，可以收集和存储来自各个目标的指标数据。它支持多种数据源，包括 Node Exporter。

图片

Grafana 是一个可视化工具，可以用于可视化 Prometheus 收集到的指标数据。它提供了多种仪表盘和图表类型，可以帮助您快速了解监控数据。

图片

Node Exporter是一个进程，可以收集 Linux 主机的各种指标数据，并将其暴露为 Prometheus 可以抓取的 HTTP 端点。

2安装

环境准备

以下是本文所需的环境：

一台运行 Linux 的服务器（建议使用 CentOS 或 Ubuntu）
Docker
Prometheus 和 Grafana
Node Exporter

1、安装prometheus

这里我们可以在github上获取最新的版本：

https://github.com/prometheus/prometheus

vim prometheus.yml
# my global config
global:
  scrape_interval:     15s # 采集被监控段指标的一个周期
  evaluation_interval: 15s # 告警评估的一个周期

# 告警的配置文件
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

# 告警规则配置
rule_files:
  # - "first_rules.yml"
# 被监控端的配置,目前只有一个节点，就是prometheus本身
scrape_configs:
  - job_name: 'prometheus'
    static_configs:
    - targets: ['localhost:9090']
docker run -d  -p 9090:9090 \
--name prometheus  \
--restart on-failure  \
-v /data/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml \
prom/prometheus

完全启动后可以，访问Prometheus自带的UI：xx.xx.xx.xx:9090/，打开以下页面说明安装…

图片

2、安装grafana

docker  run -d --name=grafana  -p 3000:3000  grafana/grafana

执行后，下载镜像并启动。完成启动完成，打开xx.xx.xx.xx:3000，默认用户名/密码：admin/admin

图片

3、安装node_exporter

cd /usr/local/src/
wget https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz
tar -xvf node_exporter-1.6.1.linux-amd64.tar.gz
mv /usr/local/src/node_exporter-1.6.1.linux-amd64/node_exporter /usr/local/bin
vim /usr/lib/systemd/system/node_exporter.service

node_exporter.service 文件内容：

[Unit]
Description=node_exporter
Documentation=https://prometheus.io/
After=network.target
[Service]
ExecStart=/usr/local/bin/node_exporter
Restart=on-failure
[Install]
WantedBy=multi-user.target
systemctl daemon-reload
systemctl enable node_exporter
systemctl restart node_exporter

启动后打开这个地址：xx.xx.xx.xx:9100/

图片

以上页面能打开说明安装成功。

如果安装失败可以使用：

systemctl status node_exporter

看看有什么异常。

4、配置prometheus

# 启动后，配置prometheus.yml
vim /data/prometheus/prometheus.yml
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'
    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.
    static_configs:
    - targets: ['xx.xx.xx.xx:9090']
  # 新增，采集node_exporter监控数据
  - job_name: "Linux-Metrics"
    static_configs:
    - targets: ['xx.xx.xx.xx:9100']
# 重新启动prometheus
systemctl restart prometheus

3使用

xx.xx.xx.xx:3000，默认用户名/密码：admin/admin

图片

选择 "Add your first data source"

图片

进入后选择Prometheus

图片

填写相关信息

图片

添加Prometheus模板

图片

输入id号，9276

图片

然后下拉，选择Prometheus，然后Import

图片

成功展示来由Prometheus数据

图片

至此整个Linux主机监控就完成了。

4补充

1、Dashboard模板

如果不知道使用什么模板可以找个教程使用教程里的就好，如果想进一步了解下模板可以去官网这里搜索相应的模板。

传送门：https://grafana.com/grafana/dashboards

里面可以输入关键词搜索，还有相应的下载量排名或评分排名。

图片

选择一个，点击进入详情页面，可以复制ID

图片

2、数据对照

图片

可以看到有些数据与top是一致的，有的不一致。主要是计算的方式不一致，可以选择一个统计图，点击标题

图片

Edit进入详情。

图片

比如已用内存它是根据这个计算公式算出来的。这样再对照着top的数据就是一致的了。

3、自定义模板

上面说到可以Edit进入dashboard详情，可以看到这么多的表达式。如果我们想调整这里的数据或过滤条件就可以编辑这些参数了。

当然从Edit进入的是单个统计模块，也可以从这里进入整个dashboard模板。修改这里的json

图片

再来说一下这个表达式，这个表达式也就是PromQL 语言。

Grafana Dashboard 中的表达式是 PromQL 语言，它是 Prometheus 的指标查询语言。PromQL 是一种基于 Prometheus 数据模型的查询语言，可以用于查询和过滤 Prometheus 的指标数据。

PromQL 表达式可以用于以下目的：

指标数据
指标数据
指标数据
标数据进行聚合

PromQL 表达式使用以下语法：

[指标名] [操作符] [值]

例如，以下表达式将查询 CPU 使用率的指标数据：

cpu_usage

以下表达式将查询 CPU 使用率的指标数据，并将其限制为 100%：

cpu_usage < 100

以下表达式将计算 CPU 使用率的指标数据的平均值：

avg(cpu_usage)

以下表达式将将 CPU 使用率的指标数据按主机聚合：

by(host) cpu_usage

PromQL 语言具有丰富的功能，可以满足各种监控需求。

以下是一些常用的 PromQL 表达式：

查询指标数据

cpu_usage

过滤指标数据

cpu_usage < 100

计算指标数据

avg(cpu_usage)

对指标数据进行聚合

by(host) cpu_usage

如何简单调试PromQL，可以打开prometheus自带的web ui进入调试

GitHub 加速计划 / pr / prometheus

下载

最近提交(Master分支：4 个月前 )

b3a9fa3d update golangci-lint and enable more lntiers This updates golangci-lint to v1.63.4 and enables linters `nilnesserr` and `exptostd` Signed-off-by: dongjiang <dongjiang1989@126.com> --------- Signed-off-by: dongjiang <dongjiang1989@126.com> 13 小时前

7be00791 parser: fix misleading error message in grouping processing 16 小时前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的