ELK日志分析系统概述及部署

ELK平台是一套完整的日志集中处理解决方案，将 ElasticSearch、Logstash 和 Kiabana 三个开源工具配合使用，完成更强大的用户对日志的查询、排序、统计需求。ElasticSearch：是基于Lucene（一个全文检索引擎的架构）开发的分布式存储检索引擎，用来存储各类日志。Elasticsearch 是用 Java 开发的，可通过 RESTful Web 接口，让用户可以

文章共5,716字 · 阅读需要大约20分钟

一键AI生成摘要，助你高效阅读

问答

wys_jj

2210人浏览 · 2024-04-10 19:39:35

wys_jj · 2024-04-10 19:39:35 发布

一、ELK概述

1.1.ELK 简介

1.2.ELK各组件介绍

1.3.可以添加的其它组件 Filebeat

3.2.ElasticSearch集群部署

3.2.1.环境准备

3.2.2.安装 Elasticsearch-head 插件

3.2.3.启动 elasticsearch-head 服务

3.3.ELK-Logstash 部署

3.5. 测试 Logstash

3.6. 定义 logstash 配置文件

四、总结

一、ELK概述

1.1.ELK 简介

ELK平台是一套完整的日志集中处理解决方案，将 ElasticSearch、Logstash 和 Kiabana 三个开源工具配合使用，完成更强大的用户对日志的查询、排序、统计需求。

ElasticSearch：是基于Lucene（一个全文检索引擎的架构）开发的分布式存储检索引擎，用来存储各类日志。
Elasticsearch 是用 Java 开发的，可通过 RESTful Web 接口，让用户可以通过浏览器与 Elasticsearch 通信。

Elasticsearch是一个实时的、分布式的可扩展的搜索引擎，允许进行全文、结构化搜索，它通常用于索引和搜索大容量的日志数据，也可用于搜索许多不同类型的文档。

1.2.ELK各组件介绍

ElasticSearch
是基于Lucene（一个全文检索引擎的架构）开发的分布式存储检索引擎，用来存储各类日志。
Elasticsearch 是用Java开发的，可通过RESTful Web接口，让用户可以通过浏览器与Elasticsearch通信。
Elasticsearch是一个实时的、分布式的可扩展的搜索引擎，允许进行全文、结构化搜索，它通常用于索引和搜索大容量的日志数据，也可用于搜索许多不同类型的文档。

Kiabana
Kibana 通常与ElasticSearch一起部署，Kibana是Elasticsearch的一个功能强大的数据可视化 Dashboard，Kibana提供图形化的web界面来浏览Elasticsearch日志数据，可以用来汇总、分析和搜索重要数据。

Logstash
作为数据收集引擎。它支持动态的从各种数据源搜集数据，并对数据进行过滤、分析、丰富、统一格式等操作，然后存储到用户指定的位置。一般会发送给ElasticSearch。

Logstash由Ruby 语言编写，运行在Java虚拟机（JVM）上，是一款强大的数据处理工具，可以实现数据传输、格式处理、格式化输出。Logstash具有强大的插件功能，常用于日志处理。

input：设置数据来源。
filter：可以对数据进行加工处理过滤，可以做复杂的处理逻辑。这个步骤不是必须的。
output：设置输出目标,如elasticSearch等。

1.3.可以添加的其它组件 Filebeat

Filebeat
轻量级的开源日志文件数据搜集器。通常在需要采集数据的客户端安装Filebeat，并指定目录与日志格式，Filebeat就能快速收集数据，并发送给logstash 进行解析，或是直接发给Elasticsearch存储，性能上相比运行于JvM上的logstash优势明显，是对它的替代。常应用于EFLK架构当中。

filebeat 结合logstash 带来好处

通过Logstash 具有基于磁盘的自适应缓冲系统，该系统将吸收传入的吞吐量，从而减轻Elasticsearch 持续写入数据的压力
从其他数据源（例如数据库，s3对象存储或消息传递队列）中提取
将数据发送到多个目的地，例如s3，HDFS（Hadoop分布式文件系统）或写入文件使用条件数据流逻辑组成更复杂的处理管道
缓存/消息队列（redis、kafka、RabbitMQ等）：可以对高并发日志数据进行流量削峰和缓冲，这样的缓冲可以一定程度的保护数据不丢失，还可以对整个架构进行应用解耦。

日志的集中化管理 beats 包括四种工具

Packetbeat（搜索网络流量数据）
Topbeat（搜索系统、进程和文件系统级别的 CPU 和内存使用情况等数据）
Filebeat（搜集文件数据）
Winlogbeat（搜集 Windows 时间日志数据）

1.4.为什么要使用ELK

日志主要包括系统日志、应用程序日志和安全日志。系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷，性能安全性，从而及时采取措施纠正错误。

往往单台机器的日志我们使用grep、awk等工具就能基本实现简单分析，但是当日志被分散的储存不同的设备上。如果你管理数十上百台服务器，你还在使用依次登录每台机器的传统方法查阅日志。这样是不是感觉很繁琐和效率低下。当务之急我们使用集中化的日志管理，例如：开源的syslog，将所有服务器上的日志收集汇总。集中化管理日志后，日志的统计和检索又成为一件比较麻烦的事情，一般我们使用grep、awk和wc等Linux命令能实现检索和统计，但是对于要求更高的查询、排序和统计等要求和庞大的机器数量依然使用这样的方法难免有点力不从一般大型系统是一个分布式部署的架构，不同的服务模块部署在不同的服务器上，问题出现时，大部分情况需要根据问题暴露的关键信息，定位到具体的服务器和服务模块，构建一套集中式日志系统，可以提高定位问题的效率。

1.5.完整日志系统基本特征

收集：能够采集多种来源的日志数据
传输：能够稳定的把日志数据解析过滤并传输到存储系统
存储：存储日志数据
分析：支持UI分析
警告：能够提供错误报告，监控机制

二、ELK的工作原理

在所有需要收集日志的服务器上部署Logstash；或者先将日志进行集中化管理在日志服务器上，在日志服务器上部署Logstash。

Logstash 收集日志，将日志格式化并输出到Elasticsearch 群集中。

Elasticsearch 对格式化后的数据进行索引和存储。

Kibana从ES群集中查询数据生成图表，并进行前端数据的展示。

总结：logstash作为日志搜集器，从数据源采集数据，并交给消息队列进行缓冲后对数据进行过滤，格式化处理，然后交由Elasticsearch存储，kibana对日志进行可视化处

三、ELK日志分析系统集群部署

服务器类型	系统和IP地址	需要安装的组件	硬件方面
node01节点	CentOS7.4(64 位) 192.168.190.101	Elasticsearch 、 Kibana	2核4G
node02节点	CentOS7.4(64 位) 192.168.190.103	Elasticsearch	2核4G
Apache节点	CentOS7.4(64 位) 192.168.190.104	Logstash Apache	2核4G

3.1.关闭防火墙

systemctl stop firewalld 
setenforce 0

3.2.ElasticSearch集群部署

需要部署两个节点，这里以node2为例说明

3.2.1.环境准备

更改主机名
Node1节点：hostnamectl set-hostname node1
Node2节点：hostnamectl set-hostname node2

echo "192.168.190.101 node1">> /etc/hosts
echo "192.168.190.103 node2">> /etc/hosts

 安装 elasticsearch-rpm 包
[root@node2 ~]# cd /opt
[root@node2 opt]# rz -E
#上传elasticsearch-5.5.0.rpm到/opt目录下
rz waiting to receive.
[root@node2 opt]# rpm -ivh elasticsearch-5.5.0.rpm

加载系统服务 
systemctl daemon-reload    
systemctl enable elasticsearch.service

修改 elasticsearch 主配置文件 

[root@node2 opt]# cp /etc/elasticsearch/elasticsearch.yml /etc/elasticsearch/elasticsearch.yml.bak
#备份配置文件
[root@node2 opt]# vim /etc/elasticsearch/elasticsearch.yml
 
##17行，取消注释，指定群集名称
cluster.name: elk-cluster
##23行，取消注释，指定节点名称（node1节点为node1，node2节点为node2）
node.name: node2
##33行，取消注释，指定数据存放路径
path.data: /data/elk_data
##37行，取消注释，指定日志存放路径
path.logs: /var/log/elasticsearch/
##43行，取消注释，不在启动的时候锁定内存（前端缓存，与IOPS-性能测试方式，每秒读写次数相关）
bootstrap.memory_lock: false
##55行，取消注释，设置监听地址，0.0.0.0代表所有地址
network.host: 0.0.0.0
##59行，取消注释，ES服务的默认监听端口为9200
http.port: 9200
##68行，取消注释，集群发现通过单播实现，指定要发现的节点node1、node2
discovery.zen.ping.unicast.hosts: ["node1", "node2"]
 
[root@node2 opt]# grep -v "^#" /etc/elasticsearch/elasticsearch.yml
cluster.name: elk-cluster
node.name: node2
path.data: /data/elk_data
path.logs: /var/log/elasticsearch/
bootstrap.memory_lock: false
network.host: 0.0.0.0
http.port: 9200
discovery.zen.ping.unicast.hosts: ["node1", "node2"]

创建数据存放路径并授权 
 
[root@node2 opt]# mkdir -p /data/elk_data
[root@node2 opt]# chown elasticsearch:elasticsearch /data/elk_data/

启动 elasticsearch
systemctl start elasticsearch.service
netstat -antp | grep 9200

查看节点信息 
浏览器访问  http://192.168.190.101:9200  、 http://192.168.190.103:9200 
查看节点 Node1、Node2 的信息。

浏览器访问 http://192.168.190.101:9200/_cluster/health?pretty  
http://192.168.190.103:9200/_cluster/health?pretty
查看群集的健康情况，可以看到 status 值为 green（绿色）， 表示节点健康运行。

3.2.2.安装 Elasticsearch-head 插件

ES 在 5.0 版本后，插件需要作为独立服务进行安装，需要使用 npm 工具（NodeJS 的包管理工具）安装。安装 Elasticsarch-head 需要提前安装好依赖软件 node 和 phantomjs。

node是一个基于 Chrome V8 引擎的 JavaScript 运行环境。
phantomjs是一个基于 webkit 的 JavaScriptAPI，可以理解为一个隐形的浏览器，任何基于 webkit 浏览器做的事情，它都可以做到。

编译安装 node
yum install gcc gcc-c++ make -y
#上传软件包 node-v8.2.1.tar.gz 到/opt
tar zxvf node-v8.2.1.tar.gz

cd node-v8.2.1/
./configure
make && make install

安装 phantomjs（前端的框架）
上传软件包 phantomjs-2.1.1-linux-x86_64.tar.bz2 到
cd /opt
tar jxvf phantomjs-2.1.1-linux-x86_64.tar.bz2 -C /usr/local/src/
cd /usr/local/src/phantomjs-2.1.1-linux-x86_64/bin
cp phantomjs /usr/local/bin

安装 Elasticsearch-head 数据可视化工具
上传软件包 elasticsearch-head.tar.gz 到/opt
tar zxvf elasticsearch-head.tar.gz -C /usr/local/src/
cd /usr/local/src/elasticsearch-head/
npm install

修改 Elasticsearch 主配置文件
vim /etc/elasticsearch/elasticsearch.yml
......
--末尾添加以下内容--
http.cors.enabled: true				#开启跨域访问支持，默认为 false
http.cors.allow-origin: "*"			#指定跨域访问允许的域名地址为所有

systemctl restart elasticsearch

3.2.3.启动 elasticsearch-head 服务

必须在解压后的 elasticsearch-head 目录下启动服务，进程会读取该目录下的 gruntfile.js 文件，否则可能启动失败。
cd /usr/local/src/elasticsearch-head/
npm run start &

插入索引
#通过命令插入一个测试索引，索引为 index-demo，类型为 test。

//输出结果如下：curl -X PUT 'localhost:9200/index-demo1/test/1?pretty&pretty' -H 'content-Type: application/json' -d '{"user":"zhangsan","mesg":"hello world"}'

通过 Elasticsearch-head 查看 Elasticsearch 信息
通过浏览器访问 http://192.168.190.101:9100/ 地址并连接群集。
如果看到群集健康值为 green 绿色，代表群集很健康。

elasticsearch-head 监听的端口是 9100
netstat -natp |grep 9100

3.3.ELK-Logstash 部署

在 Apache 节点上操作

  更改主机名
[root@localhost ~]# hostnamectl set-hostname apache
[root@localhost ~]# bash
[root@apache ~]#

安装Apahce服务（httpd）
yum -y install httpd
systemctl start httpd

安装Java环境
yum -y install java
java -version

安装logstash
上传软件包 logstash-5.5.1.rpm 到/opt目录下
cd /opt
rpm -ivh logstash-5.5.1.rpm                           
systemctl start logstash.service                      
systemctl enable logstash.service

ln -s /usr/share/logstash/bin/logstash /usr/local/bin/

3.5. 测试 Logstash

Logstash 命令常用选项：
-f：通过这个选项可以指定 Logstash 的配置文件，根据配置文件配置 Logstash 的输入和输出流。
-e：从命令行中获取，输入、输出后面跟着字符串，该字符串可以被当作 Logstash 的配置（如果是空，则默认使用 stdin 作为输入，stdout 作为输出）。
-t：测试配置文件是否正确，然后退出。

定义输入和输出流：
#输入采用标准输入，输出采用标准输出（类似管道）
logstash -e 'input { stdin{} } output { stdout{} }'

执行 ctrl+c 退出

使用 rubydebug 输出详细格式显示，codec 为一种编解码器
logstash -e 'input { stdin{} } output { stdout{ codec=>rubydebug } }'

使用 Logstash 将信息写入 Elasticsearch 中
logstash -e 'input { stdin{} } output { elasticsearch { hosts=>["192.168.10.13:9200"] } }'

3.6. 定义 logstash 配置文件

在每个部分中，也可以指定多个访问方式。例如：若要指定两个日志来源文件，则格式如下：

 input {
	file { path =>"/var/log/messages" type =>"syslog"}
	file { path =>"/var/log/httpd/access.log" type =>"apache"}
}

修改 logstash 配置文件，让其收集系统日志 /var/log/messages，并将其输出到 ES 中

 
[root@apache opt]# chmod o+r /var/log/messages
#赋予读的权限，让 Logstash 可以获取到该文件的内容
[root@apache opt]# vim /etc/logstash/conf.d/system.conf
##该文件需自行创建，文件名可自定义
 
input {
    file{
        path =>"/var/log/messages"
##指定要收集的日志的位置
        type =>"system"
##自定义日志类型标识
        start_position =>"beginning"
##表示从开始处收集
    }
}
output {
    elasticsearch{
##输出到ES
        hosts =>["192.168.190.101:9200"]
##指定ES服务器的地址和端口，为避免单机故障，建议写全
        index =>"system-%{+YYYY.MM.dd}"
##指定输出到ES的索引格式
    }
}
 
[root@apache opt]# systemctl restart logstash.service

浏览器访问 http://192.168.223.9:9100 查看索引信息

四、总结

完整日志系统基本特征：

收集：能够采集多种来源的日志数据
传输：能够稳定的把日志数据解析过滤并传输到存储系统
存储：存储日志数据
分析：支持 UI 分析
警告：能够提供错误报告，监控机制

ELK 的工作原理：
（1）在所有需要收集日志的服务器上部署Logstash；或者先将日志进行集中化管理在日志服务器上，在日志服务器上部署 Logstash。
（2）Logstash 收集日志，将日志格式化并输出到 Elasticsearch 群集中。
（3）Elasticsearch 对格式化后的数据进行索引和存储。
（4）Kibana 从 ES 群集中查询数据生成图表，并进行前端数据的展示。

总结：logstash作为日志搜集器，从数据源采集数据，并对数据进行过滤，格式化处理，然后交由Elasticsearch存储，kibana对日志进行可视化处理。