Hibench大数据基准测试使用教程

奋斗, 拼

5301人浏览 · 2018-02-08 09:54:09

奋斗, 拼 · 2018-02-08 09:54:09 发布

  本文主要介绍：Hibench的使用以及Hibench测试相关配置 
 
一、安装Hibench 

  1、下载Hibench 

  wget 
 https://github.com/intel-hadoop/HiBench/archive/HiBench-7.0.zip 
  

 
 2、编译所有模块（注意：编译前，确保系统中已经安装好了maven） 

 
 命令：mvn -Dspark=2.1 -Dscala=2.11 clean package 

 
 3、编译指定模块 

 
 可根据需求只编译你需要测试的模块 

 
 如：只编译hadoop benchmarks 

 
 mvn -Phadoopbench -Dspark=2.1 -Dscala=2.11 clean package 

 
 如：只编译hadoop 和 Spark benchmarks 

 
 mvn -Phadoopbench -Psparkbench -Dspark=2.1 -Dscala=2.11 clean package 

 
 注意：目前支持的框架，如下： 

 
 hadoopbench、sparkbench、flinkbench、stormbench、gearpumbench。 

 
 以上Hibench安装完成 

 
 更加详细安装说明参考官方文档： 
 https://github.com/intel-hadoop/HiBench/blob/master/docs/build-hibench.md 

  二、Hibench的配置使用 

  1、前提条件 

  1)、需要python2.x(>=2.6) 

  2)、需要linux bc命令，用于生成Hibench 报告， 

  bc解释详见： 

 
 http://man.linuxde.net/bc 

 
 http://www.runoob.com/linux/linux-comm-bc.html 

 
 若没有，则安装：yum install bc 

 
 3)、支持的hadoop版本apache hadoop2.x(经实测hadoop3.x也支持)、CDH5.x、HDP 

 
 4)、已经编译好了Hibench 

 
 5)、启动好hdfs、yarn集群 

 
 2、配置hadoop.conf 

 
 创建并编辑{Hibench_HOME}/conf/hadoop.conf 

 
 命令： 
 cp 
  {Hibench_HOME}/ 
 conf/hadoop.conf.template 
  {Hibench_HOME}/ 
 conf/hadoop.conf 

 
 配置项说明 

 
 hibench.hadoop.home：hadoop安装目录 

 
 hibench.hadoop.executable：你的bin/hadoop所在目录，一般是{HADOOP_HOME}/bin/hadoop 

 
 hibench.hadoop.configure.dir：hadoop配置文件所在目录，一般位于HADOOP_HOME}/etc/hadoop 

 
 hibench.hdfs.master：hdfs上存储Hibench数据的目录，如：hdfs://localhost:8020/user/hibench 

 
 hibench.hadoop.release：hadoop发行版提供者，支持value：apache, cdh5, hdp 

 
 以下是样例，vim hadoop.conf 

 
 # Hadoop home 

 
 hibench.hadoop.home /opt/hadoop-3.0.0 

 
 # The path of hadoop executable 

 
 hibench.hadoop.executable /opt/hadoop-3.0.0/bin/hadoop 

 
 # Hadoop configraution directory 

 
 hibench.hadoop.configure.dir /opt/hadoop-3.0.0/etc/hadoop 

 
 # The root HDFS path to store HiBench data 

 
 hibench.hdfs.master hdfs://hadoopmaster:9820 

 
 # Hadoop release provider. Supported value: apache, cdh5, hdp 

 
 hibench.hadoop.release apache 

 
 3、运行一个workload 

 
 以下是一个使用例子 

 
 bin/workloads/micro/wordcount/prepare/prepare.sh ---产生测试数据（数据位于配置的hibench.hdfs.master指定的目录里面） 

 
 bin/workloads/micro/wordcount/hadoop/run.sh ---运行例子 

 
 说明：bin/run_all.sh能够用来运行所有位于conf/benchmarks.lst 和 conf/frameworks.lst中的workloads。 

 
 4、查看运行结果报告 

 
 执行详情见：{ 
 Hibench_HOME 
 }/report/hibench.report 

 
 5、补充：配置生成数据的大小 

 
 要改变输入数据的大小，在conf/hibench.conf配置文件中hibench.scale.profile属性的值即可，该值可选为tiny, small, large, huge, gigantic and bigdata。 

 
 具体数字修改查看详见conf/workloads/micro/wordcount.conf 

  6、修改conf/hibench.conf可以控制mapreduce运行时的并行度 

  hibench.default.map.parallelism mapper的数量 

  hibench.default.shuffle.parallelism reducer的数量 

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m