1.背景

Superset 是 Airbnb 开源的数据分析与可视化平台,同时也是由 Python 语言构建的轻量级 BI 系统。Superset 可实现对 TB 量级数据进行处理,兼容常见的数十种关系或非关系型数据库,并在内部实现 SQL 编辑查询等操作。除此之外,基于 Web 服务的 Superset 可实现多用户协使用,并可针对不同角色进行权限管理。Superset 如今已归属于 Apache 孵化项目,并被 Yahoo,豆瓣等国内外知名公司使用。


示例图截图如下:

2.环境

  • python2.7
  • superset 0.27
  • centos7 64

3.适合人群

本课程难度为一般,属于初级级别课程,适合具有 Python 基础,并对数据分析与可视化感兴趣的用户。

4.创建虚拟机

使用vagrant+visual box创建centos7 64位虚拟机一台(省略)

5.安装superset

5.1安装依赖的软件包

yum -y install gcc gcc-c++ libffi-devel python-devel python-wheel openssl-devel libsasl2-devel openldap-devel epel-release

yum -y install python-pip

5.2安装并更新setuptools和pip

pip install --upgrade setuptools pip

5.3安装click和markdown

pip install click==6.7 "markdown<3.0.0"

5.4查看本地安装版本和最新版本

pip freeze | grep superset

pip install superset==-1

当前最新版本为0.27.0

5.5安装superset

pip install superset

文件比较大,需要的依赖包比较多,请耐心等待,如遇报错,大部分是超时造成的,多试几次此命令,直至安装成功。

5.6安装Mysql驱动

yum -y install mysql-devel

pip install mysqlclient

5.7修改数据库连接

vi /usr/lib/python2.7/site-packages/superset/config.py

5.7创建超级用户

fabmanager create-admin --app superset

5.8升级superset数据库配置

superset db upgrade

5.9加载测试样例到数据库(可选)

superset load_examples

5.10初始化角色和权限

superset init

6.启动superset

nohup superset runserver -p 8000 &

7.登录WEB界面

访问http://192.168.56.11:8000

点击登录之后,即可进入到主界面

8.superset使用

8.1查看示例

点击“看板”—>” Misc Charts

点击“Charts”—>“Trends”

效果还是不错的。

8.2添加新的数据源

在MYSQL中创建一个新的数据库mydb

在superset主界面,点击“数据源”—>”数据库”

在弹出界面输入相关信息

点击“保存”按钮,我们就成功添加了一个新的数据库源。

8.3添加测试表

在Mysql中添加一张表

插入测试数据

INSERT INTO items(pinming,city,price,number)

VALUES

('耐克运动鞋','南京',500,960),

('耐克运动鞋','沈阳',500,830),

('安踏运动鞋','北京',100,900),

('安踏运动鞋','重庆',100,3200),

('安踏运动鞋','贵州',100,1030),

('安踏运动鞋','武汉',100,680);

8.4 SQL编辑器

在superset界面,点击“SQL工具箱”—>”SQL编辑器”

好了,其他的功能自行研究吧。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐