文章目录

前言

有时我们有一堆数据,我们需要统计在各个区间段的数据有多少,占总数据量的比例,可借助如下程序。程序可去我的GitHub网站下载

程序

import numpy as np


def interval_statistics(data, intervals):
    if len(data) == 0:
        return
    for num in data:
        for interval in intervals:
            lr = tuple(interval.split('~'))
            left, right = float(lr[0]), float(lr[1])
            if left <= num <= right:
                intervals[interval] += 1
    for key, value in intervals.items():
        print("%10s" % key, end='')  # 借助 end=''可以不换行
        print("%10s" % value, end='')  # "%10s" 右对齐
        print('%16s' % '{:.3%}'.format(value * 1.0 / len(data)))


if __name__ == '__main__' :
    start = -10  # 区间左端点
    number_of_interval = 10  # 区间个数
    length = 2  # 区间长度
    intervals = {'{:.3f}~{:.3f}'.format(length*x+start, length*(x+1)+start): 0 for x in range(number_of_interval)}  # 生成区间
    # print(intervals)
    data = np.random.randint(start, start+length*number_of_interval+1, size=1000)  # 待统计数据(1000随机数)
    # print(data)
    interval_statistics(data, intervals)
    

结果

在这里插入图片描述

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐