Python对列表数据进行区间统计

guihunkun

12229人浏览 · 2021-02-24 20:58:21

guihunkun · 2021-02-24 20:58:21 发布

文章目录

- 前言
- 程序
- 结果

前言

有时我们有一堆数据，我们需要统计在各个区间段的数据有多少，占总数据量的比例，可借助如下程序。程序可去我的GitHub网站下载

程序

import numpy as np


def interval_statistics(data, intervals):
    if len(data) == 0:
        return
    for num in data:
        for interval in intervals:
            lr = tuple(interval.split('~'))
            left, right = float(lr[0]), float(lr[1])
            if left <= num <= right:
                intervals[interval] += 1
    for key, value in intervals.items():
        print("%10s" % key, end='')  # 借助 end=''可以不换行
        print("%10s" % value, end='')  # "%10s" 右对齐
        print('%16s' % '{:.3%}'.format(value * 1.0 / len(data)))


if __name__ == '__main__' :
    start = -10  # 区间左端点
    number_of_interval = 10  # 区间个数
    length = 2  # 区间长度
    intervals = {'{:.3f}~{:.3f}'.format(length*x+start, length*(x+1)+start): 0 for x in range(number_of_interval)}  # 生成区间
    # print(intervals)
    data = np.random.randint(start, start+length*number_of_interval+1, size=1000)  # 待统计数据(1000随机数)
    # print(data)
    interval_statistics(data, intervals)

结果

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

1.8B 体积、33 种语言互译｜腾讯混元 HY-MT1.5-1.8B 多语言机器翻译模型上线

在跨语言交流日益频繁的今天，阅读外语菜单、处理多语言邮件、与不同语言背景的人沟通，已经成为很多人日常工作与生活的一部分。过去，这类需求往往依赖联网翻译工具，而如今，—— 一部设备即可支持的相互翻译。当 AI 不再只是“逐字直译”，而是开始理解语境、风格与语言之间的细微差异，机器翻译就真正具备了今天为大家介绍一款高质量、多语言、支持端侧部署的机器翻译模型 ——，现已上线 AtomGit AI 社区，