基于随机森林的城市空气质量等级 预测系统的设计与实现
基于随机森林的城市空气质量等级预测系统的设计与实现
摘 要
随着城市化进程的不断推进,大气污染问题越来越严重,传统的城市空气质量预测系统存在着空气质量数据管理分散、不能提供给公众健康建议等种种问题,因此设计开发一套基于随机森林的城市空气质量等级预测系统,利用SpringBoot和Vue搭建起前后端分离的架构,后端将随机森林回归算法集成进来。管理员端可以对数据实行批量导入并进行清洗校验工作,用户端能够随时获取空气质量状况,预测信息以及有关健康的建议。测试结果表明,在系统正常运行的过程中可以对空气质量数据进行采集,面对复杂环境给出建议,并且可以对检测出来的数据做AI分析处理,为城市环境保护做出贡献。
关键词:城市;空气质量;随机森林回归;SpringBoot;Vue
Design and Implementation of Urban Air Quality Grade Prediction System Based on Random Forest
Abstract
With the rapid progress of urbanization,the problem of air pollution is getting more serious. In traditional urban air quality prediction system, there is an issue regarding disperse management of air-quality-data and also do not have health advice to public on complicated environments. For solving those problems, this paper puts forward the concept of city air quality grade prediction system which is based on randomforest. This system is made up of front end and back end separated by springboot+vue on the backend where we have used random forest regression. The adminstration side to do the large amount of date importing,cleaning and validating,uses deepseek ai for analysing it. On users’ side, it is realized real time query of air situation,predict result and health advise. From the test we know that it can gather air quality information when operating in complicated surroundings and also gives suggestions. Can also be used with ai to do some analysis, too, your contribution on ur citiy.
Key words: City; Air Quality; Random Forest Regression; SpringBoot;Vue
目 录
摘 要 I
Abstract II
1 绪论 1
1.1 选题背景 1
1.2 选题意义 1
1.3 国内外研究现状 1
1.4 主要研究内容 2
1.5 论文组织结构 2
2 相关技术介绍 4
2.1 SpringBoot框架 4
2.2 Vue框架 4
2.3 DeepSeekAI 4
2.4 随机森林回归算法 4
2.5 MySQL数据库 5
3 系统分析 6
3.1 可行性分析 6
3.2 需求分析 6
3.3 功能性需求 7
3.4 非功能性需求 8
4 系统设计 10
4.1 系统架构设计 10
4.2 系统总体功能设计 11
4.3 数据库设计 11
4.4 业务流程设计 19
5 系统实现 21
5.1 管理员端主要功能实现 21
5.2 用户端主要功能实现 28
6 系统测试 34
6.1 测试目的 /34
6.2 测试方法 34
6.3 系统功能测试 34
6.4 测试总结 37
7 总结与展望 38
7.1 总结 38
7.2 展望 38
参考文献 39
致 谢 40
1 绪论
1.1 选题背景
随着社会经济的飞速发展和工业生产水平不断提高,大气污染问题越来越严重,对城市正常运行和人们的生活质量造成了巨大的影响。因此,准确的进行空气质量监测、预报,就显得尤为重要。传统方式由于数据处理能力差、无法处理复杂的空气污染情况等原因,不能很好地满足要求。但是现有的相关预测平台存在智能化程度不高、数据分析模型单一等问题,不能满足精细化、复杂环境管理的实际需要[1]。因此,根据智能算法开发一款专业高效的城市空气质量等级预测系统,可以很好地克服目前技术的不足之处,给城市环保规划管理及公众健康防护工作提供强有力的科学支持。
1.2 选题意义
本课题所开发的空气质量预报系统,对便民服务、管理办公和社会环保等各方面起到重要的作用。对于普通用户来说,能够及时了解空气质量信息并进行预报,从而合理地安排出行时间,规避因为空气污染所造成的危险。但是环保工作人员依靠智能算法去分析监测数据、掌握空气污染变化趋势与成因,明显减少其劳动量并提升工作效率、精准度。从社会角度而言,该系统有利于推动环境保护工作的发展,给生态环境保护工作的有序进行给予有力的支持,促使城市环保管理朝着智能化、精细化方向迈进,进而营造出绿色、健康、安全的公共生活环境[2]。
1.3 国内外研究现状
1.3.1 国外研究现状
相比国内,国外在空气质量预测系统方面的研究开始得更早,已经形成了比较完整的体系,并且应用范围较广[3]。美国环保署研发的CMAQ模型已经被全面应用于全国空气质量预报工作当中,可以准确地模拟出各种污染物的扩散规律,给空气质量预判提供有力的支持。谷歌的STG2Seq模型对洛杉矶地区空气污染短时间预测的精确度比以前高许多,麻省理工学院用PhyFormer预测纽约市PM2.5浓度[4]。另外,欧洲各国利用气象耦合模型完善城市空气质量监测体系,非洲国家也有不少使用AirQo低成本智能系统的城市,用以开展空气质量检测[5]。国外研究一般会加入随机森林之类的机器学习算法,不断改善预测逻辑,使空气质量预测日趋智能、细密而且经济[6]。
1.3.2 国内研究现状
国内空气质量预测领域起步较晚,但是发展迅速,已经形成了数值模型和智能算法相结合的技术模式,在全国范围内广泛应用[7]。其中,我国自主开发的NAQPMS、EPICC-Model等国内的空气质量预测模型已经在全国许多地区的环保部门里得到了业务化应用,给区域空气质量预报工作提供可靠的技术保障[8]。气象部门开发的大模型AI-GAMFS在10多个省份实现了对沙尘暴、空气质量的精准预警,南京市搭建的智能空气质量预报系统AQI短期预报准确率达到94.4%[9]。此外深圳市开通了阿蓝AI空气质量预报平台,使用多种智能算法对重大活动期间的空气管控进行保障。国内的空气质量预测研究正在往智能化、国产化和精细化方向前进[10]。
1.4 主要研究内容
对城市空气质量进行分析,采用随机森林回归算法建立前后端分离的智能预测系统。系统使用SpringBoot和Vue框架来创建前后端分离结构,采用随机森林回归算法创建预测模型,将PM2.5、PM10、SO2、NO2、CO、O3等各方面的污染物浓度数据以及气象参数综合起来,实现对空气质量等级的准确预测。系统创建了用户、管理员两种身份,并集成了空气质量管理、质量管理等各方面功能,能较好地支持环境检测、数据分析查询、系统运行操作的需求,最后采用黑盒法对系统的全部进行测试来提高系统的稳定性及预测性的测试结果。
1.5 论文组织结构
本论文共分为七章,各章具体内容如下表所示。
第一章绪论。介绍城市空气质量等级预测系统的研究相关背景等内容并进行具体分析说明。
第二章为相关技术简介。本章主要对城市空气质量等级预测系统功能模块实现涉及的技术进行简单的介绍。
第三章为系统分析。本章主要是对城市空气质量等级预测系统的需求分析、可行性分析等内容进行阐述,并进行分析。
第四章为系统的设计。本章主要是对城市空气质量等级预测系统的系统功能模块的设计进行了说明。
第五章系统实现。对城市空气质量等级预测系统各个功能模块的实现环境进行了详细的描述,并且对各个功能模块具体的实现方法进行了说明。
第六章系统测试。该章节简单地介绍了城市空气质量等级预测系统的系统测试目的和主要功能模块的测试等内容。
第七章总结与展望。主要是对本篇论文的撰写过程进行梳理以及总结等内容。
2 相关技术介绍
2.1 SpringBoot框架
SpringBoot框架,以Java为底层原理,开发出来开源轻量级框架,友好的框架方便程序员进行开发工作。它对应的优势在于可以简化Spring应用的搭建与开发流程,凭借自动进行有关配置、内部涵盖的服务器等核心特性,不用进行比较复杂的手动配置,即可快速构建出稳定、高效的后端应用[11]。在本城市空气质量等级预测系统中,SpringBoot框架承担后端核心支撑作用,主要负责接收前端请求、封装核心业务逻辑、调用随机森林预测算法,同时完成数据库的管理工作,为系统各项核心功能的有序运行提供可靠保障,确保系统整体高效稳定[12]。
2.2 Vue框架
Vue是一个基于JavaScript开发的开源前端渐进式框架,它最大的特点就是简单易学、组件化开发以及双向数据绑定。这使得开发人员可以迅速地开发出流畅前端页面并且大大减少前端开发的工作量。而在本项目的城市空气质量等级预报中,Vue起着至关重要的作用,在此项目中主要负责页面展示、各种交互功能等,准确显示空气质量检测信息以及预报结果,让普通用户方便快捷地查看信息,管理员进行相应操作,有力保障了系统前端交互的流畅性与稳定性[13]。
2.3 DeepSeekAI
DeepSeekAI是自主研发的国产推理型大模型,最大的特点是具有很强的深度逻辑推理能力和对多种类型数据的支持能力并且开源、可应用范围广,可以很好地完成各种繁重的数据分析任务,在城市空气质量等级预测系统中,DeepSeekAI主要是进行大量数据的智能化分析工作,主要分析空气质量监测数据及气象数据等,发现其中的各种联系,从而提高系统的预测效果,有利于更准确地判断空气质量级别以及了解造成空气污染的原因,助力系统更高效地开展环境监测与预警工作[14]。
2.4 随机森林回归算法
随机森林回归算法是一种集成方法,它的基本思想是建立多个相对独立的决策树模型,然后将各种决策树得到的结果综合起来,得到最后的结果。其优点是能很好地避免过拟合问题并且具有良好的鲁棒性以及高效地处理高维数据的能力,能够较好地解决复杂的问题。在本项目中,随机森林回归算法是主要的预测工具,是整个系统的主要预测工具,通过对大量的历史空气质量信息以及天气等相关信息的学习和训练,发现其中的各种关系及变化趋势,从而对未来的空气质量级别做出准确的预测,给系统的运行提供有力的支持,切实满足普通用户与管理员的空气质量预测查询需求[15]。
2.5 MySQL数据库
MySQL数据库是一个开源的关系型数据库管理系统,它使用轻便,部署简单,相应的兼容性良好,经常用来作为系统开发所用来储存数据的工具,在数据处理和储存数据方面相对高效,MySQL数据库承担着核心的数据存储与管理职责,主要用于存储用户信息、空气质量监测数据以及系统生成的预测结果,实现各类数据的持久化保存与高效管理。同时,它为系统的数据查询、多维度数据分析以及后续数据调用提供了稳定、可靠的支撑,确保系统各类数据流转顺畅,保障整个预测系统高效、有序地稳定运行。
3 系统分析
3.1 可行性分析
可行性分析是在城市空气质量等级预测系统功能模块开发设计之前,对本课题系统开发涉及的经济、技术、操作等各方面进行全方位的分析。经过可行性分析可以提前了解到系统在开发过程中的可能遇到的问题,从而防止之后系统设计时出现不必要的工作。
3.1.1 技术可行性
在进行城市空气质量等级预测系统开发时,各个功能模块中所用到的技术有SpringBoot框架、Vue框架、随机森林回归算法以及MySQL数据库等,在这方面的技术都是一些公开的源码可以借鉴,在大学期间本人也学习并使用过这些技术,熟悉它们的操作方式,可以较好地利用它们来设计、实现系统中的各个部分,并使整个系统正常运行。
3.1.2 经济可行性
本城市空气质量等级预测系统经济可行性主要是从系统开发所耗费的资金来考虑。系统开发所必需的笔记本电脑、移动手机等基本硬件条件为我本身所拥有,不需要购买。并且系统开发所使用的Java相关技术、SpringBoot框架和Vue框架都是免费开源的,可以直接下载使用,不需要支付技术使用费用。所以整个系统建立、开发所花费的成本较低,具有良好的经济效益。
3.1.3 操作可行性
城市空气质量等级预测系统设计之初就考虑到了用户的操作体验要求。采用科学的界面和逻辑设计来保证系统的界面简洁美观,让用户在使用各个功能模块的时候可以快捷、方便地完成操作,从而得到良好的用户体验。系统操作逻辑简单直观,使用方便,采用大众化的按钮设计,不同用户群的使用者使用时无需花太多时间去学习,可以快速上手操作并完成各种数据查询、信息查看等操作。
3.2 需求分析
2025年中国大城市空气质量预报主要使用NAQPMS等国内数值模拟方法,在考虑气象因素、污染物排放量、卫星遥感监测结果的基础上使用SARIMA模型、机器学习等方法建立预报模型来判断污染物传播的趋势,进而得出预报等级。但是目前预报中仍然存在着研发投入分散、区域性复合型污染预报效果不好、多种污染物联合预报水平低的问题。用户对城市空气质量等级预报服务平台的高要求体现在准确及时预报信息、操作简便、适用于多种设备展示空气质量状况、查看过往数据并发出预警提醒等各方面,为管理者管理数据、改进模型、跟踪污染源等提供帮助,实现高效环保、保障人类健康的功能,提升城市环境管控水平和民众健康水平,助力绿色发展。
3.3 功能性需求
3.3.1 管理员用例分析
后台管理员属于城市空气质量等级预测系统当中最高级别的角色,具有管理系统的全部内容的总权限,可以针对系统内用户的个人信息、空气质量监测数据以及预测模型等诸多要素实施全面的管理和把控,从而保证系统始终保持稳定且安全的运转状态。该系统后台管理员端模块的用例图见图3-1,清楚地给出了管理员的各种操作权限和功能范围。
图3-1 管理员用例图
3.3.2 用户用例分析
系统前台用户端主要是为普通用户提供方便的入口,用户可以通过该端进行实时空气质量数据的查看、空气质量等级预测结果查询等操作,满足用户对于空气质量信息的需求。与前台用户端模块相对应的用例图,在图3-2中有具体的展示,清晰地表现出了系统内各个角色所对应的功能用例,清楚地表明了前台用户能执行的功能内容,有利于系统用户端功能的设计认识。
图3-2 用户用例图
3.4 非功能性需求
3.4.1 可靠性需求
城市空气质量等级预测系统的可靠性需求主要表现在三个方面,即数据可靠、运行可靠和权限可靠。一是数据可靠,空气质量监测数据和预测结果要准确完整,不能出现数据丢失或者误差过大等问题;二是运行可靠,系统要保持长期稳定运行,不能出现经常出现的卡顿、崩溃现象,可以满足用户随时查询的要求;三是权限可靠,严格分隔用户的权限和管理员的权限,防止数据泄露、误操作等,保证系统数据以及操作安全,为系统的正常运转提供保证。
3.4.2 稳定性需求
城市空气质量等级预测系统稳定性有如下要求,第一可靠运行,系统长时间稳定无卡顿、崩溃,24小时能响应用户和管理员的查询和操作;第二稳定的数据流,保证监测到的数据可以及时上传,不丢失,预测结果流畅,无突变;第三环境兼容性,保证在各种环境下都可良好运行,能抵抗常见硬件故障,并保证数据安全完整,从而保证系统的持续运行。
3.4.3 安全性需求
城市空气质量等级预测系统安全需求主要有三个方面,数据安全方面,保证在线传输和存储时空气质量监测数据、用户的个人信息不被非法获取或篡改,做好数据加密备份工作;权限安全方面,合理划分普通用户和管理员的权限,防止出现权限滥用情况;系统安全方面,在线路上对各种可能存在的威胁进行防护,保证网站可以正常运行的同时又不会造成数据泄露的风险,从而保证用户的信息以及网站核心业务的安全性、稳定性。
4 系统设计
4.1 系统架构设计
城市空气质量等级预测系统整体由访问层、展示层、数据层组成:访问层给用户提供了方便快捷的进入方式,可以进行各种操作,展示层采用Vue框架开发,展示空气质量信息及预测结果,界面简洁明了,数据层用MySQL数据库保存监测数据、预测结果等信息,各个功能模块间互相配合,在各个功能模块的基础上使整个系统能够很好地、平稳地运行来满足用户的需求,系统架构图如下图4-1所示。
图4-1 系统架构图
4.2 系统总体功能设计
城市空气质量等级预测系统按照用户实际使用的需求,把系统的用户分为前台普通用户和后台管理员两种角色。前台普通用户能查看到实时的空气质量数据,也能查找到未来空气质量等级预报的结果,还可以浏览过历史的监测数据等操作。后台管理员属于系统最高权限的角色,可以查询系统内所有的功能模块数据信息,并且可以对用户账号信息以及空气质量监测数据等作出调整、保养等工作。系统将分有用户管理、空气质量数据管理、预测结果管理等模块,系统总功能模块图如图4-2所示。
图4-2 系统总体功能模块图
4.3 数据库设计
数据库设计是城市空气质量等级预测系统开发的基础,主要用来保存系统所需要的各种功能数据,即空气质量监测数据、预测结果和用户信息等。数据库各个实体间的关系影响用户的操作数据,合理的数据库设计是保证用户后面能够流畅地使用系统、保证系统稳定运行的重要因素。
4.3.1 数据库概念结构设计
系统数据库的概念结构设计一般用实体属性图来展示。城市空气质量等级预测系统业务数据类型多、关联关系比较复杂,本次概念结构设计只对系统主要实体进行了梳理和分析。本系统数据库概念结构设计具体的内容以及详细的描述如下。
(1)系统中用户的个人信息包含了多个基本属性,完整的结构以及字段特点用可视化图表形式展示出来,其中包含了用户账户、密码、性别、头像、联系方式、邮箱等属性,该实体的详细属性展示内容如下图所示。
图4-3 用户信息实体属性图
空气质量数据属于系统的主体数据,空气质量数据具有污染物浓度、监测时间、城市点位、风速、气压、降水量、交通流量、植被覆盖率、空气质量等级、工业排放强度等属性。本实体已经完成了所有的字段和属性之间的关系。如下图4-4所示。
图4-4 空气质量实体属性图
空气质量预测属于系统的主要业务实体,具有时间、污染物指标和等级结果这三个特点。该实体完整的属性结构和详细的构造设计如图4-5所示。
图4-5 空气质量预测实体属性图
(4)健康建议作为系统的主体部分,有空气质量和适宜的人群,佩戴防护的提示信息,发布的时间以及知识文本和评论数目,收藏数,健康知识的详细内容和摘要。该实体完整的字段结构以及属性详情,如图4-6所示。
图4-6 健康建议实体属性图
空气质量分析属于系统主要业务实体,包含污染指标、变化趋势、相对湿度、质量分析以及研究结论等诸多重要性质。该实体字段结构与详细设计中所列的结构一致,如图4-7所示。
图4-7 空气质量分析实体属性图
(6)管理员作为系统管理核心实体,涵盖账号、密码、角色等关键基础属性。该实体完整的属性结构和详细的规范见图4-8。
图4-8 管理员实体属性图
城市空气质量等级预测系统整体E-R图体现了整个系统里各个实体、属性以及它们之间的联系。用户可以浏览空气质量以及与之相关的质量预测、健康建议和检测出来的空气质量分析,管理员可以导入、核销、添加以及做AI分析。用户与管理员之间通过分析空气质量信息、预测结果等进行交流从而产生联系,形成了以系统展示信息为流、以管理循环为基础的系统。该总体E-R图具体表现为图4-9所示的,清楚地表示出系统数据库的全部设计思路。
图4-9 系统总体E-R图
4.3.2 数据库逻辑结构设计
城市空气质量等级预测系统利用数据库表来建立各种业务数据之间的联系,用规范的字段设计体现整体表结构标准。根据空气质量监测、预测管理等主要需求,本文依次对核心的数据表进行相应的结构介绍,说明各个字段的含义以及设计思想。
(1)用户信息表用以保存所有的注册用户的基础信息资料和相应的账号权限有关的信息,该表对应的数据表字段结构、数据类型以及约束设置,如表4-1所示。
表4-1 用户信息表
列名 数据类型 长度 主键 说明
id bigint 20 是 主键
addtime timestamp 否 创建时间
yonghuzhanghao varchar 16 否 用户账号
mima varchar 30 否 密码
yonghuxingming varchar 16 否 用户姓名
touxiang longtext 否 头像
xingbie varchar 30 否 性别
lianxifangshi varchar 30 否 联系方式
email varchar 30 否 邮箱
status int 11 否 状态
空气质量数据表用来存放对应系统采集的各种空气质量监测指标和环境相关参数,给用户的数据查询、空气质量预测计算等主要功能提供基础的数据支持和监测。空气质量表所对应完整的字段组成、对应的数据类型和相关约束规范等详细的表4-2内容都进行了说明。
表4-2 空气质量表
列名 数据类型 长度 主键 说明
id bigint 20 是 主键
addtime timestamp 否 创建时间
jiancezhandian varchar 30 否 监测站点
monitoringdate date 否 监测日期
monitoringcities varchar 30 否 监测城市
p double 否 PM2.5浓度(μg/m³)
pm double 否 PM10浓度(μg/m³)
so double 否 SO₂浓度(μg/m³)
no double 否 NO₂浓度(μg/m³)
co double 否 CO浓度(mg/m³)
o double 否 O₃-8h浓度(μg/m³)
wendu int 11 否 温度(℃)
relativehumidity int 11 否 相对湿度(%)
fengsu int 11 否 风速(m/s)
fengxiang varchar 30 否 风向
qiya int 11 否 气压(hPa)
jiangshuiliang int 11 否 降水量(mm)
airqualitylevellabel varchar 30 否 空气质量等级(标签)
trafficflowvehicleshour int 11 否 交通流量(辆/小时)
gongyepaifangqiangdu varchar 30 否 工业排放强度
vegetationcoveragerate int 11 否 植被覆盖率(%)
renkoumidu int 11 否 人口密度(人/平方公里)
clicknum int 11 否 点击次数
storeupnum int 11 否 收藏数
(3)空气质量预测表用来保存系统所产生出的全部的预测数据和评级成果,为相应的核心业务功能运作提供支撑。空气质量预测数据表完整的字段数据类型及约束等等详细结构如表4-3所示。
表4-3 空气质量
列名 数据类型 长度 主键 说明
id bigint 20 是 主键
addtime timestamp 否 创建时间
monitoringcities varchar 30 否 监测城市
monitoringdate date 否 监测日期
relativehumidity int 11 否 相对湿度
trafficflowvehicleshour int 11 否 交通流量(辆/小时)
vegetationcoveragerate int 11 否 植被覆盖率(%)
airqualitylevellabel varchar 30 否 空气质量等级(标签)
(4)健康建议表用来存放各个空气质量等级所对应防护措施以及健康指引信息,给用户的出行和健康防护赋予可靠的参照。健康建议表全部字段构成、对应数据类型及约束规范等全部详细设计内容如表4-4所示。
表4-4 健康建议表
列名 数据类型 长度 主键 说明
id bigint 20 是 主键
addtime timestamp 否 创建时间
zhishibiaoti varchar 32 否 知识标题
fengmian longtext 否 封面
dengji varchar 16 否 等级
fabushijian date 否 发布时间
zhishiwendang longtext 否 知识文档
zhishishipin longtext 否 知识视频
zhishijianjie longtext 否 知识简介
zhishixiangqing longtext 否 知识详情
thumbsupnum int 11 否 赞
crazilynum int 11 否 踩
clicknum int 11 否 点击次数
discussnum int 11 否 评论数
storeupnum int 11 否 收藏数
空气质量分析表主要用于记录并保存有关城市空气质量相关的趋势统计数据和综合研判结果,产生的数据结果为系统数据分析、结果展示等功能提供一定的数据支持,为空气质量分析和预测监控等都有相应的结果。空气质量分析数据表完整的规划设计包括各字段的名称、对应的属性类型(整型或浮点型)、设置的约束条件、详细的描述等内容全部在表4-5中展示出来,并对它们做出详细的阐述。
表4-5 空气质量分析
列名 数据类型 长度 主键 说明
id bigint 20 是 主键
addtime timestamp 否 创建时间
p double 否 PM2.5浓度(μg/m³)
pm double 否 PM10浓度(μg/m³)
so double 否 SO₂浓度(μg/m³)
no double 否 NO₂浓度(μg/m³)
co double 否 CO浓度(mg/m³)
o double 否 O₃-8h浓度(μg/m³)
relativehumidity int 11 否 相对湿度(%)
airqualitylevellabel varchar 30 否 空气质量等级(标签)
trafficflowvehicleshour int 11 否 交通流量(辆/小时)
vegetationcoveragerate int 11 否 植被覆盖率(%)
zhiliangfenxi longtext 否 质量分析
(6)管理员数据表用来存储系统管理员的账号以及权限配置信息,保证后台管理的操作是安全的、有条理的。管理员表所有的字段的完整字段结构、数据类型、约束条件等内容如图4-6所示。
表4-6 管理员表
列名 数据类型 长度 主键 说明
id bigint 20 是 主键
addtime timestamp 否 创建时间
username varchar 30 否 用户名
password varchar 30 否 密码
role varchar 30 否 角色
image longtext 否 头像
4.3.3 系统数据流图
城市空气质量等级预测系统先从接口中获取监测站污染物数据、气象参数,并将数据进行清洗、去噪后存到MySQL数据库中。后端获取历史数据输入到随机森林模型中进行预测得到等级结果,前端接收用户的查询请求调用接口来获取结果,最后把空气质量数据、预测等级以及趋势图表进行可视化展示,实现整个闭环的数据流,系统的数据流图如图4-9所示。
图4-9 系统数据流图
4.4 业务流程设计
用户登录到城市空气质量等级预测系统以后,可以注册登录获取城市实时的空气质量监测数据和历史数据,系统通过算法计算得出空气质量等级预测结果以及相应的健康建议。管理员对后台审核修改的监测数据、系统用户、系统内容进行管理,保证数据准确无误。全流程把查询浏览、预测分析、后台管理三者一体化起来,系统业务流程图如图4-10所示。
图4-10 系统业务流程图
5 系统实现
5.1 管理员端主要功能实现
5.1.1 看板功能实现
管理员登录之后,前端发起看板数据请求,后端收到并解析请求,向数据库查询统计和监测有关的数据;数据库检索完成后把结果传递到后端,后端整理封装业务数据然后返回给前端;前端渲染可视化看板页面完成展示,完整的交互时序图如下图5-1所示。
图5-1 看板功能时序图
管理员在后台看到的主要是监测站点分布图、空气质量总量统计表和植被覆盖率等主要数据。系统以可视化的形式将各种各样的重要指标集中展示出来,使管理人员可以较快地了解总体的环境数据概况,进而做好数据分析以及管理决策的工作。该看板功能的实际界面展示效果如下图5-2所示。
图5-2 看板功能效果图
5.1.2 用户管理功能实现
管理员在前端发起用户管理相关的操作请求,前端把指令传送到后端接口;后端接收到请求之后会验证权限再访问数据库进行查询或者修改用户信息,数据库执行相应的操作之后返回结果;后端对处理后的数据进行整理并发送给前端进行页面的渲染交互,整体时序流程图如图5-3所示。
图5-3 用户管理时序图
管理员可以自行输入账号、姓名、密码等基本的信息,也可以对已经存在的用户信息进行修改、删除操作。系统使用MD5加密算法对用户登录密码做安全加密,从而保证了用户密码的安全,从技术角度杜绝了信息泄露的风险,全方位地提高了平台用户的账户使用安全性以及数据保密程度,用户管理效果图见图5-4。
图5-4 用户管理功能效果图
5.1.3 空气质量管理功能实现
管理员在前端发出空气质量管理的操作请求,传输到后端接口,后端检查权限之后调取空气质量的相关数据,数据库执行查询以及数据处理,并把结果反馈给前端,后端整理封装数据返回前端,前端渲染页面完成交互展示,完整的时序流程图如图5-5所示。
图5-5 空气质量管理时序图
管理员进入后台空气质量管理页面之后,可以点击导入按钮,对已经采集到的数据集进行导入操作,从而快速地完成系统的数据录入工作。管理人员可以在线进行原始监测数据的清洗校验处理,也可以一键执行数据生成操作,从而提高整个数据质量。完整的界面操作展示效果如图5-6所示。
图5-6 空气质量管理功能效果图
5.1.4 空气质量预测管理功能实现
管理员在前端发起空气质量预测管理操作请求,传送到后端,后端校验权限后从数据库调取预处理数据集,然后调用预测算法完成运算,把结果回存数据库,整理封装数据,最后反馈到前端完成页面渲染展示,完整的交互时序图如图5-7所示。
图5-7 空气质量预测管理时序图
管理员在新增页面下可新增监测城市、监测日期、相对湿度、植被覆盖率,输入后提交,点击预测按钮即可对城市空气质量进行预测。该功能主要是用随机森林回归算法预测完成的,空气质量预测管理效果图如图5-8所示。
图5-8 空气质量预测管理时序图
5.1.5 健康建议管理功能实现
管理员在前端发起健康建议管理操作请求,并将该请求发送到后端的接口,后端校验权限之后,从数据库中获取各种空气质量配套建议数据;完成数据增删改查的操作之后,数据库把执行的结果返回给后端,后端对这些信息进行封装处理,然后返回给前端的渲染页面,整个交互时序图如下图5-9所示。
图5-9 健康建议管理时序图
管理员进入后台健康建议管理模块,自主添加健康知识标题及配套的科普文档等有关信息,增加不同的空气质量所对应的防护指导。另外还可以对已经录入的历史建议数据进行修改、删除等操作,灵活的对平台健康知识库的内容进行维护。该种管理功能的实际界面显示效果,如图5-10所示。
图5-10 健康建议管理时序图
5.1.6 空气质量分析管理功能实现
管理员在前端发出空气质量分析管理操作请求,并将此请求发给后端,后端检验权限之后从数据库中获取监测和历史数据;数据库搜索相关的信息并把它们传回给后端,后端对这些信息进行统计分析处理之后把结果包装起来再送回前端,从而完成渲染展示页面的任务,完整的交互时序图如图5-11所示。
图5-11 空气质量分析管理时序图
管理员进入空气质量分析管理模块之后可以输入PM2.5浓度、交通流量等环境影响相关的监测数据。系统主要依靠DeepSeek智能模型对各种各样的数据进行深度的AI分析运算,发掘空气质量的变化规律和相关特性,给研判工作赋予智能的支持。该功能完整的操作界面和运行效果,如图5-12所示。
图5-12 空气质量分析管理效果图
5.2 用户端主要功能实现
5.2.1 空气质量功能实现
用户通过前端发起空气质量查询操作,向后端接口发送请求,后端校验请求的合法性之后再访问数据库获取监测和预测数据,数据库检索完毕后返回原始信息,后端进行整合处理之后再回传给前端,前端将接收到的数据渲染成页面进行展示,完整的交互时序图如图5-13所示。
图5-13 空气质量时序图
普通用户进入系统前端页面之后可以浏览全网各个城市的空气质量汇总数据,可以清楚地了解到整个环境的大致情况。此外支持通过城市名称来对污染物进行精确的查找,定位目标区域之后就可以查看出污染物指标、空气质量等级等详细的信息,从而满足个性化查询的要求。该前端展示界面实际的呈现效果如下图5-14所示。
图5-14 空气质量管理效果图
5.2.2 空气质量预测功能实现
用户通过前端的空气预测查询请求到达后端,后端对请求进行验证之后从数据库中获取历史监测数据,然后调用预测模型进行运算处理,最后将处理结果封装成返回给前端的数据,并由前端渲染显示出来,完整的交互时序图如图5-15所示。
图5-15 空气质量预测时序图
普通用户可以自行浏览管理员后台录入、维护的各个城市空气质量预测的相关内容。用户可以随时查看各个地区的空气质量预测数据和分析结果,清楚地知道未来空气质量的变化趋势,给日常生活出行、健康防护提供一定的参考依据。该前端预测展示页面实际呈现效果如图5-16所示。
图5-16 空气质量预测效果图
5.2.3 健康建议功能实现
用户从前端发出健康建议查询请求,并发送到后端,后端验证请求权限之后,从数据库中查找相关数据,数据库检索完成之后把信息反馈给后端,后端对内容进行整合处理并传递给前端,前端将结果显示在页面上,完整的交互时序图如下图5-17所示。
图5-17 健康建议时序图
用户登录系统前端界面之后可以查看管理员后台统一发布维护的全部健康科普建议内容。用户可对各种空气质量等级所对应到的防护措施做详细了解,在了解了健康指导的相关知识后做出相应的决策。还可以在线下下载配套的科普材料供用户自行保存查看。该前端健康建议展示页面完整界面效果如图5-18所示。
图5-18 健康建议效果图
5.2.4 空气质量分析功能实现
用户从前端发出空气质量分析查看请求到后端,后端检验请求的合规性之后访问数据库取得分析数据;数据库查询并回馈信息,后端整合处理统计成果之后包装回复给前端,页面展现所渲染的内容,全部时序流程图见图5-19。
图5-19 空气质量分析时序图
用户可以在系统前台看到经过分析后的空气质量数据,相关的监测数据是由管理员在后台用AI技术对它做深层次的分析处理得到的,从而提高了数据分析结果的准确性以及科学性。用户可以直接得到可靠的分析结果,可以清楚地看出空气质量情况和变化趋势,该功能界面的展示效果如图5-20所示。
图5-20 空气质量分析效果图
6 系统测试
6.1 测试目的
本系统测试主要是对城市空气质量等级预测功能的完整性、稳定性进行检验,保证前端界面交互流畅、后端逻辑计算正确、安全地完成数据库读写操作。用测试来检验随机森林回归等算法的预测精度,保证数据导入、清洗、分析以及可视化展示等模块的运行正常,也对用户端和管理员端的各项操作是否符合需求设计进行检验。另外排查系统的潜在缺陷,保证多用户同时访问的稳定,给系统正式上线运行提供可靠的保障。
6.2 测试方法
本系统主要使用黑盒测试的方法,根据功能需求来验证系统各个模块的正确性,即对空气质量数据管理、预测分析、健康建议等模块进行操作测试,并且还要对界面进行测试,查看页面展示和交互是否正常,最后通过数据测试来验证数据库的存储和读取是否准确。在系统运行阶段做稳定性测试,模拟多用户并发访问场景,再做简单的兼容性测试,在不同的环境中都可以正常工作,全面保证系统的功能和性能都达到要求。
6.3 系统功能测试
根据前面对测试方法的了解,本系统功能测试会用黑盒测试法。由于本系统功能实现较多,大部分功能模块的实现原理相同,因此本节只对城市空气质量等级预测系统的功能做简单的测试用例说明。
6.3.1 用户管理功能测试
用户管理模块功能测试的重点是来验证管理员可以正常地完成用户的账号、姓名、密码等信息的增加操作,并且能对已经存在的用户信息进行编辑对应的修改以及删除。测试中会验证系统是否使用MD5加密算法对用户的密码进行加密保存,保证密码在传输和存储中都是安全的,不会造成用户密码的泄露。对逐项功能进行系统的测试保证模块的操作流程规范,数据处理可靠,用户的管理测试用例见表6-1。
表6-1 用户管理测试用例表
测试功能 操作 预期结果 实际结果
用户信息的新增 管理员新增一条001的用户账号信息,使用新增的用户账号在前台进行登录 使用新增的001的用户账号信息可以正常进行登录,能够使用对应的功能模块 与预期结果一致,可以正常使用新增的用户账号信息
用户信息的修改 管理员将001的密码由123456改成12345,使用原先的账号密码信息在前台进行登录 使用修改之前的密码进行登录,页面显示登录失败,页面提示“账号或密码错误” 与预期结果一致,使用修改之前的密码,会导致账号无法进行登录
6.3.2 空气质量管理功能测试
对空气质量管理模块做功能测试,证明管理员可以在后台用文件导入的方式完成空气质量数据批量上传和入库,可以对监测数据进行清洗校验,并且可以执行数据生成操作。同时对用户端的展示各城市空气质量数据、按照城市名称搜索和查看详细污染物和等级等做测试。各项数据显示正确,测试用例如表6-2所示。
表6-2 空气质量管理测试用例表
测试功能 操作 预期结果 实际结果
空气质量的新增 管理员新增一条上海工业园的空气质量信息,用户在前台进行查看 用户在前台可以查看到管理员新增的上海工业园的空气质量信息 与预期结果一致,可以正常查看到管理员新增的上海工业园的空气信息
空气质量的删除 管理员将刚刚新增的空气质量的数据信息进行删除,用户在前台进行查看 用户在前台无法查看到管理员刚刚新增的空气质量信息 与预期结果一致,用户无法查看到刚刚管理员新增的空气质量的信息
空气质量的数据清洗 管理员选中页面的所有数据,点击数据清洗按钮,然后等待数据清洗完成 页面提示数据清洗完成 与预期结果一致,数据清洗完成
6.3.3 健康建议管理功能测试
对健康建议管理模块进行功能测试,检验管理员在后台可以正常添加健康知识标题、科普文档,可以对已有的建议信息进行编辑和删除,达到知识库的维护目的。还要对前端用户的健康建议详情进行浏览,检查文档下载是否可行。测试需要保证前后端交互流畅,数据完整,操作正常,相关的测试用例如下表6-3所示。
表6-3 健康建议管理测试用例表
测试功能 操作 预期结果 实际结果
健康建议的新增 管理员新增一条沙尘暴的健康建议,用户在前台进行查看 用户在前台可以查看到管理员新增的沙尘暴的健康建议信息 与预期结果一致,可以正常查看到管理员新增的健康建议信息
健康建议的修改 管理员将沙尘暴的知识标题进行修改,用户在前台进行查看 用户在前台查看到健康建议的知识标题发生了变化 与预期结果一致,用户在前台查看到知识标题发生了变化
6.3.4 空气质量分析管理功能测试
对空气质量分析的管理模块进行相应的功能测试,检验管理员在后台可以正常地录入PM2.5浓度、CO浓度、交通流量等监测数据,通过DeepSeek智能模型可以完成AI数据分析。还要对前端用户查看经过AI处理的分析结果的情况进行测试,保证数据展示准确、规律显示清楚。对测试覆盖数据录入、AI分析、结果展示等全过程进行测试,保证模块功能稳定可以使用,测试用例如表6-4所示。
表6-4 空气质量分析管理测试用例表
测试功能 操作 预期结果 实际结果
空气质量分析的新增 管理员新增一条空气质量分析的数据信息,用户在前台进行查看 用户在前台可以查看到管理员新增的空气质量分析的相关数据信息 与预期结果一致,可以正常看到管理员新增的空气质量分析数据信息
续表6-4 空气质量分析管理测试用例表
测试功能 操作 预期结果 实际结果
空气质量分析的AI数据分析 管理员将刚刚新增的空气质量数据分析,点击AI数据分析之后,等待一会之后 管理员等待一会儿之后,可以查看到AI分析的结果 与预期结果一致,AI分析的数据结果可以正常进行使用
6.4 测试总结
本次就对城市空气质量等级预测系统进行了全面的测试,涉及用户管理、空气质量管理、健康建议、空气质量分析等各个主要功能模块。经过测试可以发现,系统各方面的功能都可以正常使用,数据的录入、AI分析、预测计算、信息展示都运行良好,没有出现错误的状况,同时对前后端的交互情况也进行了检查。测试中出现的界面显示和minor逻辑问题都得到了修正,系统总体性能、安全性和兼容性达到设计要求,可以进行正式上线运行。
7 总结与展望
7.1 总结
本文就城市空气质量等级预测系统展开研究,就传统的城市空气质量预测系统出现的空气质量数据散乱,缺少面对复杂环境给予公众健康建议等状况进行需求分析、数据库规划以及功能模块搭建。系统采用SpringBoot+Vue模式实现前后端分离开发,根据角色不同分为普通用户模块和管理员模块,对各种问题有相应的解决方法。普通用户模块可以对用户的空气质量实时查看、预测结果查询、健康防护建议获取提供支持,解决了公众不能直接获得空气质量信息的问题。管理员模块可以完成数据管理、人工智能分析、用户信息管理、系统管理等功能,消除了由于数据分散而造成的管理不便的问题,使系统的准确性及完整性得到更好的保障。本文使用黑盒测试的方法对各个功能模块做完整的功能测试和稳定性测试。测试结果表明,系统各项功能均能正常实现,数据录入、AI分析、预测计算和信息展示运行正常,数据导入导出等重要逻辑没有错误,前后端交互流畅,系统整体性能、安全性、兼容性满足设计要求。
7.2 展望
今后可以对城市空气质量等级预测系统做更加深入的研究与发展,在多维数据的基础上加入天气情况、工业污染源、车流量和地理位置等各方面的因素,使预测模型能够得到更为全面的信息作为支撑。可以进一步提高DeepSeek+随机森林的预测速度、准确性,从而对更长的时间范围做预测。也可以采取跨区域合作的方式,促进各个地区的空气质量改善,为之后的研究工作做好铺垫。
就功能而言,可以增加空气质量预警推送、个性化的健康提醒、历史数据对比等,从而提升用户体验,在移动端支持微信小程序和公众号的访问。另外还可以和物联网监测装置相连,使得上传的数据具备可视化的大屏功能,给管理者赋予直接的数据支撑。经过系统不断升级之后可以更具有实用性、扩展性,更好的服务城市的环境管理以及居民健康防护。
参考文献
[1] 张茗斐.基于地理加权随机森林的长三角地区PM2.5浓度空间插值估算[D].桂林理工大学,2025.
[2] 李佩泽.基于IPSO-LSTM模型的空气质量预测研究[D].山东财经大学,2025.
[3] 朱效锋,张倩,朱小平. 基于机器学习的城市空气质量预测模型分析[J].现代信息科技,2025,9(10):17-22.
[4] 李天辉,董驰,师文通,等. 基于小样本随机森林模型的低气压下室内设备空气放电故障识别方法研究[J/OL].高压电器,1-9[2026-04-02].https://link.cnki.net/urlid/61.1127.TM.20250509.1715.002.
[5] 彭聪.基于随机森林-贝叶斯优化的矿井复杂风网火灾诊断研究[D].中国矿业大学,2025.
[6] 王浩铮.基于机器学习的重庆市空气质量影响分析及预测研究[D].重庆三峡学院,2025.
[7] 任文宗,刘婕,邓玉婷,等. 基于RF回归和LSTM神经网络的空气污染耦合性研究及预测——以北京市为例[J].科学技术创新,2025,(10):22-26.
[8] 孙淑宁.东北三省主要城市空气质量影响因素分析与预测研究[D].黑龙江大学,2025.
[9] Yi M ,Lin F . A Hybrid Air Quality Prediction Method Based on VAR and Random Forest[J].Journal of Computer and Communications,2025,13(02):142-154.
[10] Xie Y ,Nhu N A ,Song P X , et al. Accounting for spatial variability with geo-aware random forest: A case study for US major crop mapping[J].Remote Sensing of Environment,2025,319114585-114585.
[11] YANG Z ,GOKON H . Detecting high-risk traffic congestion during snow disasters: A random forest-based spatial model[J].Intelligence, Informatics and Infrastructure,2025,6(3):90-102.
[12] Su X ,Xin Y ,Yu Y , et al. Research on Urban Air Quality Prediction System Based on Improved Random Forest Modelling[J].Ecological Chemistry and Engineering S,2025,32(2):213-235.
[13] 韩晶晶,迪里努尔·牙生,雷雨虹,等. 基于聚类分型的随机森林O3浓度预测方法研究[J].沙漠与绿洲气象,2025,19(03):193-200.
[14] 程云. 合肥市空气质量特征分析与空气质量指数预测方法研究[J].合肥师范学院学报,2024,42(06):49-55+128.
[15] Tchakoucht A T ,Elkari B ,Chaibi Y , et al. Random forest with feature selection and K-fold cross validation for predicting the electrical and thermal efficiencies of air based photovoltaic-thermal systems[J].Energy Reports,2024,12988-999.
致 谢
本文顺利完成,是老师们、同学在我背后鼎力支持和无私帮助的结果,对老师、同学们表示深深的谢意。首先要感谢我的指导老师岳桢老师,从选题到设计框架、系统开发、论文撰写,老师都给予了我悉心的指导,并给出了许多宝贵的建议,使我的设计内容更加完善,使我更好的完成了论文的编写。
感谢河南师范大学为我们提供良好的学习环境,给我们提供了学习论文资料便利的条件,在河南师范大学有我学习奋斗的时光和美好的经历。同时向所有给我指导的教授们表示衷心的感谢,在大学期间,我得到老师的悉心栽培,传授给我的专业知识、技能是我的成功的基础,也是我在编写本系统、撰写毕业论文过程中的支撑力量。
感谢陪我走过大学四年时光的诸多挚友。我们在一起时有欢笑、有泪水、有拼搏。对于我们每一个人一生中都会碰到一些人,但也会有部分人永远无法遇见。不管将来怎样,都永远感谢那些让我难忘的经历。
时光飞逝,即将毕业。最后也对早起为图书馆找位置学习的自己、在路上还想着怎样学习的自己说一声感谢,对在备考时遇到的各种困境和挑战的自己说声感谢,对我战胜自我的历程中变得更加强大的自己说声感谢。考研的结果是心酸的,但是我不应该总被失败所困扰。我在结果出现的时候就停止下来,在犹豫和等待之中,但是人生旅途上没有机会让你去尝试错误,做好当下的事情才是关键。泪水并不是罪责的辩护者,只能找到出路才是最正统的道路。感谢老师和朋友们在本时间段内给予技术指导等各方面的支持。在此对关心和帮助过我的每一个人表示最诚挚的感谢!
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)