数据集分享:用于机器学习的学生学业表现数据集
·

作者:dhruvb2028(Dhruv Bansal)
许可条款:CC BY-NC-SA 4.0
原网页:https://www.kaggle.com/datasets/dhruvb2028/student-academic-performance-dataset-for-ml
数据集文件:通过网盘分享的文件:用于机器学习的学生学业表现数据集
链接: https://pan.baidu.com/s/1YDm7Hj9RKtg9h8P9xWNesw?pwd=4gma 提取码: 4gma
一、数据集核心概况
数据规模:共 1194 条学生记录,31 个字段
数据质量:无缺失值,格式规范,可直接用于分析
数据类型分布:数值型字段 12 个,分类(文本)型字段 19 个
二、字段分类及具体列表
(一)数值型字段(12 个)
主要涵盖学生基本属性、学习行为、学业成绩、经济状况等量化信息:
- University Admission year(大学入学年份)
- Age(年龄)
- H.S.C passing year(高中毕业年份)
- Current Semester(当前学期)
- How many hour do you study daily?(每日学习时长,单位:小时)
- How many times do you seat for study in a day?(每日学习次数)
- How many hour do you spent daily in social media?(每日社交媒体使用时长,单位:小时)
- How many hour do you spent daily on your skill development?(每日技能提升时长,单位:小时)
- What was your previous SGPA?(之前学期平均绩点,0-4 分制)
- What is your current CGPA?(当前累计平均绩点,0-4 分制)
- How many Credit did you have completed?(已完成学分数量)
- What is your monthly family income?(家庭月收入)
(二)分类型字段(19 个)
主要涵盖学生属性、学习环境、生活状态等定性信息: - Gender(性别:Male/Female)
- Program(专业:如 BCSE、BBA、English 等)
- Do you have meritorious scholarship ?(是否有优秀奖学金:Yes/No)
- Do you use University transportation?(是否使用学校交通:Yes/No)
- What is you interested area?(兴趣领域:如 Data Science、Software 等)
- What is your relationship status?(感情状态:如 Single、Married 等)
- Are you engaged with any co-curriculum activities?(是否参与课外活动:Yes/No)
- With whom you are living with?(居住对象:Family/Bachelor 等)
- Do you have any health issues?(是否有健康问题:Yes/No)
- Do you have any physical disabilities?(是否有身体残疾:Yes/No)
- (其余 8 个字段)涵盖学习习惯、家庭背景、校园生活等补充信息(如学习方式偏好、家庭结构等)
三、核心关键字段(学业分析重点)
学业成绩字段:What was your previous SGPA?(前学期绩点)、What is your current CGPA?(当前累计绩点)—— 核心目标变量
学习行为字段:每日学习时长、每日学习次数、社交媒体使用时长 —— 关键影响因素
基础属性字段:Gender(性别)、Age(年龄)、Program(专业)—— 群体划分依据
资源获取字段:是否有奖学金 —— 学业表现关联指标
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)