计算机毕业设计:Python 基于协同过滤的图书个性化推荐平台 Django框架 协同过滤推荐算法 可视化 书籍 数据分析 大数据 大模型(建议收藏)✅
1、项目介绍
技术栈
Python语言、Django框架、MySQL数据库、协同过滤推荐算法(基于用户与基于物品)、Echarts可视化工具、Bootstrap前端框架、HTML
功能模块
图书展示模块:提供图书分类浏览、列表分页展示、详情页查看功能,呈现图书名称、作者、出版社、价格、评分等完整信息
用户互动模块:支持用户注册登录、点赞收藏、评分评论操作,个人中心集中管理收藏记录、评论内容及评分数据
个性化推荐模块:融合基于用户的协同过滤与基于物品的协同过滤双重算法,依据用户行为精准推送契合偏好的图书
数据可视化模块:通过Echarts生成图书分类数量与评分分布双轴图、作者评分词云图、上架数量趋势折线图、图书类型占比饼图等多维度可视化图表
后台管理模块:支持图书信息、用户数据、评分记录、评论内容的增删改查操作,提供系统权限管理与数据维护功能
项目介绍
本系统基于Python+Django框架开发,整合MySQL数据库与双重协同过滤推荐算法,构建了覆盖图书浏览、用户互动、个性化推荐与后台管理的完整平台。前端采用Bootstrap构建响应式界面,通过Echarts实现数据可视化图表展示。核心推荐模块同时实现基于用户和基于物品的协同过滤算法,通过分析用户评分、收藏、评论等行为数据,计算用户相似度与物品相似度,为每位用户生成个性化推荐列表。系统提供图书分类浏览、详情查看、点赞收藏、评分评论等交互功能,个人中心集中管理用户互动记录。后台支持图书与用户信息的全面管控。平台实现从数据采集、推荐计算到可视化呈现的全链路服务,满足用户个性化阅读需求。
2、项目界面
(1)图书详情页
该页面是图书推荐系统的图书详情页,可展示图书的名称、作者、出版社、价格、评分、收藏人数等信息及详细介绍,支持查看详情、收藏操作,同时提供基于物品和基于用户的推荐图书模块,还设有搜索、首页、标签、数据可视化、后台管理等功能模块入口。

(2)图书信息列表
该页面是图书推荐系统的首页,以热度排序展示图书信息,支持分页浏览,同时提供搜索功能,还设有最近更新、基于用户推荐图书模块,系统还包含标签、数据可视化、后台管理等功能模块入口,方便用户进行图书查找与系统管理。
(3)图书推荐(基于用户+基于图书)
该页面是图书推荐系统的图书详情交互页,提供基于物品和基于用户的推荐图书模块,支持更换推荐内容,同时设有评论输入与提交功能,方便用户对图书进行评价交流,系统还包含首页、标签、数据可视化、后台管理等功能模块入口。
(4)图书点赞收藏、评分
该页面是图书推荐系统的图书详情页,可展示图书的作者、出版社、价格、评分、收藏人数等信息及详细介绍,支持查看详情、收藏、添加评分操作,同时提供基于物品和基于用户的推荐图书模块,还设有搜索、首页、标签、数据可视化、后台管理等功能模块入口。
(5)可视化分析1----图书分类数量与图书评分
该页面是图书推荐系统的数据可视化分析页,通过双轴图表展示图书分类数量与对应评分分布情况,同时提供分类数量&图书评分、作者评分词云、图书上架数量曲线、分类占比图等多种可视化分析选项,系统还设有首页、标签、后台管理等功能模块入口。
(6)可视化分析2----词云图分析
该页面是图书推荐系统的作者评分词云可视化页,以词云形式直观展示不同作者及其对应评分的分布情况,文字大小体现评分权重,同时系统还设有首页、标签、其他数据可视化选项及后台管理等功能模块入口,方便用户进行多维度数据查看与系统管理。
(7)图书上架数量分析
该页面是图书推荐系统的图书上架数量趋势可视化页,通过折线图展示不同年份的图书上架数量变化情况,可直观呈现上架量的波动趋势,同时系统还设有首页、标签、其他数据可视化选项及后台管理等功能模块入口,方便用户进行多维度数据查看与系统管理。
(8)图书类型占比分析
该页面是图书推荐系统的图书分类占比可视化页,通过饼图展示不同类别图书的数量占比情况,可直观呈现各分类的占比权重,同时系统还设有首页、标签、其他数据可视化选项及后台管理等功能模块入口,方便用户进行多维度数据查看与系统管理。
(9)图书分类
该页面是图书推荐系统的图书分类浏览页,以分类标签形式展示所有图书类别,用户可点击标签查看对应类别图书,同时设有最近更新、基于用户推荐图书模块,系统还包含首页、数据可视化、后台管理等功能模块入口,方便用户进行图书查找与系统管理。
(10)个人信息-----我的收藏、评论、评分
该页面是图书推荐系统的个人信息管理页,可展示用户的用户名、邮箱等信息,支持查看我的收藏、我的评论、我的评分,还能进行密码、账号、邮箱等信息的修改与重置操作,同时系统设有最近更新、基于用户推荐图书模块及首页、标签、数据可视化、后台管理等功能入口。
(11)注册登录
该页面是图书推荐系统的用户登录页,提供用户名与密码输入框及登录按钮,同时设有注册入口,方便新用户注册账号,登录成功后可进入系统使用图书推荐、数据可视化、个人信息管理等功能。
(12)后台数据管理
该页面是图书推荐系统的后台图书管理页,以列表形式展示图书的ID、名称、作者、出版社、价格、评分、描述等信息,支持增加、删除图书操作,同时系统还设有首页、偏好、标签、用户、评分信息、评论等功能模块入口,方便管理员进行系统管理。
3、项目说明
一、技术栈简要说明
本系统以Python为开发语言,采用Django框架构建后端架构,实现路由分发、模型定义、视图逻辑及用户认证等核心功能。数据存储选用MySQL关系型数据库,保障用户信息、图书数据及互动记录的持久化与高效查询。推荐算法核心采用协同过滤技术,同时实现基于用户的协同过滤和基于物品的协同过滤双重算法,通过计算用户相似度与物品相似度生成个性化推荐结果。前端界面借助Bootstrap框架搭建响应式布局,配合Echarts可视化库实现多维度图表展示,HTML模板渲染页面内容。整体技术架构覆盖用户交互、推荐计算、数据管理与可视化呈现的完整业务流程。
二、功能模块详细介绍
图书展示模块
该模块提供图书分类标签浏览功能,用户点击分类标签即可查看对应类别图书列表。首页以热度排序展示图书信息,采用分页机制避免单次加载数据过多。图书详情页完整呈现书名、作者、出版社、价格、评分、收藏人数及内容简介等详细信息,方便用户全面了解图书情况。列表页面集成搜索功能,支持按关键词快速定位目标图书。
用户互动模块
该模块支持用户注册与登录功能,采用Django认证系统保障账户安全。用户在图书详情页可进行点赞、收藏、评分、评论等操作,所有互动记录实时存储至数据库。个人中心页面集中展示我的收藏、我的评论、我的评分三项记录,支持用户查看与管理个人互动数据,同时提供账号密码、邮箱等信息的修改重置功能。
个性化推荐模块
该模块融合基于用户的协同过滤与基于物品的协同过滤两种推荐算法。基于用户的协同过滤通过分析当前用户与其他用户的评分相似度,找到相似用户群体,将其喜爱的图书推荐给当前用户。基于物品的协同过滤则依据用户历史行为,计算物品之间的相似度,推荐与用户曾互动图书相似的其他图书。详情页同时展示两种推荐结果,并支持更换推荐内容,为用户提供多样化选择。
数据可视化模块
该模块通过Echarts生成多维度数据分析图表。双轴图展示图书分类数量与对应评分分布情况,折线图呈现不同年份图书上架数量变化趋势,饼图展示各类别图书数量占比,词云图以文字大小体现作者评分权重。用户可在可视化页面切换不同分析维度,直观了解图书数据的整体特征与分布规律。
后台管理模块
该模块面向系统管理员,以表格形式展示图书的ID、名称、作者、出版社、价格、评分、描述等信息,支持新增图书、删除图书等操作。同时提供用户信息管理、评分记录管理、评论内容管理功能,便于管理员全面管控系统数据,保障平台有序运行。
三、项目总结
本系统构建了集图书浏览、用户互动、个性化推荐、数据可视化与后台管理于一体的完整图书推荐平台。核心推荐模块采用基于用户和基于物品的双重协同过滤算法,通过分析用户评分、收藏、评论等行为数据,为每位用户生成精准的个性化推荐列表。前端提供图书分类浏览、详情查看、点赞收藏、评分评论等丰富的交互功能,个人中心集中管理用户互动记录。数据可视化模块以图表形式直观呈现图书分类数量、评分分布、上架趋势、类型占比等关键指标。后台管理系统保障图书与用户数据的高效维护。平台实现从用户行为采集、推荐计算到可视化呈现的全链路服务,有效满足用户个性化阅读需求。
4、核心代码
# -*-coding:utf-8-*-
import os
os.environ["DJANGO_SETTINGS_MODULE"] = "recommend.settings"
import django
django.setup()
from item.models import *
from math import sqrt, pow
import operator
from django.db.models import Subquery, Q, Count
# from django.shortcuts import render,render_to_response
class UserCf:
# 获得初始化数据
def __init__(self, all_user):
self.all_user = all_user
# 通过用户名获得列表,仅调试使用
def getItems(self, username1, username2):
return self.all_user[username1], self.all_user[username2]
# 计算两个用户的皮尔逊相关系数
def pearson(self, user1, user2): # 数据格式为:房源id,浏览此
sum_xy = 0.0 # user1,user2 每项打分的成绩的累加
n = 0 # 公共浏览次数
sum_x = 0.0 # user1 的打分总和
sum_y = 0.0 # user2 的打分总和
sumX2 = 0.0 # user1每项打分平方的累加
sumY2 = 0.0 # user2每项打分平方的累加
for movie1, score1 in user1.items():
if movie1 in user2.keys(): # 计算公共的浏览次数
n += 1
sum_xy += score1 * user2[movie1]
sum_x += score1
sum_y += user2[movie1]
sumX2 += pow(score1, 2)
sumY2 += pow(user2[movie1], 2)
if n == 0:
# print("p氏距离为0")
return 0
molecule = sum_xy - (sum_x * sum_y) / n # 分子
denominator = sqrt((sumX2 - pow(sum_x, 2) / n) * (sumY2 - pow(sum_y, 2) / n)) # 分母
if denominator == 0:
return 0
r = molecule / denominator
return r
# 计算与当前用户的距离,获得最临近的用户
def nearest_user(self, current_user, n=1):
distances = {}
# 用户,相似度
# 遍历整个数据集
for user, rate_set in self.all_user.items():
# 非当前的用户
if user != current_user:
distance = self.pearson(self.all_user[current_user], self.all_user[user])
# 计算两个用户的相似度
distances[user] = distance
closest_distance = sorted(
distances.items(), key=operator.itemgetter(1), reverse=True
)
# 最相似的N个用户
print("closest user:", closest_distance[:n])
return closest_distance[:n]
# 给用户推荐房源
def recommend(self, username, n=3):
recommend = {}
nearest_user = self.nearest_user(username, n)
for user, score in dict(nearest_user).items(): # 最相近的n个用户
for movies, scores in self.all_user[user].items(): # 推荐的用户的房源列表
if movies not in self.all_user[username].keys(): # 当前username没有看过
if movies not in recommend.keys(): # 添加到推荐列表中
recommend[movies] = scores*score
# 对推荐的结果按照房源
# 浏览次数排序
return sorted(recommend.items(), key=operator.itemgetter(1), reverse=True)
# 基于用户的推荐
def recommend_by_user_id(user_id):
user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
current_user = User.objects.get(id=user_id)
# 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
# 没有的话,就按照浏览度推荐15个
if current_user.rate_set.count() == 0:
if len(user_prefer) != 0:
movie_list = xiangmu.objects.filter(tags__in=user_prefer)[:15]
else:
movie_list = xiangmu.objects.order_by("-c9")[:15]
return movie_list
# 选取评分最多的10个用户
users_rate = Rate.objects.values('user').annotate(mark_num=Count('user')).order_by('-mark_num')
user_ids = [user_rate['user'] for user_rate in users_rate]
user_ids.append(user_id)
users = User.objects.filter(id__in=user_ids)#users 为评分最多的10个用户
all_user = {}
for user in users:
rates = user.rate_set.all()#查出10名用户的数据
rate = {}
# 用户有给房源打分 在rate和all_user中进行设置
if rates:
for i in rates:
rate.setdefault(str(i.movie.id), i.mark)#填充房源数据
all_user.setdefault(user.username, rate)
else:
# 用户没有为房源打过分,设为0
all_user.setdefault(user.username, {})
user_cf = UserCf(all_user=all_user)
recommend_list = [each[0] for each in user_cf.recommend(current_user.username, 15)]
movie_list = list(xiangmu.objects.filter(id__in=recommend_list).order_by("-c9")[:15])
other_length = 15 - len(movie_list)
if other_length > 0:
fix_list = xiangmu.objects.filter(~Q(rate__user_id=user_id)).order_by('-collect')
for fix in fix_list:
if fix not in movie_list:
movie_list.append(fix)
if len(movie_list) >= 15:
break
return movie_list
# 计算相似度
def similarity(movie1_id, movie2_id):
movie1_set = Rate.objects.filter(movie_id=movie1_id)
# movie1的打分用户数
movie1_sum = movie1_set.count()
# movie_2的打分用户数
movie2_sum = Rate.objects.filter(movie_id=movie2_id).count()
# 两者的交集
common = Rate.objects.filter(user_id__in=Subquery(movie1_set.values('user_id')), movie=movie2_id).values('user_id').count()
# 没有人给当前房源打分
if movie1_sum == 0 or movie2_sum == 0:
return 0
similar_value = common / sqrt(movie1_sum * movie2_sum)#余弦计算相似度
return similar_value
#基于物品
def recommend_by_item_id(user_id, k=15):
# 前三的tag,用户评分前三的房源
user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
user_prefer = list(user_prefer)[:3]
print('user_prefer', user_prefer)
current_user = User.objects.get(id=user_id)
# 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
# 没有的话,就按照浏览度推荐15个
if current_user.rate_set.count() == 0:
if len(user_prefer) != 0:
movie_list = xiangmu.objects.filter(tags__in=user_prefer)[:15]
else:
movie_list = xiangmu.objects.order_by("-c9")[:15]
print('from here')
return movie_list
# most_tags = Tags.objects.annotate(tags_sum=Count('name')).order_by('-tags_sum').filter(movie__rate__user_id=user_id).order_by('-tags_sum')
# 选用户最喜欢的标签中的房源,用户没看过的30部,对这30部房源,计算距离最近
un_watched = xiangmu.objects.filter(~Q(rate__user_id=user_id), tags__in=user_prefer).order_by('?')[:30] # 看过的房源
watched = Rate.objects.filter(user_id=user_id).values_list('movie_id', 'mark')
distances = []
names = []
# 在未看过的房源中找到
for un_watched_movie in un_watched:
for watched_movie in watched:
if un_watched_movie not in names:
names.append(un_watched_movie)
distances.append((similarity(un_watched_movie.id, watched_movie[0]) * watched_movie[1], un_watched_movie))#加入相似的房源
distances.sort(key=lambda x: x[0], reverse=True)
print('this is distances', distances[:15])
recommend_list = []
for mark, movie in distances:
if len(recommend_list) >= k:
break
if movie not in recommend_list:
recommend_list.append(movie)
# print('this is recommend list', recommend_list)
# 如果得不到有效数量的推荐 按照未看过的房源中的热度进行填充
print('recommend list', recommend_list)
return recommend_list
if __name__ == '__main__':
# similarity(2003, 2008)
print(recommend_by_item_id(1799))
5、项目列表





AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)