Python基于用户协同过滤算法的电影推荐代码demo

2017-06-03 董付国 Python小屋 Python小屋

这是上午上课时即兴发挥并现场编写的一段小代码,稍微美化一下分享。

思路:假设已有若干用户名字及其喜欢的电影清单,现有某用户,已看过并喜欢一些电影,现在想找个新电影看看,又不知道看什么好。根据已有数据,查找与该用户爱好最相似的用户,也就是看过并喜欢的电影与该用户最接近,然后从那个用户喜欢的电影中选取一个当前用户还没看过的电影,进行推荐。

本文主要演示Python内置函数以及内置字典与集合的用法。

from random import randrange


# 其他用户喜欢看的电影清单
data = {'user'+str(i):\
        {'film'+str(randrange(1, 10))\
         for j in range(randrange(15))}\
        for i in range(10)}


# 待测用户曾经看过并感觉不错的电影
user = {'film1', 'film2', 'film3'}

# 查找与待测用户最相似的用户和Ta喜欢看的电影
similarUser, films = max(data.items(),\
                         key=lambda item:\
                         len(item[1]&user))


print('历史数据:')
for u, f in data.items():
    print(u, f, sep=':')
print('和您最相似的用户是:', similarUser)
print('Ta最喜欢看的电影是:', films)
print('Ta看过的电影中您还没看过的有:', films-user)


某次运行结果:

历史数据:
user0:{'film9', 'film1'}
user1:{'film4', 'film2', 'film5', 'film9', 'film8', 'film1', 'film6'}
user2:{'film2', 'film5', 'film3', 'film7', 'film8', 'film1', 'film6'}
user3:{'film1', 'film3', 'film6', 'film2'}
user4:{'film4', 'film9', 'film3', 'film8', 'film1', 'film6'}
user5:{'film1', 'film7'}
user6:{'film4', 'film2', 'film5', 'film3', 'film7', 'film8', 'film1', 'film6'}
user7:{'film4', 'film2', 'film5', 'film9', 'film8', 'film1', 'film6'}
user8:{'film5', 'film9', 'film8'}
user9:{'film4', 'film5', 'film3', 'film7', 'film8', 'film1', 'film6'}
和您最相似的用户是: user2
Ta最喜欢看的电影是: {'film2', 'film5', 'film3', 'film7', 'film8', 'film1', 'film6'}
Ta看过的电影中您还没看过的有: {'film5', 'film6', 'film7', 'film8'}