电影推荐与内存控制:Elasticsearch 实战解析
1. 电影数据与推荐策略
1.1 数据概述
在电影数据集中,mlmovies中的每个文档代表一部电影,关键数据为电影的_id和标题,offset和bytes可忽略。该数据集包含 10,681 部电影。而mlratings则记录了用户的电影推荐信息,每个文档代表一个用户,user字段为用户 ID,movie字段列出了该用户观看并推荐的电影列表。
1.2 基于流行度的推荐
我们以《塔拉迪加之夜:瑞奇鲍比的民谣》(Talladega Nights: The Ballad of Ricky Bobby)为例,尝试基于流行度进行电影推荐。具体步骤如下:
1.查找电影 ID:
GET mlmovies/_search { "query": { "match": { "title": "Talladega Nights" } } }通过上述查询,可知《塔拉迪加之夜》的 ID 为 46970。
2.筛选并聚合推荐:
GET