Movie Recommendation Netflix

Movie Recommendation Netflix

Autre code source

Télécharger

Netflix-movie-recommendation-system

Recommandation de films-Netflix

Problème commercial

Description du problème

Netflix consiste à connecter les gens aux films qu'ils aiment. Pour aider les clients à trouver ces films, ils ont développé un système de recommandation de films de classe mondiale: CineMatchSM. Son travail consiste à prédire si quelqu'un appréciera un film en fonction de ce qu'il aimait ou n'aimait pas d'autres films. Netflix utilise ces prédictions pour faire des recommandations de films personnelles en fonction des goûts uniques de chaque client. Et bien que Cinematch se porte plutôt bien, il peut toujours être amélioré.

Maintenant, il existe de nombreuses approches alternatives intéressantes pour le fonctionnement de CineMatch que Netflix n'a pas essayé. Certains sont décrits dans la littérature, certains ne le sont pas. Nous sommes curieux de savoir si l'un de ces éléments peut battre Cinematch en faisant de meilleures prédictions. Parce que, franchement, s'il y a une bien meilleure approche, cela pourrait faire une grande différence pour nos clients et notre entreprise.

Crédits: https://www.netflixprize.com/rules.html

L'objectif de ce projet est de développer un système de recommandation #Datascience pour Netflix.

Peu de hashtags populaires -

`#DataScience` `#Netflix` `#Recommendation System`

`#Ratings` `#Movie PRediction` `#Numpy-Pandas`

Motivation

Netflix a fourni beaucoup de données de notation anonymes et une barre de précision de prédiction qui est 10% meilleure que ce que CineMatch peut faire sur le même ensemble de données de formation. (La précision est une mesure de la façon dont les notes prédites des films correspondent aux notes réelles ultérieures.)

À propos du projet

Prédire la note qu'un utilisateur donnerait à un film qu'il n'a pas encore évalué.
Minimiser la différence entre la notation prévue et réelle (RMSE et MAPE)

Étapes impliquées dans ce projet

Une certaine forme d'interprétabilité.
Problème d'apprentissage automatique
Données

Aperçu des données

Obtenez les données de: https://www.kaggle.com/netflix-inc/netflix-prize-data/data

Fichiers de données:

combiné_data_1.txt
combiné_data_2.txt
combiné_data_3.txt
combiné_data_4.txt
film_titles.csv

La première ligne de chaque fichier [combinée_data_1.txt, combinée_data_2.txt, combinée_data_3.txt, combinée_data_4.txt] contient l'ID de film suivi d'un côlon. Chaque ligne suivante du fichier correspond à une note d'un client et à sa date au format suivant:

CustomerId, note, date

Les films varient de 1 à 17770 séquentiellement. CustomerIDS varie de 1 à 2649429, avec des lacunes. Il y a 480189 utilisateurs. Les notes sont sur une échelle cinq étoiles (intégrale) de 1 à 5. Les dates ont le format yyyy-mm-dd.

 # Movie by Movie Similarity Matrix
start = datetime . now ()
if not os . path . isfile ( 'm_m_sim_sparse.npz' ):
    print ( "It seems you don't have that file. Computing movie_movie similarity..." )
    start = datetime . now ()
    m_m_sim_sparse = cosine_similarity ( X = train_sparse_matrix . T , dense_output = False )
    print ( "Done.." )
    # store this sparse matrix in disk before using it. For future purposes.
    print ( "Saving it to disk without the need of re-computing it again.. " )
    sparse . save_npz ( "m_m_sim_sparse.npz" , m_m_sim_sparse )
    print ( "Done.." )
else :
    print ( "It is there, We will get it." )
    m_m_sim_sparse = sparse . load_npz ( "m_m_sim_sparse.npz" )
    print ( "Done ..." )

print ( "It's a " , m_m_sim_sparse . shape , " dimensional matrix" )

print ( datetime . now () - start )

Cartographie du problème du monde réel à un problème d'apprentissage automatique

Type de problème d'apprentissage automatique

Pour un film et un utilisateur donné, nous devons prédire que la notation serait donnée par lui au film.
Le problème donné est un problème de recommandation
Il peut également être considéré comme un problème de régression

Métrique de performance

Erreur de pourcentage absolu moyen: https://en.wikipedia.org/wiki/mean_absolute_percentage_error
Erreur quadratique moyenne: https://en.wikipedia.org/wiki/root-mean-square_deviation

Objectif et contraintes d'apprentissage automatique

Minimiser RMSE.
Essayez de fournir une certaine interprétabilité.

Bibliothèques utilisées

Installation

Installez DateTime à l'aide de la commande PIP: from datetime import datetime
Installer des pandas à l'aide de la commande PIP: import pandas as pd
Installez Numpy à l'aide de la commande PIP: import numpy as np
Installez MatplotLib à l'aide de la commande PIP: import matplotlib
Installez Matplotlib.pyPlot à l'aide de la commande PIP: import matplotlib.pyplot as plt
Installer Seaborn en utilisant la commande PIP: import seaborn as sns
Installez le système d'exploitation à l'aide de la commande PIP: import os
Installez Scipy à l'aide de la commande PIP: from scipy import sparse
Installez scipy.spasse à l'aide de la commande pip: from scipy.sparse import csr_matrix
Installez Sklearn.Decomposition à l'aide de la commande PIP: from sklearn.decomposition import TruncatedSVD
Installer Skaryn.metrics.pairwise à l'aide de la commande PIP: from sklearn.metrics.pairwise import cosine_similarity
Installer aléatoire à l'aide de la commande pip: import random

Comment courir?

 knn_bsl_u         1.0726493739667242
knn_bsl_m          1.072758832653683
svdpp             1.0728491944183447
bsl_algo          1.0730330260516174
xgb_knn_bsl_mu    1.0753229281412784
xgb_all_models     1.075480663561971
first_algo        1.0761851474385373
xgb_bsl           1.0763419061709816
xgb_final         1.0763580984894978
xgb_knn_bsl       1.0763602465199797
Name: rmse, dtype: object

Rapports de projet

Télécharger pour le rapport.

Liens utiles

https://www.netflixprize.com/rules.html
https://www.kaggle.com/netflix-inc/netflix-prize-data
Blog Netflix: https://medium.com/netflix-techblog/netflix-recommendations-Beyond-the-5-stars-part-1-55838468f429 (très beau blog)
Bibliothèque surprise: http://surpriselib.com/ (nous utilisons de nombreux modèles de cette bibliothèque)
Doc surprise de la bibliothèque: http://surprise.readthedocs.io/en/stable/getting_started.html (nous utilisons de nombreux modèles de cette bibliothèque)
Installation de surprise: https://github.com/nicolashug/surprise#installation
Document de recherche: http://courses.ischool.berkeley.edu/i290-dm/s11/secure/a1-koren.pdf (la plupart de nos travaux ont été inspirés par ce document)
Décomposition SVD: https://www.youtube.com/watch?v=p5mlg91as1c

Rapport - Un rapport détaillé sur l'analyse

Contributif

Cloner ce référentiel:

git clone https://github.com/iamsivab/Movie-Recommendation-Netflix.git

Consultez tout problème à partir d'ici.
Apporter des modifications et envoyer une demande de traction.

Besoin d'aide?

? N'hésitez pas à me contacter @ [email protected]

Licence

Développer

Informations supplémentaires

Version
Type Autre code source
Date de mise à jour 2025-01-31
taille 809.56KB
Provenant de Github

Applications connexes

Netflix Download Premium

2024-11-06
Katana ZÉRO NETFLIX version chinoise

2024-03-21
Hadès NETFLIX

2024-03-06
Word Trails NETFLIX version chinoise

2023-12-14
NETFLIX version chinoise

2023-03-31
Équipement de film GIF

2009-05-30

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
SmartTube

Autre code source

24.71 Stable
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout