Movie Recommendation Netflix

Movie Recommendation Netflix

Otro código fuente

Descargar

Netflix-movie-recomendación-sistema

Película Recomendación-Netflix

Problema comercial

Descripción del problema

Netflix se trata de conectar a las personas con el cine que aman. Para ayudar a los clientes a encontrar esas películas, desarrollaron un sistema de recomendación de películas de clase mundial: Cinematchsm. Su trabajo es predecir si alguien disfrutará de una película en función de cuánto le gustaba o no le gustaban otras películas. Netflix usa esas predicciones para hacer recomendaciones de películas personales basadas en los gustos únicos de cada cliente. Y aunque Cinematch está funcionando bastante bien, siempre se puede mejorar.

Ahora hay muchos enfoques alternativos interesantes sobre cómo funciona Cinematch que Netflix no ha probado. Algunos se describen en la literatura, otros no. Tenemos curiosidad por saber si alguno de estos puede vencer a Cinematch haciendo mejores predicciones. Porque, francamente, si hay un enfoque mucho mejor, podría marcar una gran diferencia para nuestros clientes y nuestro negocio.

Créditos: https://www.netflixprize.com/rules.html

El objetivo de este proyecto es desarrollar un sistema de recomendación #DataScience para Netflix.

Pocos hashtags populares -

`#DataScience` `#Netflix` `#Recommendation System`

`#Ratings` `#Movie PRediction` `#Numpy-Pandas`

Motivación

Netflix proporcionó muchos datos de calificación anónima y una barra de precisión de predicción que es un 10% mejor que lo que Cinematch puede hacer en el mismo conjunto de datos de capacitación. (La precisión es una medida de cómo las calificaciones estrechamente predichas de las películas coinciden con las calificaciones reales posteriores).

Sobre el proyecto

Predecir la calificación que un usuario le daría a una película que aún no calificó.
Minimizar la diferencia entre la calificación prevista y real (RMSE y MAPE)

Pasos involucrados en este proyecto

Alguna forma de interpretabilidad.
Problema de aprendizaje automático
Datos

Descripción general de los datos

Obtenga los datos de: https://www.kaggle.com/netflix-inc/netflix-prize-data/data

Archivos de datos:

combined_data_1.txt
combined_data_2.txt
combined_data_3.txt
combined_data_4.txt
película_titles.csv

La primera línea de cada archivo [combined_data_1.txt, combined_data_2.txt, combined_data_3.txt, combined_data_4.txt] contiene la ID de la película seguida de un colon. Cada línea posterior en el archivo corresponde a una calificación de un cliente y su fecha en el siguiente formato:

Cliente, calificación, fecha

Los películas varían de 1 a 17770 secuencialmente. Los clientes varían de 1 a 2649429, con huecos. Hay 480189 usuarios. Las clasificaciones están en una escala de cinco estrellas (integral) de 1 a 5. Las fechas tienen el formato yyyy-mm-dd.

 # Movie by Movie Similarity Matrix
start = datetime . now ()
if not os . path . isfile ( 'm_m_sim_sparse.npz' ):
    print ( "It seems you don't have that file. Computing movie_movie similarity..." )
    start = datetime . now ()
    m_m_sim_sparse = cosine_similarity ( X = train_sparse_matrix . T , dense_output = False )
    print ( "Done.." )
    # store this sparse matrix in disk before using it. For future purposes.
    print ( "Saving it to disk without the need of re-computing it again.. " )
    sparse . save_npz ( "m_m_sim_sparse.npz" , m_m_sim_sparse )
    print ( "Done.." )
else :
    print ( "It is there, We will get it." )
    m_m_sim_sparse = sparse . load_npz ( "m_m_sim_sparse.npz" )
    print ( "Done ..." )

print ( "It's a " , m_m_sim_sparse . shape , " dimensional matrix" )

print ( datetime . now () - start )

Mapear el problema del mundo real a un problema de aprendizaje automático

Tipo de problema de aprendizaje automático

Para una película y usuario determinado, debemos predecir que la calificación sería otorgada por él/ella a la película.
El problema dado es un problema de recomendación
También se puede ver como un problema de regresión

Métrico de rendimiento

Error de porcentaje absoluto medio: https://en.wikipedia.org/wiki/mean_absolute_percentage_error
Error cuadrado medio root: https://en.wikipedia.org/wiki/root-mean-square_deviation

Objetivo y restricciones de aprendizaje automático

Minimizar RMSE.
Trate de proporcionar cierta interpretabilidad.

Bibliotecas utilizadas

Instalación

Instale el comando de fecha y hora usando PIP: from datetime import datetime
Instale pandas usando el comando pip: import pandas as pd
Instalar numpy usando el comando pip: import numpy as np
Instale Matplotlib usando el comando PIP: import matplotlib
Instalar matplotlib.pyplot usando el comando pip: import matplotlib.pyplot as plt
Instale SeaBorn usando el comando PIP: import seaborn as sns
Instale el sistema operativo con el comando pip: import os
Instale Scipy usando el comando PIP: from scipy import sparse
Instalar scipy.sparse usando el comando pip: from scipy.sparse import csr_matrix
Instalar sklearn.decomposition usando el comando pip: from sklearn.decomposition import TruncatedSVD
Instalar sklearn.metrics.Pairwise usando el comando PIP: from sklearn.metrics.pairwise import cosine_similarity
Instalar aleatorio usando el comando pip: import random

¿Cómo correr?

 knn_bsl_u         1.0726493739667242
knn_bsl_m          1.072758832653683
svdpp             1.0728491944183447
bsl_algo          1.0730330260516174
xgb_knn_bsl_mu    1.0753229281412784
xgb_all_models     1.075480663561971
first_algo        1.0761851474385373
xgb_bsl           1.0763419061709816
xgb_final         1.0763580984894978
xgb_knn_bsl       1.0763602465199797
Name: rmse, dtype: object

Informes de proyectos

Descargar para el informe.

Enlaces útiles

https://www.netflixprize.com/rules.html
https://www.kaggle.com/netflix-inc/netflix-prize-data
Blog de Netflix: https://medium.com/netflix-techblog/netflix-recommendations-beyond-the-5-stars-part-1-55838468f429 (muy buen blog)
Biblioteca sorpresa: http://surpriselib.com/ (usamos muchos modelos de esta biblioteca)
Surprise de la biblioteca Doc: http://surprise.readthedocs.io/en/stable/getting_started.html (usamos muchos modelos de esta biblioteca)
Instalación de sorpresa: https://github.com/nicolashug/surprise#installation
Documento de investigación: http://courses.ischool.berkeley.edu/i290-dm/s11/secure/a1-koren.pdf (la mayor parte de nuestro trabajo se inspiró en este documento)
Descomposición de SVD: https://www.youtube.com/watch?v=p5mlg91as1c

Informe: un informe detallado sobre el análisis

Que contribuye

Clon este repositorio:

git clone https://github.com/iamsivab/Movie-Recommendation-Netflix.git

Mira cualquier problema desde aquí.
Hacer cambios y enviar solicitud de extracción.

¿Necesitar ayuda?

? No dude en contactarme @ [email protected]

Licencia

Expandir

Información adicional

Versión
Tipo Otro código fuente
Fecha de actualización 2025-01-31
tamaño 809.56KB
Proviene de Github

Aplicaciones relacionadas

Netflix Download Premium

2024-11-06
Katana ZERO NETFLIX versión china

2024-03-21
infiernonetflix

2024-03-06
Word Trails NETFLIX versión china

2023-12-14
NETFLIX versión china

2023-03-31
Equipo de película GIF

2009-05-30

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
SmartTube

Otro código fuente

24.71 Stable
Sunamu

Otro código fuente

Release 2.2.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo