Movie Recommendation Netflix

Movie Recommendation Netflix

Kode sumber lainnya

Unduh

Sistem Netflix-Movie-Commendation

Netflix-film-rekmendasi

Masalah bisnis

Deskripsi masalah

Netflix adalah tentang menghubungkan orang ke film yang mereka sukai. Untuk membantu pelanggan menemukan film-film itu, mereka mengembangkan sistem rekomendasi film kelas dunia: Cinematchsm. Tugasnya adalah memprediksi apakah seseorang akan menikmati film berdasarkan seberapa besar mereka menyukai atau tidak menyukai film lain. Netflix menggunakan prediksi tersebut untuk membuat rekomendasi film pribadi berdasarkan selera unik masing -masing pelanggan. Dan sementara Cinematch melakukannya dengan cukup baik, itu selalu bisa dibuat lebih baik.

Sekarang ada banyak pendekatan alternatif yang menarik tentang cara kerja Cinematch yang belum dicoba oleh Netflix. Beberapa dijelaskan dalam literatur, beberapa tidak. Kami ingin tahu apakah semua ini dapat mengalahkan Cinematch dengan membuat prediksi yang lebih baik. Karena, terus terang, jika ada pendekatan yang jauh lebih baik, itu bisa membuat perbedaan besar bagi pelanggan kami dan bisnis kami.

Kredit: https://www.netflixprize.com/rules.html

Tujuan dari proyek ini adalah untuk mengembangkan sistem rekomendasi #DataScience untuk Netflix.

Beberapa tagar populer -

`#DataScience` `#Netflix` `#Recommendation System`

`#Ratings` `#Movie PRediction` `#Numpy-Pandas`

Motivasi

Netflix menyediakan banyak data peringkat anonim, dan bilah akurasi prediksi yang 10% lebih baik daripada apa yang dapat dilakukan Cinematch pada set data pelatihan yang sama. (Akurasi adalah pengukuran seberapa dekat peringkat film yang diprediksi cocok dengan peringkat aktual berikutnya.)

Tentang proyek

Memprediksi peringkat yang akan diberikan pengguna kepada film yang belum dinilai oleh AHS.
Minimalkan perbedaan antara peringkat yang diprediksi dan aktual (RMSE dan MAPE)

Langkah -langkah yang terlibat dalam proyek ini

Beberapa bentuk interpretabilitas.
Masalah Pembelajaran Mesin
Data

Tinjauan Data

Dapatkan data dari: https://www.kaggle.com/netflix-inc/netflix-prize-data/data

File Data:

gabungan_data_1.txt
gabungan_data_2.txt
gabungan_data_3.txt
gabungan_data_4.txt
film_titles.csv

Baris pertama dari setiap file [gabungan_data_1.txt, gabungan_data_2.txt, gabungan_data_3.txt, gabungan_data_4.txt] berisi ID film yang diikuti oleh usus besar. Setiap baris berikutnya dalam file sesuai dengan peringkat dari pelanggan dan tanggal dalam format berikut:

Customerid, rating, tanggal

MovieIds berkisar dari 1 hingga 17770 secara berurutan. CustomerIds berkisar dari 1 hingga 2649429, dengan kesenjangan. Ada 480189 pengguna. Peringkat berada pada skala lima bintang (integral) dari 1 hingga 5. Tanggal memiliki format yyyy-mm-dd.

 # Movie by Movie Similarity Matrix
start = datetime . now ()
if not os . path . isfile ( 'm_m_sim_sparse.npz' ):
    print ( "It seems you don't have that file. Computing movie_movie similarity..." )
    start = datetime . now ()
    m_m_sim_sparse = cosine_similarity ( X = train_sparse_matrix . T , dense_output = False )
    print ( "Done.." )
    # store this sparse matrix in disk before using it. For future purposes.
    print ( "Saving it to disk without the need of re-computing it again.. " )
    sparse . save_npz ( "m_m_sim_sparse.npz" , m_m_sim_sparse )
    print ( "Done.." )
else :
    print ( "It is there, We will get it." )
    m_m_sim_sparse = sparse . load_npz ( "m_m_sim_sparse.npz" )
    print ( "Done ..." )

print ( "It's a " , m_m_sim_sparse . shape , " dimensional matrix" )

print ( datetime . now () - start )

Memetakan masalah dunia nyata ke masalah pembelajaran mesin

Jenis masalah pembelajaran mesin

Untuk film dan pengguna tertentu, kita perlu memprediksi peringkat akan diberikan olehnya ke film.
Masalah yang diberikan adalah masalah rekomendasi
Itu juga dapat dilihat sebagai masalah regresi

Metrik kinerja

Rata -rata kesalahan persentase absolut: https://en.wikipedia.org/wiki/mean_absolute_percentage_error
Root rata-rata kesalahan kuadrat: https://en.wikipedia.org/wiki/root-mean-square_deviation

Tujuan dan Kendala Pembelajaran Mesin

Meminimalkan RMSE.
Cobalah untuk memberikan beberapa interpretabilitas.

Perpustakaan digunakan

Instalasi

Instal DateTime Menggunakan Pip Perintah: from datetime import datetime
Instal Panda Menggunakan Perintah PIP: import pandas as pd
Instal Numpy Menggunakan Pip Command: import numpy as np
Instal Matplotlib Menggunakan Pip Perintah: import matplotlib
Instal matplotlib.pyplot menggunakan perintah PIP: import matplotlib.pyplot as plt
Pasang Seorn menggunakan perintah PIP: import seaborn as sns
Instal OS Menggunakan Pip Command: import os
Instal Scipy Menggunakan Pip Command: from scipy import sparse
Instal Scipy.Sparse Menggunakan Pip Command: from scipy.sparse import csr_matrix
Instal sklearn.decomposition menggunakan perintah PIP: from sklearn.decomposition import TruncatedSVD
Instal sklearn.metrics.pairwise menggunakan perintah PIP: from sklearn.metrics.pairwise import cosine_similarity
Instal Random Menggunakan Pip Command: import random

Bagaimana cara berlari?

 knn_bsl_u         1.0726493739667242
knn_bsl_m          1.072758832653683
svdpp             1.0728491944183447
bsl_algo          1.0730330260516174
xgb_knn_bsl_mu    1.0753229281412784
xgb_all_models     1.075480663561971
first_algo        1.0761851474385373
xgb_bsl           1.0763419061709816
xgb_final         1.0763580984894978
xgb_knn_bsl       1.0763602465199797
Name: rmse, dtype: object

Laporan Proyek

Unduh untuk laporan tersebut.

Tautan yang berguna

https://www.netflixprize.com/rules.html
https://www.kaggle.com/netflix-inc/netflix-prize-data
Netflix Blog: https://medium.com/netflix-techblog/netflix-recommendations-beyond-the-5-stars-part-1-55838468f429 (blog yang sangat bagus)
Perpustakaan Kejutan: http://surpriselib.com/ (kami menggunakan banyak model dari perpustakaan ini)
Surprise Library Doc: http://surprise.readthedocs.io/en/stable/getting_started.html (kami menggunakan banyak model dari perpustakaan ini)
Menginstal Kejutan: https://github.com/nicolashug/surprise#installation
Makalah Penelitian: http://courses.ischool.berkeley.edu/i290-dm/s11/secure/a1-koren.pdf (sebagian besar pekerjaan kami terinspirasi oleh makalah ini)
Dekomposisi SVD: https://www.youtube.com/watch?v=p5mlg91as1c

Laporan - Laporan terperinci tentang analisis

Berkontribusi

Klon Repositori ini:

git clone https://github.com/iamsivab/Movie-Recommendation-Netflix.git

Lihat masalah apa pun dari sini.
Membuat perubahan dan mengirim permintaan tarik.

Butuh bantuan?

? Jangan ragu untuk menghubungi saya @ [email protected]

Lisensi

Memperluas

Informasi Tambahan

Versi
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-01-31
ukuran 809.56KB
Berasal dari Github

Aplikasi Terkait

Netflix Download Premium

2024-11-06
Katana ZERO NETFLIX versi Cina

2024-03-21
Hades NETFLIX

2024-03-06
Jejak Kata NETFLIX versi Cina

2023-12-14
NETFLIX versi Cina

2023-03-31
Perlengkapan Film GIF

2009-05-30

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
SmartTube

Kode sumber lainnya

24.71 Stable
Sunamu

Kode sumber lainnya

Release 2.2.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua