Movie Recommendation Netflix

Movie Recommendation Netflix

شفرة المصدر الأخرى

تنزيل

نظام توصية Netflix-Movie

توصية الأفلام netflix

مشكلة العمل

وصف المشكلة

Netflix يدور حول توصيل الأشخاص بالأفلام التي يحبونها. لمساعدة العملاء في العثور على هذه الأفلام ، قاموا بتطوير نظام توصية للأفلام على مستوى عالمي: CinematchSM. تتمثل مهمتها في التنبؤ بما إذا كان شخص ما سيستمتع بفيلم بناءً على مقدار ما يحبونه أو يكرهونه. تستخدم Netflix هذه التنبؤات لتقديم توصيات أفلام شخصية بناءً على الأذواق الفريدة لكل عميل. وعلى الرغم من أن Cinematch تعمل بشكل جيد ، إلا أنه يمكن دائمًا تحسينه.

الآن هناك الكثير من الأساليب البديلة المثيرة للاهتمام لكيفية عمل Cinematch الذي لم يحاول Netflix. بعضها موصوف في الأدب ، والبعض الآخر ليس كذلك. نحن مهتمون بما إذا كان أي من هؤلاء يمكنه التغلب على دور السينما من خلال تقديم تنبؤات أفضل. لأنه ، بصراحة ، إذا كان هناك طريقة أفضل بكثير ، فقد تحدث فرقًا كبيرًا لعملائنا وأعمالنا.

الاعتمادات: https://www.netflixprize.com/rules.html

الهدف من هذا المشروع هو تطوير نظام التوظيف #DataScience لـ Netflix.

قلة من علامات التجزئة الشعبية -

`#DataScience` `#Netflix` `#Recommendation System`

`#Ratings` `#Movie PRediction` `#Numpy-Pandas`

تحفيز

قدمت Netflix الكثير من بيانات التصنيف المجهولة ، وشريط دقة التنبؤ أفضل بنسبة 10 ٪ مما يمكن أن تفعله Cinematch في نفس مجموعة بيانات التدريب. (الدقة هي قياس كيف تتطابق تقييمات الأفلام المتوقعة بشكل وثيق مع التصنيفات الفعلية اللاحقة.)

حول المشروع

توقع التصنيف الذي سيعطيه المستخدم لفيلم لم يسبق له هو تقييمه بعد.
قلل من الفرق بين التصنيف المتوقع والفعلي (RMSE و MAPE)

الخطوات التي ينطوي عليها هذا المشروع

شكل من أشكال التفسير.
مشكلة التعلم الآلي
بيانات

نظرة عامة على البيانات

احصل على البيانات من: https://www.kaggle.com/netflix-inc/netflix-prize-data/data

ملفات البيانات:

combined_data_1.txt
combined_data_2.txt
combined_data_3.txt
combined_data_4.txt
Movie_titles.csv

السطر الأول من كل ملف [combined_data_1.txt ، combined_data_2.txt ، combined_data_3.txt ، combined_data_4.txt] يحتوي على معرف الفيلم متبوعًا بالقولون. يتوافق كل سطر لاحق في الملف مع تصنيف من العميل وتاريخه بالتنسيق التالي:

CustomerId ، تصنيف ، تاريخ

تتراوح السينما من 1 إلى 17770 بالتتابع. يتراوح العميلون من 1 إلى 2649429 ، مع الثغرات. هناك 480189 مستخدم. التصنيفات على مقياس من خمسة نجوم (متكاملة) من 1 إلى 5. التواريخ لها تنسيق yyyy-mm-dd.

 # Movie by Movie Similarity Matrix
start = datetime . now ()
if not os . path . isfile ( 'm_m_sim_sparse.npz' ):
    print ( "It seems you don't have that file. Computing movie_movie similarity..." )
    start = datetime . now ()
    m_m_sim_sparse = cosine_similarity ( X = train_sparse_matrix . T , dense_output = False )
    print ( "Done.." )
    # store this sparse matrix in disk before using it. For future purposes.
    print ( "Saving it to disk without the need of re-computing it again.. " )
    sparse . save_npz ( "m_m_sim_sparse.npz" , m_m_sim_sparse )
    print ( "Done.." )
else :
    print ( "It is there, We will get it." )
    m_m_sim_sparse = sparse . load_npz ( "m_m_sim_sparse.npz" )
    print ( "Done ..." )

print ( "It's a " , m_m_sim_sparse . shape , " dimensional matrix" )

print ( datetime . now () - start )

تعيين مشكلة العالم الحقيقي لمشكلة التعلم الآلي

نوع مشكلة التعلم الآلي

بالنسبة لفيلم معين ومستخدم ، نحتاج إلى التنبؤ بالتصنيف الذي سيعطيه من قبله إلى الفيلم.
المشكلة المحددة هي مشكلة توصية
يمكن أن ينظر إليه أيضًا على أنه مشكلة في الانحدار

مقياس الأداء

يعني خطأ النسبة المئوية: https://en.wikipedia.org/wiki/mean_absolute_percentage_error
جذر متوسط خطأ مربع: https://en.wikipedia.org/wiki/Root-Mean-Square_Deviation

هدف التعلم الآلي والقيود

تقليل RMSE.
حاول توفير بعض القابلية للتفسير.

المكتبات المستخدمة

تثبيت

تثبيت DateTime باستخدام أمر PIP: from datetime import datetime
تثبيت الباندا باستخدام أمر PIP: import pandas as pd
تثبيت numpy باستخدام أمر PIP: import numpy as np
تثبيت matplotlib باستخدام أمر PIP: import matplotlib
تثبيت matplotlib.pyplot باستخدام أمر PIP: import matplotlib.pyplot as plt
تثبيت SeaBorn باستخدام PIP Command: import seaborn as sns
تثبيت نظام التشغيل باستخدام أمر PIP: import os
قم بتثبيت Scipy باستخدام أمر PIP: from scipy import sparse
تثبيت scipy.sparse باستخدام أمر PIP: from scipy.sparse import csr_matrix
تثبيت sklearn.decification باستخدام أمر PIP: from sklearn.decomposition import TruncatedSVD
تثبيت sklearn.metrics.pairwise باستخدام أمر PIP: from sklearn.metrics.pairwise import cosine_similarity
تثبيت عشوائي باستخدام أمر PIP: import random

كيف تركض؟

 knn_bsl_u         1.0726493739667242
knn_bsl_m          1.072758832653683
svdpp             1.0728491944183447
bsl_algo          1.0730330260516174
xgb_knn_bsl_mu    1.0753229281412784
xgb_all_models     1.075480663561971
first_algo        1.0761851474385373
xgb_bsl           1.0763419061709816
xgb_final         1.0763580984894978
xgb_knn_bsl       1.0763602465199797
Name: rmse, dtype: object

تقارير المشروع

تنزيل للتقرير.

روابط مفيدة

https://www.netflixprize.com/rules.html
https://www.kaggle.com/netflix-inc/netflix-prize-data
Netflix Blog: https://medium.com/netflix-techblog/netflix-recommendations-beyond-the-5-stars-bart-1-55838468f429 (مدونة لطيفة للغاية)
مكتبة مفاجأة: http://surpriselib.com/ (نستخدم العديد من النماذج من هذه المكتبة)
مستند مكتبة مفاجأة: http://surprise.readthedocs.io/en/stable/getting_started.html (نستخدم العديد من النماذج من هذه المكتبة)
تثبيت مفاجأة: https://github.com/nicoLashug/Surprise#installation
ورقة بحث:
تحلل SVD: https://www.youtube.com/watch؟v=P5MLG91AS1C

تقرير - تقرير مفصل عن التحليل

المساهمة

استنساخ هذا المستودع:

git clone https://github.com/iamsivab/Movie-Recommendation-Netflix.git

تحقق من أي مشكلة من هنا.
قم بإجراء تغييرات وأرسل طلب السحب.

هل تحتاج إلى مساعدة؟

؟ لا تتردد في الاتصال بي @ [email protected]

رخصة

يوسع

معلومات إضافية

الإصدار
النوع شفرة المصدر الأخرى
وقت التحديث 2025-01-31
الحجم 809.56KB
من Github

تطبيقات ذات صلة

Netflix Download Premium

2024-11-06
كاتانا زيرو NETFLIX النسخة الصينية

2024-03-21
هاديس نيتفليكس

2024-03-06
Word Trails NETFLIX النسخة الصينية

2023-12-14
نتفلكس النسخة الصينية

2023-03-31
GIF فيلم جير

2009-05-30

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
SmartTube

شفرة المصدر الأخرى

24.71 Stable
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل