نظام التوصية بالكتب هو أداة تقترح الكتب على المستخدمين بناءً على اهتماماتهم وتاريخ القراءة. يمكن استخدام هذه الأنظمة من قبل المكتبات أو المكتبات أو تجار التجزئة عبر الإنترنت لمساعدة المستخدمين على اكتشاف كتب جديدة قد يستمتعون بها.
هناك عدة طرق لبناء نظام التوصية بالكتب، بما في ذلك التصفية التعاونية، والتصفية القائمة على المحتوى، والأنظمة الهجينة التي تجمع بين كلا النهجين.
تعتمد التصفية التعاونية على فكرة أن المستخدمين الذين لديهم تواريخ قراءة مماثلة من المرجح أن تكون لديهم اهتمامات مماثلة، وبالتالي فإن الكتاب الذي يحبه أحد المستخدمين من المرجح أن يستمتع به مستخدم آخر له سجل قراءة مماثل. يُستخدم هذا الأسلوب غالبًا في أنظمة التوصية للأفلام والموسيقى وغيرها من المنتجات.
من ناحية أخرى، تركز التصفية المستندة إلى المحتوى على خصائص الكتب نفسها، مثل نوعها وموضوعها ومؤلفها، لتقديم التوصيات. يكون هذا الأسلوب مفيدًا عندما لا تتوفر بيانات كافية حول تفضيلات المستخدمين لاستخدام التصفية التعاونية.
تجمع الأنظمة الهجينة بين التصفية التعاونية والتصفية المستندة إلى المحتوى لتقديم التوصيات. يمكنهم أن يأخذوا في الاعتبار خصائص الكتب وتفضيلات المستخدمين لتقديم توصية أكثر تخصيصًا.
هناك العديد من التحديات التي تواجه بناء نظام فعال للتوصية بالكتب، بما في ذلك الحاجة إلى كميات كبيرة من البيانات لتدريب النظام، وتعقيد معالجة اللغة الطبيعية، والحاجة إلى تحقيق التوازن بين تخصيص التوصيات وتنوع الكتب الموصى بها.
تتكون مجموعة بيانات Book-Crossing من 3 ملفات.
المستخدمون: يحتوي على المستخدمين. لاحظ أنه تم إخفاء هوية معرفات المستخدم (معرف المستخدم) وتعيينها للأعداد الصحيحة. يتم توفير البيانات الديموغرافية (الموقع، العمر) إذا كانت متوفرة. وإلا، فستحتوي هذه الحقول على قيم فارغة.
الكتب: يتم تحديد الكتب من خلال رقم ISBN الخاص بها. تمت بالفعل إزالة أرقام ISBN غير الصالحة من مجموعة البيانات. علاوة على ذلك، يتم تقديم بعض المعلومات المستندة إلى المحتوى (عنوان الكتاب، مؤلف الكتاب، سنة النشر، الناشر)، والتي تم الحصول عليها من Amazon Web Services. لاحظ أنه في حالة وجود العديد من المؤلفين، يتم توفير الأول فقط. تتوفر أيضًا عناوين URL المرتبطة بصور الغلاف، وتظهر بثلاثة أنواع مختلفة (Image-URL-S، وImage-URL-M، وImage-URL-L)، أي صغيرة ومتوسطة وكبيرة. تشير عناوين URL هذه إلى موقع أمازون الإلكتروني.
التقييمات: تحتوي على معلومات تصنيف الكتاب. تكون التقييمات (تقييم الكتاب) إما صريحة، ويتم التعبير عنها على مقياس من 1 إلى 10 (تشير القيم الأعلى إلى تقدير أعلى)، أو ضمنية، ويتم التعبير عنها بـ 0.
رابط مجموعات البيانات: - https://drive.google.com/drive/folders/1Gi0wMWCTigA_rJSi9huyT51lKduBSv43?usp=share_link