Ein Buchempfehlungssystem ist ein Tool, das Benutzern Bücher basierend auf ihren Interessen und ihrer Lesegeschichte vorschlägt. Diese Systeme können von Bibliotheken, Buchhandlungen oder Online-Händlern genutzt werden, um Benutzern dabei zu helfen, neue Bücher zu entdecken, die ihnen gefallen könnten.
Es gibt verschiedene Ansätze zum Aufbau eines Buchempfehlungssystems, darunter kollaboratives Filtern, inhaltsbasiertes Filtern und Hybridsysteme, die beide Ansätze kombinieren.
Die kollaborative Filterung basiert auf der Idee, dass Benutzer mit einer ähnlichen Lesehistorie wahrscheinlich ähnliche Interessen haben, sodass ein Buch, das einem Benutzer gefällt, wahrscheinlich von einem anderen Benutzer mit einer ähnlichen Lesehistorie genossen wird. Dieser Ansatz wird häufig in Empfehlungssystemen für Filme, Musik und andere Produkte verwendet.
Die inhaltsbasierte Filterung hingegen konzentriert sich auf die Merkmale der Bücher selbst, wie etwa deren Genre, Thema und Autor, um Empfehlungen abzugeben. Dieser Ansatz ist nützlich, wenn nicht genügend Daten über die Benutzerpräferenzen verfügbar sind, um die kollaborative Filterung zu verwenden.
Hybridsysteme kombinieren sowohl kollaboratives Filtern als auch inhaltsbasiertes Filtern, um Empfehlungen abzugeben. Sie können sowohl die Eigenschaften der Bücher als auch die Vorlieben der Benutzer berücksichtigen, um eine individuellere Empfehlung abzugeben.
Beim Aufbau eines effektiven Buchempfehlungssystems gibt es mehrere Herausforderungen, darunter die Notwendigkeit großer Datenmengen zum Trainieren des Systems, die Komplexität der Verarbeitung natürlicher Sprache und die Notwendigkeit, die Personalisierung von Empfehlungen mit der Vielfalt der empfohlenen Bücher in Einklang zu bringen.
Der Book-Crossing-Datensatz besteht aus 3 Dateien.
Benutzer: Enthält die Benutzer. Beachten Sie, dass Benutzer-IDs (Benutzer-ID) anonymisiert wurden und Ganzzahlen zugeordnet werden. Sofern verfügbar, werden demografische Daten (Standort, Alter) bereitgestellt. Andernfalls enthalten diese Felder NULL-Werte.
Bücher: Bücher werden durch ihre jeweilige ISBN identifiziert. Ungültige ISBNs wurden bereits aus dem Datensatz entfernt. Darüber hinaus werden einige inhaltsbezogene Informationen (Buchtitel, Buchautor, Erscheinungsjahr, Verlag) angegeben, die von Amazon Web Services bezogen werden. Beachten Sie, dass bei mehreren Autoren nur der erste angegeben wird. Es werden auch URLs angegeben, die auf Titelbilder verweisen, und zwar in drei verschiedenen Varianten (Bild-URL-S, Bild-URL-M, Bild-URL-L), also klein, mittel und groß. Diese URLs verweisen auf die Amazon-Website.
Bewertungen: Enthält Informationen zur Buchbewertung. Bewertungen (Buchbewertung) sind entweder explizit, ausgedrückt auf einer Skala von 1 bis 10 (höhere Werte bedeuten eine höhere Wertschätzung), oder implizit, ausgedrückt durch 0.
Link zu Datensätzen: - https://drive.google.com/drive/folders/1Gi0wMWCTigA_rJSi9huyT51lKduBSv43?usp=share_link