Un sistema de recomendación de libros es una herramienta que sugiere libros a los usuarios en función de sus intereses e historial de lectura. Estos sistemas pueden ser utilizados por bibliotecas, librerías o minoristas en línea para ayudar a los usuarios a descubrir nuevos libros que puedan disfrutar.
Existen varios enfoques para crear un sistema de recomendación de libros, incluido el filtrado colaborativo, el filtrado basado en contenido y sistemas híbridos que combinan ambos enfoques.
El filtrado colaborativo se basa en la idea de que los usuarios que tienen historiales de lectura similares probablemente tengan intereses similares, por lo que es probable que otro usuario con un historial de lectura similar disfrute de un libro que le guste a un usuario. Este enfoque se utiliza a menudo en sistemas de recomendación de películas, música y otros productos.
El filtrado basado en contenidos , por otro lado, se centra en las características de los propios libros, como su género, temática y autor, para hacer recomendaciones. Este enfoque es útil cuando no hay suficientes datos disponibles sobre las preferencias de los usuarios para utilizar el filtrado colaborativo.
Los sistemas híbridos combinan filtrado colaborativo y filtrado basado en contenido para hacer recomendaciones. Pueden tener en cuenta tanto las características de los libros como las preferencias de los usuarios para dar una recomendación más personalizada.
Existen varios desafíos para construir un sistema de recomendación de libros eficaz, incluida la necesidad de grandes cantidades de datos para entrenar el sistema, la complejidad del procesamiento del lenguaje natural y la necesidad de equilibrar la personalización de las recomendaciones con la diversidad de los libros recomendados.
El conjunto de datos de Book-Crossing consta de 3 archivos.
Usuarios: Contiene los usuarios. Tenga en cuenta que los ID de usuario (ID de usuario) se han anonimizado y se asignan a números enteros. Se proporcionan datos demográficos (ubicación, edad) si están disponibles. De lo contrario, estos campos contienen valores NULL.
Libros: Los libros se identifican por su respectivo ISBN. Los ISBN no válidos ya se han eliminado del conjunto de datos. Además, se proporciona cierta información basada en el contenido (título del libro, autor del libro, año de publicación, editorial), obtenida de Amazon Web Services. Tenga en cuenta que en el caso de varios autores, sólo se proporciona el primero. También se proporcionan URL que enlazan con imágenes de portada, que aparecen en tres tipos diferentes (Imagen-URL-S, Imagen-URL-M, Imagen-URL-L), es decir, pequeña, mediana y grande. Estas URL apuntan al sitio web de Amazon.
Calificaciones: Contiene la información de calificación del libro. Las calificaciones (Book-Rating) son explícitas, expresadas en una escala del 1 al 10 (los valores más altos indican una mayor apreciación), o implícitas, expresadas por 0.
Enlace de conjuntos de datos: - https://drive.google.com/drive/folders/1Gi0wMWCTigA_rJSi9huyT51lKduBSv43?usp=share_link