Um sistema de recomendação de livros é uma ferramenta que sugere livros aos usuários com base em seus interesses e histórico de leitura. Esses sistemas podem ser usados por bibliotecas, livrarias ou varejistas on-line para ajudar os usuários a descobrir novos livros de que possam gostar.
Existem várias abordagens para construir um sistema de recomendação de livros, incluindo filtragem colaborativa, filtragem baseada em conteúdo e sistemas híbridos que combinam ambas as abordagens.
A filtragem colaborativa baseia-se na ideia de que usuários com históricos de leitura semelhantes provavelmente terão interesses semelhantes; portanto, um livro que um usuário gosta provavelmente será apreciado por outro usuário com histórico de leitura semelhante. Essa abordagem é frequentemente usada em sistemas de recomendação de filmes, músicas e outros produtos.
A filtragem baseada em conteúdo , por outro lado, concentra-se nas características dos próprios livros, como gênero, tema e autor, para fazer recomendações. Esta abordagem é útil quando não há dados suficientes disponíveis sobre as preferências dos utilizadores para utilizar a filtragem colaborativa.
Os sistemas híbridos combinam filtragem colaborativa e filtragem baseada em conteúdo para fazer recomendações. Podem levar em consideração tanto as características dos livros quanto as preferências dos usuários para fornecer uma recomendação mais personalizada.
Existem vários desafios na construção de um sistema de recomendação de livros eficaz, incluindo a necessidade de grandes quantidades de dados para treinar o sistema, a complexidade do processamento de linguagem natural e a necessidade de equilibrar a personalização das recomendações com a diversidade dos livros recomendados.
O conjunto de dados Book-Crossing compreende 3 arquivos.
Usuários: Contém os usuários. Observe que os IDs de usuário (User-ID) foram anonimizados e mapeados para números inteiros. Os dados demográficos são fornecidos (localização, idade), se disponíveis. Caso contrário, esses campos conterão valores NULL.
Livros: Os livros são identificados pelo respectivo ISBN. ISBNs inválidos já foram removidos do conjunto de dados. Além disso, são fornecidas algumas informações baseadas em conteúdo (título do livro, autor do livro, ano de publicação, editora), obtidas na Amazon Web Services. Observe que no caso de vários autores, apenas o primeiro é fornecido. URLs com links para imagens de capa também são fornecidos, aparecendo em três sabores diferentes (Image-URL-S, Image-URL-M, Image-URL-L), ou seja, pequeno, médio, grande. Esses URLs apontam para o site da Amazon.
Avaliações: contém as informações de classificação do livro. As classificações (Book-Rating) podem ser explícitas, expressas numa escala de 1 a 10 (valores mais elevados denotam maior apreciação), ou implícitas, expressas por 0.
Link dos conjuntos de dados: - https://drive.google.com/drive/folders/1Gi0wMWCTigA_rJSi9huyT51lKduBSv43?usp=share_link