SmartImageExtractionEcommerce
1.0.0
Этот проект подчеркивает использование LLM и CHATGPT для эффективного побуждения для повышения точности извлечения изображений.
Это постоянный исследовательский проект, поэтому код может быть не очень чистым.
Целью этого проекта является извлечение изображений продуктов со страниц продукта электронной коммерции, исключая не относящиеся к делу изображения, такие как логотипы или аналогичные изображения продукта. Это требует обработки различных языков и фильтрации на основе текстового контента.
Начальная настройка
HTML Cleaning
Определение изображений продукта
Последние шаги