SmartImageExtractionEcommerce
1.0.0
Dieses Projekt betont die Nutzung von LLMs und ChatGPT , um eine effektive Aufforderung zur Verbesserung der Präzision der Bildextraktion zu verbessern.
Dies ist ein laufendes Forschungsprojekt, daher ist der Code möglicherweise nicht sehr sauber.
Ziel dieses Projekts ist es, Produktbilder aus E-Commerce-Produktseiten zu extrahieren und gleichzeitig irrelevante Bilder wie Logos oder ähnliche Produktbilder auszuschließen. Dies erfordert den Umgang mit verschiedenen Sprachen und Filtern basierend auf Textinhalten.
Erstes Setup
HTML -Reinigung
Produktbilder identifizieren
Letzte Schritte