Smart & Universal Web Scrapper adalah alat ekstraksi data cerdas yang didukung oleh AI Generatif. Ini menyederhanakan proses pengambilan data dari situs web mana pun dengan memungkinkan pengguna memberikan tautan situs web dan bidang data yang diperlukan. Dengan kemampuannya yang serbaguna, alat ini dapat mengekstrak data dengan lancar dan menyajikannya dalam format tabel, yang dapat diunduh dalam berbagai format seperti Excel, JSON, atau Markdown. Antarmukanya yang cerdas dan ramah pengguna memastikan ekstraksi data yang efisien dan akurat untuk semua kebutuhan pengikisan web Anda.
Python:
Python adalah bahasa pemrograman populer dan serbaguna yang dikenal karena kesederhanaan dan keterbacaannya. Ini banyak digunakan untuk berbagai aplikasi, termasuk pengembangan web, analisis data, pembelajaran mesin, dan tugas otomatisasi. Ekosistem perpustakaan dan kerangka kerja Python yang luas menjadikannya alat yang ampuh bagi pengembang.
LLaMA 3.1 (70b):
LLaMA (Lean Large-Language Model) adalah rangkaian model bahasa besar yang dikembangkan oleh Meta AI. Versi 3.1 (70b) mengacu pada varian model tertentu dengan 70 miliar parameter. Model bahasa besar seperti LLaMA dilatih pada data teks dalam jumlah besar, memungkinkan mereka memahami dan menghasilkan teks mirip manusia untuk berbagai tugas pemrosesan bahasa alami.
Groq API:
Groq API menyediakan akses ke platform inferensi AI Groq yang kuat. Hal ini memungkinkan pengembang untuk memanfaatkan perangkat keras dan perangkat lunak canggih mereka untuk eksekusi model AI yang cepat dan efisien.
Streamlit:
Streamlit adalah pustaka Python sumber terbuka yang menyederhanakan proses pembuatan visualisasi data interaktif dan aplikasi web pembelajaran mesin. Hal ini memungkinkan pengembang untuk membuat antarmuka pengguna dengan menulis skrip Python, sehingga lebih mudah untuk berbagi aplikasi berbasis data dengan orang lain.
Garpu atau kloning repositori ini ke mesin lokal Anda menggunakan Git.
Instal perpustakaan yang diperlukan.
pip install -r requirements.txt
Buat file .env
di direktori proyek Anda dan tambahkan kunci API apa pun yang diperlukan (misalnya, kunci Google API, Groq API KEY).
streamlit run app.py
Lisensi Publik Umum GNU v3.0