scrapetron adalah paket Python untuk web scraping yang menyediakan API sederhana dan intuitif untuk mengekstraksi data dari situs web. Dengan scrapetron , Anda dapat dengan mudah mengikis halaman web dan mengekstrak informasi seperti teks, gambar, tautan, dan lainnya.
Anda dapat menginstal scrapetron menggunakan pip:
pip install scrapetron
Berikut ini contoh sederhana cara menggunakan scrapetron untuk mengikis halaman web:
from scrapetron import scrapetron
url = 'https://www.example.com'
scraper = scrapetron ( url )
data = scraper . get_text ()
print ( data )
Di sini, di contoh ini, kita membuat objek scrapetron baru dengan URL halaman web yang ingin kita scrape. Kami kemudian memanggil metode get_text untuk mengekstrak konten teks halaman.
scrapetron menyediakan sejumlah fitur untuk web scraping, antara lain:
Untuk informasi lebih lanjut tentang cara menggunakan scrapetron , silakan lihat dokumentasinya.
Jika Anda ingin berkontribusi pada scrapetron , harap fork repositori dan kirimkan permintaan penarikan. Kami menyambut segala jenis kontribusi, termasuk perbaikan bug, fitur baru, dan peningkatan dokumentasi.
scrapetron dilisensikan di bawah lisensi MIT. Lihat file LISENSI untuk informasi lebih lanjut.