Jelaskan secara singkat saja:
Kolektor : memantau sumber bacaan yang disesuaikan seperti akun publik, buku atau sumber blog yang mereka ikuti, dan mengalir ke Liuli
dalam format standar terpadu sebagai sumber masukan;
Prosesor : Menyesuaikan konten target, seperti menggunakan pembelajaran mesin untuk secara otomatis memberi label pengklasifikasi iklan berdasarkan data iklan historis, atau memperkenalkan fungsi kait untuk dijalankan pada node yang relevan;
Distributor : mengandalkan lapisan antarmuka untuk melakukan permintaan & respons data, menyediakan konfigurasi yang dipersonalisasi kepada pengguna, dan kemudian secara otomatis mendistribusikan sesuai dengan konfigurasi, mengalirkan artikel bersih ke klien WeChat, DingTalk, TG, RSS, dan bahkan situs web yang dibuat sendiri;
Pendukung : Cadangkan artikel yang diproses, seperti menyimpannya ke database atau GitHub, dll.
Hal ini mencapai pembangunan lingkungan membaca yang bersih. Sebenarnya, ada banyak hal yang dapat dilakukan berdasarkan data yang diperoleh.
Dasbor kemajuan pengembangan:
v0.2.0: Menerapkan fungsi dasar untuk memastikan bahwa solusi untuk skenario umum dapat diterapkan
v0.3.0: Menerapkan kustomisasi kolektor, pengguna dapat mengumpulkan apa yang mereka lihat
Untuk meningkatkan akurasi pengenalan model, saya harap semua orang dapat menyumbangkan beberapa contoh iklan. Silakan lihat file contoh: .files/datasets/ads.csv.
judul | url | adalah_proses |
---|---|---|
Judul artikel iklan | Tautan artikel iklan | 0 |
Deskripsi lapangan:
judul: judul artikel
url: tautan artikel. Jika Anda ingin menggunakan artikel WeChat, harap verifikasi terlebih dahulu apakah tidak valid.
is_process: Menunjukkan apakah akan melakukan pemrosesan sampel. Isikan 0
secara default.
Mari kita beri contoh:
Umumnya iklan akan dipasang berulang kali di beberapa akun publik. Harap periksa apakah catatan ini ada saat mengisinya. Saya harap semua orang dapat bekerja sama untuk berkontribusi.
Berkat proyek sumber terbuka berikut:
Labu: kerangka web
Vue: Kerangka kerja JavaScript progresif
Ruia: Kerangka kerja perayap asinkron (dikembangkan dan digunakan sendiri)
penulis drama: Pengikisan data menggunakan browser
Di atas hanya mencantumkan dependensi inti open source. Untuk dependensi pihak ketiga lainnya, silakan lihat file Pipfile.
Setiap PR yang Anda terima merupakan dukungan kuat untuk proyek Liuli
. Kami sangat berterima kasih kepada pengembang berikut atas kontribusi mereka (tanpa urutan tertentu):
Selamat berkomunikasi bersama (ikuti grup):