Unduh prodigy recipes - unduh kode sumber prodigy recipes

prodigy recipes

Kode Sumber AI

1.0.0

Unduh

Resep Ajaib

Repositori ini berisi kumpulan resep untuk Prodigy, alat anotasi skrip kami untuk teks, gambar, dan data lainnya. Untuk menggunakan repo ini, Anda memerlukan lisensi Prodigy – lihat halaman ini untuk lebih jelasnya. Untuk pertanyaan dan laporan bug, silakan gunakan Forum Dukungan Prodigy. Jika Anda menemukan kesalahan atau bug, silakan kirimkan permintaan penarikan.

Catatan penting: Resep dalam repositori ini tidak 100% identik dengan resep bawaan yang dikirimkan bersama Prodigy. Mereka telah diedit untuk memasukkan komentar dan informasi lebih lanjut, dan beberapa di antaranya telah disederhanakan untuk membuatnya lebih mudah untuk mengikuti apa yang terjadi, dan menggunakannya sebagai dasar resep khusus.

? Penggunaan

Setelah Prodigy diinstal, Anda seharusnya dapat menjalankan perintah prodigy dari terminal Anda, baik secara langsung atau melalui python -m :

python -m prodigy

Perintah prodigy mencantumkan resep bawaan. Untuk menggunakan skrip resep khusus, cukup berikan jalur ke file menggunakan argumen -F :

python -m prodigy ner.teach your_dataset en_core_web_sm ./data.jsonl --label PERSON -F prodigy-recipes/ner/ner_teach.py

Anda juga dapat menggunakan tanda --help untuk ikhtisar argumen resep yang tersedia, misalnya prodigy ner.teach -F ner_teach_.py --help .

Beberapa hal untuk dicoba

Anda dapat mengedit kode dalam skrip resep untuk menyesuaikan perilaku Prodigy.

Coba ganti prefer_uncertain() dengan prefer_high_scores() .
Coba tulis fungsi penyortiran khusus. Itu hanya perlu menjadi generator yang menghasilkan urutan example dicts, mengingat urutan tupel (score, example) .
Coba tambahkan filter yang menghilangkan beberapa pertanyaan dari aliran. Misalnya, coba tulis filter yang hanya menanyakan pertanyaan yang entitasnya terdiri dari dua kata.
Coba sesuaikan callback update() , untuk menyertakan logging tambahan atau fungsionalitas tambahan.

? Resep

Pengakuan Entitas Bernama

Resep	Keterangan
`ner.teach`	Kumpulkan data pelatihan terbaik untuk model pengenalan entitas bernama dengan model dalam loop. Berdasarkan anotasi Anda, Prodigy akan memutuskan pertanyaan mana yang akan diajukan selanjutnya.
`ner.match`	Sarankan frasa yang cocok dengan file pola tertentu, dan tandai apakah frasa tersebut merupakan contoh entitas yang Anda minati. File pola dapat menyertakan string atau pola token yang tepat untuk digunakan dengan `Matcher` spaCy.
`ner.manual`	Tandai rentang secara manual dengan token. Hanya memerlukan tokenizer dan tidak ada pengenal entitas, dan tidak melakukan pembelajaran aktif apa pun. Secara opsional, pra-sorotan rentang berdasarkan pola.
`ner.fuzzy_manual`	Seperti `ner.manual` tetapi gunakan `FuzzyMatcher` dari perpustakaan `spaczz` untuk menyorot kandidat terlebih dahulu.
`ner.manual.bert`	Gunakan tokenizer potongan kata BERT untuk anotasi NER manual yang efisien untuk model transformator.
`ner.correct`	Buat data standar emas dengan mengoreksi prediksi model secara manual. Resep ini dulunya disebut `ner.make_gold` .
`ner.silver-to-gold`	Ambil kumpulan data "perak" yang ada dengan anotasi terima/tolak biner, gabungkan anotasi tersebut untuk menemukan analisis terbaik berdasarkan batasan yang ditentukan dalam anotasi, dan edit secara manual untuk membuat kumpulan data "emas" yang sempurna dan lengkap.
`ner.eval_ab`	Evaluasi dua model NER dengan membandingkan prediksinya dan membuat kumpulan evaluasi dari aliran.
`ner_fuzzy_manual`	Tandai rentang secara manual dengan token dengan saran dari pencocokan `spaczz fuzzy` yang telah disorot sebelumnya.

Klasifikasi Teks

Resep	Keterangan
`textcat.manual`	Memberi anotasi kategori yang berlaku pada teks secara manual. Mendukung tugas anotasi dengan label tunggal dan ganda. Beberapa label secara opsional dapat ditandai sebagai eksklusif.
`textcat.correct`	Perbaiki prediksi model textcat secara manual. Prediksi di atas ambang batas penerimaan akan dipilih secara otomatis (0,5 secara default). Prodigy akan menyimpulkan apakah kategori tersebut harus saling eksklusif berdasarkan konfigurasi komponen.
`textcat.teach`	Kumpulkan data pelatihan terbaik untuk model klasifikasi teks dengan model dalam loop. Berdasarkan anotasi Anda, Prodigy akan memutuskan pertanyaan mana yang akan diajukan selanjutnya.
`textcat.custom-model`	Gunakan klasifikasi teks yang didukung pembelajaran aktif dengan model kustom. Untuk mendemonstrasikan cara kerjanya, resep demo ini menggunakan model dummy sederhana yang "memprediksi" skor acak. Namun Anda dapat menukarnya dengan model apa pun pilihan Anda, misalnya implementasi model klasifikasi teks menggunakan PyTorch, TensorFlow, atau scikit-learn.

Terminologi

Resep	Keterangan
`terms.teach`	Bootstrap daftar terminologi dengan vektor kata dan istilah benih. Prodigy akan menyarankan istilah serupa berdasarkan vektor kata, dan memperbarui vektor target sesuai dengan itu.

Gambar

Resep	Keterangan
`image.manual`	Beri anotasi pada gambar secara manual dengan menggambar kotak pembatas persegi panjang atau bentuk poligon pada gambar.
`image-caption`	Beri anotasi pada gambar dengan keterangan, isi terlebih dahulu keterangan dengan model keterangan gambar yang diterapkan di PyTorch dan lakukan analisis kesalahan.
`image.frozenmodel`	Model dalam anotasi manual loop menggunakan API Deteksi Objek Tensorflow.
`image.servingmodel`	Model dalam anotasi manual loop menggunakan API Deteksi Objek Tensorflow. Ini menggunakan Penyajian Tensorflow
`image.trainmodel`	Anotasi dan pelatihan manual model dalam loop menggunakan API Deteksi Objek Tensorflow.

Lainnya

Resep	Keterangan
`mark`	Klik melalui contoh yang telah disiapkan sebelumnya, tanpa ada model yang terlibat.
`choice`	Beri anotasi pada data dengan opsi pilihan ganda. Contoh yang dianotasi akan memiliki properti tambahan `"accept": []` yang dipetakan ke ID opsi yang dipilih.
`question_answering`	Beri anotasi pada pasangan pertanyaan/jawaban dengan antarmuka HTML khusus.

Resep komunitas

Resep	Pengarang	Keterangan
`phrases.teach`	@kabirkhan	Sekarang bagian dari `sense2vec` .
`phrases.to-patterns`	@kabirkhan	Sekarang bagian dari `sense2vec` .
`records.link`	@kabirkhan	Tautkan rekaman di beberapa kumpulan data menggunakan pustaka `dedupe` .

resep tutorial

Resep-resep ini telah muncul di salah satu tutorial kami.

Resep	Keterangan
`span-and-textcat`	Lakukan anotasi spancat dan textcat secara bersamaan. Bagus untuk chatbot!
`terms.from-ner`	Hasilkan istilah dari anotasi NER sebelumnya.
`audio-with-transcript`	Menangani anotasi audio manual dan transkripsi.
`progress`	Demo `update` -panggilan balik yang melacak kecepatan anotasi.

Contoh Kumpulan Data dan Pola

Untuk mempermudah memulainya, kami juga menyertakan beberapa example-datasets , baik data mentah maupun data berisi anotasi yang dibuat dengan Prodigy. Untuk contoh pola pencocokan berbasis token untuk digunakan dengan resep seperti ner.teach atau ner.match , lihat direktori example-patterns .

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-01-28
ukuran 15.27MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Aplikasi resep kalender

2023-07-27
Resep Rel 2007

2009-06-02

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua