Sistem Tanya-Jawab untuk makalah COVID-19
Pendahuluan • Memulai • Di balik terpal • API Server dan Klien
informasi. Jumlah dokumen terkait COVID-19 meningkat secara eksponensial. Dengan begitu banyaknya informasi, semakin sulit bagi komunitas riset untuk menemukan informasi yang relevan.
Mesin pencari-pada-steroid. Korono adalah platform tanya jawab yang dirancang untuk memfasilitasi penelitian informasi terkait COVID-19. Anda dapat menganggap Korono sebagai mesin pencari steroid.
Prinsip kerja. Mesin Korono terdiri dari dua fase: fase mesin pencari dan fase tanya jawab. Pertama, jika diberi kueri q
, mesin pencari akan mengembalikan semua makalah yang relevan dari kueri tersebut. Nanti jawabannya diambil dari masing-masing kertas dan ditampilkan.
Anda dapat menggunakan versi online (segera hadir) atau menjalankan server Anda sendiri.
Jalankan server secara lokal:
./run_server.sh
Jalankan klien dan ajukan pertanyaan:
> from korono import client
> client . get_answers ( "What is coronavirus?" )
Mesin pencari . Mesin pencari menggunakan algoritma pemeringkatan yang dikenal sebagai Okapi BM25, dimana BM adalah singkatan dari pencocokan terbaik . BM25 adalah fungsi pengambilan kumpulan kata yang mengurutkan dokumen berdasarkan istilah kueri yang muncul di setiap dokumen.
Menjawab pertanyaan . Pertanyaan diekstraksi dari korpus menggunakan Transformers, model bahasa jaringan saraf besar. Saat ini, hanya model distilbert-base-uncased-distilled-squad
yang didukung. Segera, kami berencana untuk memperluas dukungan.
load_data.get_df()
Mengembalikan kumpulan data yang digaris bawahi.
load_data.get_metadata_df()
Mengembalikan panda metadata CORD-19 DataFrame.
korono_model.answer_question(question, context)
Mengingat pertanyaan dan konteks, mengembalikan jawabannya.
korono.model.get_summary(text)
Dengan adanya teks, model mengembalikan ringkasan abstraktif.
korono_model.find_start_end_index_substring(context, answer)
Mengembalikan indeks awal dan akhir, jika ada, dari string answer
dalam string context
.
client.get_answers_json(question)
Mengembalikan objek JSON dalam bentuk: {
"results" : [
{
"context" : " coronavirus is an infectious disease " ,
"question" : " what is coronavirus? " ,
"answer" : " an infectious disease " ,
},
]
}
client.get_answers(question)
Mengembalikan daftar semua jawaban.