Ekstensi ini menyediakan beberapa fungsi yang bermanfaat untuk pengguna OpenRefine yang ingin mengedit (data terstruktur) file media (gambar, video, PDF ...) di Wikimedia Commons . Untuk info lebih lanjut, Dokumentasi dan How-Tos tentang OpenRefine untuk Wikimedia Commons, lihat https://commons.wikimedia.org/wiki/Commons:openrefine .
Fitur yang termasuk dalam ekstensi ini:
Mulai proyek OpenRefine dengan memuat nama file dari satu atau lebih kategori Wikimedia Commons (termasuk kedalaman kategori)
Tambahkan kolom dengan kategori Commons dan/atau M-ID dari setiap nama file
Nama file sudah akan direkonsiliasi saat memulai proyek
Beberapa perintah grel khusus memungkinkan pemrosesan dasar dan ekstraksi wikuxt: extractFromTemplate
dan value.extractCategories
(Dalam rilis 0.1.1 ekstensi ini dan kemudian) Dukungan Dasar untuk Pratinjau File Thumbnail dari file Wikimedia Commons yang ada. Thumbnail ditampilkan untuk beberapa (tetapi tidak semua) jenis/ekstensi file. Saat ini ada dukungan thumbnail untuk JPEG, GIF, PNG, DJVU, PDF, SVG, Webm dan file OGV.
Ini bekerja dengan OpenRefine 3.6.x dan versi OpenRefine yang lebih baru . Ini tidak kompatibel dengan OpenRefine 3.5.x atau sebelumnya. (OpenRefine mendukung pengeditan Wikimedia Commons dari versi 3.6; ini tidak mungkin dalam versi sebelumnya.)
Perpanjangan ini pertama kali dirilis pada Oktober 2022. Ini telah didanai oleh hibah proyek Wikimedia.
Unduh file .zip dari rilis terbaru dari ekstensi ini. Buka ritsleting file ini dan letakkan folder unzip di folder OpenRefine Extensions Anda. Baca lebih lanjut tentang menginstal ekstensi di Manual Pengguna OpenRefine.
Ketika ekstensi ini diinstal dengan benar, Anda sekarang akan melihat opsi tambahan 'Wikimedia Commons' saat memulai proyek baru di OpenRefine.
Setelah menginstal ekstensi ini, klik opsi 'Wikimedia Commons' untuk memulai proyek baru di OpenRefine. Anda akan diminta untuk menambahkan satu atau lebih kategori Wikimedia Commons.
Tidak perlu mengetik kategori: awalan.
Anda dapat menentukan kedalaman kategori dengan mengetik atau memilih angka di bidang input setelah setiap kategori. Kedalaman 0
berarti hanya file dari level kategori saat ini; Kedalaman 1
akan mengambil file dari satu tingkat sub-kategori turun, dll.
Selanjutnya, di layar Project Preview ( Configure parsing options
), Anda dapat memilih untuk juga menyertakan kolom dengan masing-masing file M-ID (unik MediainFO Identifier) dan/atau kategori Commons.
Nama file sudah akan direkonsiliasi saat proyek Anda dimulai.
Saat Anda memuat kategori yang lebih besar (ribuan file) dalam proyek baru, OpenRefine akan mulai perlahan dan akan memberi Anda peringatan memori. Ini adalah masalah yang diketahui. Tunggu sebentar; Proyek pada akhirnya akan dimulai. Ekstensi Commons telah diuji dengan proyek lebih dari 450.000 file.
Ekstensi Wikimedia Commons juga memungkinkan dua perintah Grel khusus, yang membantu mengekstraksi informasi spesifik dari file WikiMedia Wikimedia Commons. (GREL, bahasa ekspresi gambaran umum, adalah bahasa skrip khusus yang digunakan dalam OpenRefine untuk banyak operasi data yang fleksibel. Untuk referensi umum tentang penggunaan grel di OpenRefine, lihat https://docs.openrefine.org/manual/grelfunctions.)
Pertama, ambil wikuxext dari daftar file commons di proyek Anda. Di kolom menu kolom file yang direkonsiliasi, pilih Edit column
> Add column from reconciled values...
dan pilih Wikitext
di jendela dialog yang dihasilkan.
Dari kolom baru ini dengan Wikuxt, Anda sekarang dapat mengekstrak nilai dan kategori seperti yang dijelaskan di bawah ini. Mulailah dengan memilih Edit column
> Add column based on this column...
di menu kolom. Di jendela dialog berikutnya, Anda dapat menggunakan berbagai perintah grel spesifik:
extractFromTemplate
Gunakan sintaks berikut:
extractFromTemplate(value, "BHL", "source")[0]
Di mana Anda mengganti BHL
dengan nama templat (tanpa kurung keriting) dan source
dengan parameter dari mana Anda ingin mengekstrak nilainya. Sintaks Grel ini akan mengembalikan nilai pertama (dan biasanya satu -satunya) dari parameter tersebut, misalnya https://www.flickr.com/photos/biodivlibrary/10329116385
.
value.extractCategories
Gunakan sintaks berikut:
value.extractCategories().join('#')
Sintaks Grel ini akan mengembalikan semua kategori yang disebutkan dalam wikuxt, dipisahkan oleh karakter #
, yang kemudian dapat Anda gunakan untuk membagi sel yang dihasilkan lebih lanjut sesuai kebutuhan.
Berlari
mvn package
Ini membuat file zip di folder target
, yang kemudian dapat diinstal di OpenRefine.
Untuk menghindari keharusan membuka ritsleting ekstensi di direktori yang sesuai setiap kali Anda ingin mengujinya, Anda juga dapat menggunakan pengaturan lain: cukup buat tautan simbolik dari folder ekstensi Anda di OpenRefine ke salinan lokal repositori ini. Dengan pengaturan ini, Anda tidak perlu menjalankan mvn package
saat membuat perubahan pada ekstensi, tetapi Anda masih akan mengkompilasinya dengan mvn compile
jika Anda membuat perubahan pada file Java, dan restart OpenRefine jika Anda membuat perubahan pada file apa pun.
Pastikan Anda berada di cabang master
dan sudah mutakhir ( git pull
)
Buka pom.xml
dan atur versi ke nomor versi yang diinginkan, seperti <version>0.1.0</version>
Berkomitmen dan dorong perubahan itu untuk master
Tambahkan tag git yang sesuai, dengan git tag -a v0.1.0 -m "Version 0.1.0"
(saat bekerja dari github desktop, Anda dapat mengikuti proses ini dan secara manual menambahkan tag v0.1.0
dengan Version 0.1.0
)
Dorong tag ke GitHub: git push --tags
(di desktop github, cukup dorong lagi)
Buat rilis baru di Github di https://github.com/openrefine/commonsextension/releases/new, memberikan judul rilis (seperti "Commons Extension 0.1.0") dan deskripsi fitur dalam rilis ini.
Buka pom.xml
dan atur versi ke nomor versi berikutnya yang diharapkan, diikuti oleh -SNAPSHOT
. Misalnya, jika Anda baru saja merilis 0.1.0, Anda dapat mengatur <version>0.1.1-SNAPSHOT</version>
Berkomitmen dan dorong perubahan itu.