Di era ledakan informasi Internet, grafik pengetahuan (KG) telah menjadi alat penting untuk mengatur dan memahami dunia. Namun, pengenalan entitas dan penyelarasan antara grafik pengetahuan yang berbeda menjadi masalah yang sulit. Editor Downcodes akan memperkenalkan kepada Anda sebuah makalah berjudul "AutoAlign: Penyelarasan Grafik Pengetahuan yang Sepenuhnya Otomatis dan Efektif yang diaktifkan oleh Model Bahasa Besar", yang mengusulkan solusi inovatif yang disebut AutoAlign, yang secara cerdik menggunakan model bahasa besar untuk memecahkan masalah ini .
Di era Internet, terdapat melimpahnya informasi, dan grafik pengetahuan (KG) telah menjadi alat penting bagi kita untuk memahami dan mengatur dunia. Namun timbul pertanyaan, ketika grafik pengetahuan yang berbeda bertemu, bagaimana mereka mengidentifikasi dan menyelaraskan entitas satu sama lain? Seperti di pesta besar, bagaimana agar tamu dari latar belakang berbeda bisa saling mengenal dan menjadi teman.
Baru-baru ini, sebuah makalah berjudul AutoAlign: Penyelarasan Grafik Pengetahuan Sepenuhnya Otomatis dan Efektif yang diaktifkan oleh Model Bahasa Besar memberi kami solusi ajaib-AutoAlign. Ini bukan hanya terobosan teknologi, tapi juga “pesta sosial” di dunia AI.
Bayangkan Anda seorang perencana pesta dan Anda perlu memastikan setiap tamu dapat menemukan teman mereka. Dalam dunia grafik pengetahuan, "tamu" ini adalah entitas, dan AutoAlign adalah perencana pesta yang ajaib.
AutoAlign adalah metode penyelarasan grafik pengetahuan baru yang sepenuhnya otomatis dan efisien. Itu tidak memerlukan penyelarasan benih buatan tangan, yang berarti Anda tidak perlu memberi tahu sebelumnya entitas mana yang berteman. Ibarat berada di sebuah pesta, tidak perlu memperkenalkan semua orang terlebih dahulu, AutoAlign bisa otomatis mengenali dan memperkenalkan mereka.
Rahasia ajaib AutoAlign adalah memanfaatkan model bahasa besar (seperti ChatGPT dan Claude) untuk membuat grafik kedekatan predikat. Grafik ini membantu AutoAlign secara otomatis mengidentifikasi predikat serupa dalam grafik pengetahuan yang berbeda. Ini seperti seorang perencana pesta yang mengamati bagaimana para tamu berperilaku dan berbicara untuk mengidentifikasi kesamaan yang mungkin mereka miliki.
Para peneliti melakukan eksperimen pada grafik pengetahuan dunia nyata, dan hasilnya menunjukkan bahwa AutoAlign secara signifikan mengungguli metode yang ada dalam tugas penyelarasan entitas. Ini seperti setelah pesta, semua tamu mendapati teman-temannya dan perencana pesta mendapat pujian yang tinggi.
Penyelarasan Predikat: Penyelarasan Otomatis mempelajari kesamaan antara predikat dengan hubungan yang sama dalam grafik pengetahuan yang berbeda melalui grafik kedekatan predikat. Ibarat seorang perencana pesta yang memperkenalkan para tamu dengan memperhatikan kepentingan bersama.
Penyelarasan Entitas: AutoAlign terlebih dahulu menghitung secara independen penyematan entitas dari setiap grafik pengetahuan, lalu mengonversi penyematan entitas dari dua grafik pengetahuan ke dalam ruang vektor yang sama dengan menghitung kesamaan entitas berbasis atribut. Ibarat seorang perencana pesta yang mengidentifikasi teman-teman tamunya dengan mengamati penampilan dan perilakunya.
Pembelajaran Bersama: Penyelarasan Otomatis menjadikan penyelarasan entitas lebih akurat dengan mempelajari bersama predikat, entitas, dan penyematan atribut. Ini seperti perencana pesta yang terus-menerus menyesuaikan strategi perkenalan mereka seiring berjalannya pesta untuk memastikan semua orang menemukan teman mereka.
AutoAlign tidak hanya menunjukkan kemampuannya pada tugas penyelarasan grafik pengetahuan, namun juga menunjukkan potensinya dalam cakupan aplikasi yang lebih luas, seperti penyelesaian grafik pengetahuan. Para peneliti percaya bahwa masa depan AutoAlign mungkin tidak terbatas pada grafik pengetahuan, namun juga dapat diperluas ke bidang penelitian grafik atau hipergraf yang lebih luas.
Alamat makalah: https://arxiv.org/abs/2307.11772
AutoAlign memberikan solusi yang efisien dan sepenuhnya otomatis untuk penyelarasan grafik pengetahuan. Ia menggunakan kemampuan model bahasa besar untuk menunjukkan kinerja luar biasa dalam aplikasi praktis dan membawa terobosan baru pada bidang penelitian grafik pengetahuan.