Di persimpangan sains dan teknologi, grafik, sebagai alat yang ampuh untuk mengekspresikan hubungan yang kompleks, semakin menjadi fokus peneliti. Grafik memainkan peran yang sangat diperlukan dalam desain molekuler kimia atau analisis jejaring sosial. Namun, bagaimana menghasilkan grafik secara efisien dan fleksibel selalu merupakan masalah yang sangat menantang. Baru-baru ini, tim penelitian di Tufts University, Northeastern University dan Cornell University berkolaborasi untuk meluncurkan model autoregresif yang disebut grafik generatif pra-terlatih transformator (G2PT), yang bertujuan untuk mendefinisikan kembali bagaimana grafik dihasilkan dan diwakili.
Tidak seperti model generasi grafik tradisional yang mengandalkan matriks adjacency, G2PT memperkenalkan metode tokenisasi berbasis urutan. Metode ini memanfaatkan seluruh sparseness grafik dengan menguraikan grafik menjadi set simpul dan set tepi, sehingga secara signifikan meningkatkan efisiensi komputasi. Inovasi G2PT adalah bahwa ia secara bertahap dapat menghasilkan grafik seperti itu dalam bahasa alami dan menyelesaikan seluruh konstruksi grafik dengan memprediksi token berikutnya. Penelitian menunjukkan bahwa representasi serial ini tidak hanya mengurangi jumlah token, tetapi juga meningkatkan kualitas generasi.
Kemampuan beradaptasi dan skalabilitas G2PT sangat mengesankan. Dengan teknologi penyempurnaan, ini menunjukkan kinerja yang sangat baik dalam tugas-tugas seperti generasi grafik yang berorientasi pada tujuan dan prediksi atribut grafik. Misalnya, dalam desain obat, G2PT dapat menghasilkan peta molekuler dengan sifat fisikokimia spesifik. Selain itu, dengan mengekstraksi embedding grafik dari model pra-terlatih, G2PT juga menunjukkan keunggulan pada dataset prediksi atribut molekuler berganda.
Dalam percobaan komparatif, G2PT berkinerja lebih baik secara signifikan daripada model canggih yang ada pada beberapa dataset benchmark. Kinerja telah sangat diakui dalam hal menghasilkan validitas, keunikan dan pencocokan distribusi atribut molekuler. Para peneliti juga menganalisis dampak skala model dan data pada kinerja generasi.
Meskipun G2PT menunjukkan kemampuan yang luar biasa dalam berbagai tugas, para peneliti juga menunjukkan bahwa sensitivitas terhadap urutan pembuatan dapat berarti bahwa domain grafik yang berbeda memerlukan strategi optimasi pesanan yang berbeda. Penelitian di masa depan diharapkan untuk lebih mengeksplorasi desain urutan yang lebih umum dan ekspresif.
Munculnya G2PT tidak hanya membawa metode inovatif ke bidang pembuatan grafik, tetapi juga meletakkan dasar yang kuat untuk penelitian dan penerapan bidang terkait. Dengan kemajuan teknologi yang berkelanjutan, G2PT diharapkan untuk mewujudkan potensinya di lebih banyak bidang dan mempromosikan pengembangan lebih lanjut dari teknologi generasi grafik.