codemining treelm
1.0.0
codemining-treelm berisi kode untuk model bahasa yang bekerja pada pohon.
codemining.ast
berisi kode untuk mengubah AST menjadi TreeNodes tanpa bahasa
codemining.lm
berisi implementasi PCFG dan TSG serta beberapa kode terkait idiom.
Proyek ini bergantung pada tiga modul internal (maven):
a) utilitas penambangan kode b) inti penambangan kode c) urutan penambangan kode
Dependensi lainnya dideklarasikan dalam dependensi maven.
Repositori ini berisi kode yang terkait dengan makalah:
@inproceedings{allamanis2014mining,
title={Mining Idioms from Source Code},
author={Allamanis, Miltiadis and Sutton, Charles},
booktitle={Proceedings of the 22nd ACM SIGSOFT International Symposium on Foundations of Software Engineering},
pages={472--483},
year={2014},
organization={ACM}
}
Untuk melatih TSG untuk Java, gunakan kelas utama di codemining.lm.tsg.tui.java.SampleBlockedTSG
dengan argumen
/path/to/folder binaryvariables filterblock 1.0 50
untuk menjalankan pelatihan TSG seperti pada makalah "Menambang Idiom dari Kode Sumber". Untuk opsi lain silakan jelajahi kodenya.