codemining treelm
1.0.0
codemining-treelm には、ツリー上で動作する言語モデルのコードが含まれています。
codemining.ast
は、AST を言語に依存しない TreeNode に変換するコードが含まれています
codemining.lm
PCFG と TSG の実装と、いくつかのイディオム関連のコードが含まれています。
プロジェクトは 3 つの内部 (Maven) モジュールに依存しています。
a) コードマイニング ユーティリティ b) コードマイニング コア c) コードマイニング シーケンス
残りの依存関係は Maven の依存関係で宣言されます。
このリポジトリには、論文に関連するコードが含まれています。
@inproceedings{allamanis2014mining,
title={Mining Idioms from Source Code},
author={Allamanis, Miltiadis and Sutton, Charles},
booktitle={Proceedings of the 22nd ACM SIGSOFT International Symposium on Foundations of Software Engineering},
pages={472--483},
year={2014},
organization={ACM}
}
Java 用の TSG をトレーニングするには、引数を指定してcodemining.lm.tsg.tui.java.SampleBlockedTSG
のメイン クラスを使用します。
/path/to/folder binaryvariables filterblock 1.0 50
「ソース コードからのイディオムのマイニング」論文と同様に TSG トレーニングを実行します。他のオプションについては、コードを調べてください。