codemining treelm
1.0.0
codemining-treelm 包含在树上工作的语言模型的代码。
codemining.ast
包含将 AST 转换为与语言无关的 TreeNode 的代码
codemining.lm
包含 PCFG 和 TSG 的实现以及一些与习惯用法相关的代码。
该项目依赖于三个内部(maven)模块:
a) codemining-utils b) codemining-core c) codemining-sequencelm
其余的依赖项在 Maven 依赖项中声明。
该存储库包含与论文相关的代码:
@inproceedings{allamanis2014mining,
title={Mining Idioms from Source Code},
author={Allamanis, Miltiadis and Sutton, Charles},
booktitle={Proceedings of the 22nd ACM SIGSOFT International Symposium on Foundations of Software Engineering},
pages={472--483},
year={2014},
organization={ACM}
}
要训练 Java 版 TSG,请使用codemining.lm.tsg.tui.java.SampleBlockedTSG
中的主类以及参数
/path/to/folder binaryvariables filterblock 1.0 50
按照“从源代码中挖掘习语”论文中的方式运行 TSG 培训。对于其他选项,请探索代码。