Salesforce Research からのコードの理解と生成のためのCodeT5およびCodeT5+モデルの公式研究リリース。以下の論文で紹介されています。
タイトル: CodeT5+: コードの理解と生成のためのオープン コード大規模言語モデル
著者: Yue Wang*、Hung Le*、Akhilesh Deepak Gotmare、Nghi DQ Bui、Junnan Li、Steven CH Hoi (* は同等の貢献を示します)
タイトル: CodeT5: コードの理解と生成のための、識別子を意識した統合された事前トレーニング済みエンコーダー/デコーダー モデル
著者:Yue Wang、Weishi Wang、Shafiq Joty、Steven CH Hoi
実際には、CodeT5 および CodeT5+ モデルを AI を活用したコーディング アシスタントとして導入して、ソフトウェア開発者の生産性を向上させることができます。 Salesforce では、CodeT5 を VS Code プラグインとして使用して AI コーディング アシスタントのデモを構築し、次の 3 つの機能を提供します。
2023年5月
CodeT5+のペーパーとモデルを公開しました!
紙 |コード |モデル |ブログ
2022 年 9 月
私たちのCodeRL論文が NeurIPS 2022 に採択されました。
紙 |コード |ブログ
2022年7月
HuggingFace では、2 つの大きなサイズの CodeT5 チェックポイント、Salesforce/codet5-large および Salesforce/codet5-large-ntp-py をリリースします。これらは CodeRL 論文で紹介されています。
2021年10月
この文書で取り上げられているすべての下流タスクに対して、微調整されたチェックポイントをリリースします。さらに、多言語コード要約用に CodeT5 ベースの微調整されたチェックポイント (Salesforce/codet5-base-multi-sum) をリリースします。
2021年9月
CodeT5論文がEMNLP 2021に採択され、モデルがリリースされました!
紙 |コード |モデル |モデルカード |ブログ
このコードが研究に役立つと思われる場合は、引用することを検討してください。
@inproceedings{
wang2021codet5,
title={CodeT5: Identifier-aware Unified Pre-trained Encoder-Decoder Models for Code Understanding and Generation},
author={Yue Wang, Weishi Wang, Shafiq Joty, Steven C.H. Hoi},
booktitle={EMNLP},
year={2021},
}
@inproceedings{
le2022coderl,
title={CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning},
author={Le, Hung and Wang, Yue and Gotmare, Akhilesh Deepak and Savarese, Silvio and Hoi, Steven C. H.},
booktitle={NeurIPS},
year={2022}
}
@article{
wang2023codet5plus,
title={CodeT5+: Open Code Large Language Models for Code Understanding and Generation},
author={Wang, Yue and Le, Hung and Gotmare, Akhilesh Deepak and Bui, Nghi D.Q. and Li, Junnan and Hoi, Steven C. H.},
journal={arXiv preprint},
year={2023}
}
コードは BSD-3 ライセンスに基づいてリリースされています (詳細についてはLICENSE.txt
参照) が、ユーザーには次の事項を尊重するようお願いします。
このソフトウェアは、以下を宣伝したり利益を得たりする目的で使用してはなりません。
暴力、憎しみ、分断、
環境破壊、
人権侵害、あるいは
人々の身体的および精神的健康の破壊。
このソフトウェアのユーザーには、[email protected] に電子メールを送信して、このソフトウェアを使用しているアプリケーションについて知らせていただくこと、また、このモデルの重要なアプリケーションを開発する場合には、適切なドキュメントを使用することをお勧めします。
質問、提案、リクエスト、バグレポートがある場合は、GitHub の問題を作成してください。 PRの方も大歓迎です!