다음 논문에서 소개된 Salesforce Research의 코드 이해 및 생성을 위한 CodeT5 및 CodeT5+ 모델에 대한 공식 연구 릴리스입니다.
제목 : CodeT5+: 코드 이해 및 생성을 위한 개방형 코드 대규모 언어 모델
저자 : Yue Wang*, Hung Le*, Akhilesh Deepak Gotmare, Nghi DQ Bui, Junnan Li, Steven CH Hoi (*는 균등 기여를 나타냄)
제목 : CodeT5: 코드 이해 및 생성을 위한 식별자 인식 통합 사전 훈련된 인코더-디코더 모델
저자 : Yue Wang, Weishi Wang, Shafiq Joty, Steven CH Hoi
실제로 CodeT5 및 CodeT5+ 모델은 AI 기반 코딩 도우미로 배포되어 소프트웨어 개발자의 생산성을 높일 수 있습니다. Salesforce에서는 CodeT5를 VS Code 플러그인으로 사용하여 세 가지 기능을 제공하는 AI 코딩 도우미 데모를 구축합니다.
2023년 5월
CodeT5+ 종이와 모델이 출시되었습니다!
종이 | 코드 | 모델 | 블로그
2022년 9월
우리의 CodeRL 논문이 NeurIPS 2022에 승인되었습니다!
종이 | 코드 | 블로그
2022년 7월
HuggingFace에서는 CodeRL 문서에 소개된 Salesforce/codet5-large 및 Salesforce/codet5-large-ntp-py라는 두 개의 대형 CodeT5 체크포인트를 출시합니다.
2021년 10월
우리는 백서에서 다루는 모든 다운스트림 작업에 대해 미세 조정된 체크포인트를 공개합니다. 또한 다국어 코드 요약을 위한 CodeT5 기반 미세 조정 체크포인트(Salesforce/codet5-base-multi-sum)를 출시합니다.
2021년 9월
EMNLP 2021에 승인된 CodeT5 논문 및 모델이 출시되었습니다!
종이 | 코드 | 모델 | 모델 카드 | 블로그
이 코드가 연구에 유용하다고 생각되면 다음을 인용해 보세요.
@inproceedings{
wang2021codet5,
title={CodeT5: Identifier-aware Unified Pre-trained Encoder-Decoder Models for Code Understanding and Generation},
author={Yue Wang, Weishi Wang, Shafiq Joty, Steven C.H. Hoi},
booktitle={EMNLP},
year={2021},
}
@inproceedings{
le2022coderl,
title={CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning},
author={Le, Hung and Wang, Yue and Gotmare, Akhilesh Deepak and Savarese, Silvio and Hoi, Steven C. H.},
booktitle={NeurIPS},
year={2022}
}
@article{
wang2023codet5plus,
title={CodeT5+: Open Code Large Language Models for Code Understanding and Generation},
author={Wang, Yue and Le, Hung and Gotmare, Akhilesh Deepak and Bui, Nghi D.Q. and Li, Junnan and Hoi, Steven C. H.},
journal={arXiv preprint},
year={2023}
}
코드는 BSD-3 라이센스(자세한 내용은 LICENSE.txt
참조)에 따라 공개되지만 사용자는 다음 사항도 존중해야 합니다.
이 소프트웨어는 다음을 홍보하거나 이익을 얻는 데 사용되어서는 안 됩니다.
폭력, 증오, 분열,
환경파괴,
인권을 남용하거나
사람들의 육체적 정신적 건강을 파괴합니다.
이 소프트웨어 사용자는 [email protected]으로 이메일을 보내 소프트웨어를 사용하는 응용 프로그램에 대해 알려주고 이 모델의 고부담 응용 프로그램을 개발할 때 적절한 문서를 사용할 것을 권장합니다.
질문, 제안, 요청 또는 버그 보고서가 있는 경우 GitHub 문제를 생성해 주세요. PR을 환영합니다!