gpt 2 다운로드 - gpt 2 소스 코드 다운로드

gpt 2

기타 소스코드

1.0.0

다운로드

상태: 보관(코드는 있는 그대로 제공되며 업데이트는 예상되지 않음)

gpt-2

"Language Models are Unsupervised Multitask Learners" 논문의 코드 및 모델.

원본 블로그 게시물, 6개월 후속 게시물 및 최종 게시물에서 GPT-2 및 단계적 릴리스에 대해 읽을 수 있습니다.

우리는 또한 연구자들이 그들의 행동을 연구할 수 있는 데이터세트를 공개했습니다.

^* 오류로 인해 원래 매개변수 개수가 잘못되었습니다(이전 블로그 게시물 및 논문). 따라서 117M이라는 소형과 345M이라는 중간 크기를 본 적이 있을 것입니다.

용법

이 저장소는 연구원과 엔지니어가 GPT-2를 실험할 수 있는 출발점이 되도록 만들어졌습니다.

기본 정보는 모델 카드를 참조하세요.

몇 가지 주의사항

GPT-2 모델의 견고성과 최악의 경우 동작은 잘 이해되지 않습니다. 기계 학습 모델과 마찬가지로 사용 사례에 맞게 GPT-2를 주의 깊게 평가하십시오. 특히 미세 조정 없이 사용하거나 안정성이 중요한 안전 필수 애플리케이션에 사용되는 경우 더욱 그렇습니다.
GPT-2 모델이 훈련된 데이터 세트에는 편견과 사실 부정확성이 있는 많은 텍스트가 포함되어 있으므로 GPT-2 모델도 편향되고 부정확할 가능성이 높습니다.
샘플을 사람이 작성한 것으로 오해하는 것을 방지하려면 널리 배포하기 전에 샘플에 합성이라는 라벨을 명확하게 표시하는 것이 좋습니다. 우리의 모델은 종종 미묘한 면에서 일관되지 않거나 부정확하며, 이는 인간이 알아차리려면 빠르게 읽는 것보다 더 많은 시간이 걸립니다.

우리와 함께 일하세요

GPT-2 응용 프로그램에 대해 흥미로운 연구를 하고 있거나 작업 중이라면 알려주시기 바랍니다! 우리는 특히 공부하고 있는 사람들의 의견을 듣고 잠재적으로 협력하는 데 관심이 있습니다.

잠재적인 악의적 사용 사례 및 이에 대한 방어(예: 합성 텍스트의 탐지 가능성)
모델에 포함된 문제가 있는 콘텐츠(예: 편견)의 정도와 효과적인 완화 방법

개발

DEVELOPERS.md를 참조하세요.

기여자

CONTRIBUTORS.md를 참조하세요.

소환

다음 bibtex 항목을 사용하십시오:

 @article{radford2019language,
  title={Language Models are Unsupervised Multitask Learners},
  author={Radford, Alec and Wu, Jeff and Child, Rewon and Luan, David and Amodei, Dario and Sutskever, Ilya},
  year={2019}
}