The-Pile용 데이터 지원 Literotica를 다운로드, 구문 분석 및 필터링하세요.
데이터는 각 카테고리를 스파이더링하고, 각 스토리를 스파이더링한 다음, 각 페이지에 대해 후속 조치를 취하는 방식으로 이루어집니다. 데이터는 본문 텍스트를 벗어나 필터링되지 않습니다.
✔ Saved to data/Literotica.jsonl
ℹ Saved 473,653 stories
ℹ Uncompressed filesize 12,736,536,394
ℹ Compressed filesize 4,426,369,159
임시로 호스팅되는 데이터 소스
> sha256sum Literotica.jsonl.zst
3c6b968f851831c6345f175b394416f7521da3bacd90fdc827093f0d310bd4ef Literotica.jsonl.zst