awesome legal nlp
1.0.0
데이터세트 | 모래밭 | 도메인 | 언어 | 크기 |
---|---|---|---|---|
FSCS(Niklaus 외, 2021) | ? ? | 스위스 법원 판결 | ?? ?? ?? | 2개 결과가 포함된 85,000개 사례 |
ECtHR(Chalkidis 외, 2021) | ? ? | EU 법원 판결 | ?? | 11개 결과가 포함된 11,000개 사례 |
ECHR(Aletras 외, 2019) | ? ? | EU 법원 판결 | ?? | 11개 결과가 있는 11.5K 케이스 |
CAIL(Xiao 외, 2018) | ? | 중국 법원 판결 | ?? | 6개 결과가 포함된 260만 건의 사례 |
데이터세트 | 모래밭 | 도메인 | 언어 | 크기 |
---|---|---|---|---|
GLC(Papaloukas 외, 2021) | ? ? | 그리스 법률 | ?? | 47.5K 법률(2.7K 라벨 포함) |
CUAD(Hendrycks 외, 2021) | ? ? | 계약 | ?? | 41개 클래스의 510개 계약 |
MultiEURLEX(Chalkidis 외, 2021) | ? ? | EU 법률 | ?? ?? ?? ?? ?? (18세 이상) | 4.5,000개 라벨이 포함된 65,000개 법률 |
LEDGAR(Tuggener 외, 2020) | ? ? | 계약 | ?? | 60.5K 계약(12.6K 레이블 포함) |
계약 발견(Borchmann et al., 2020) | ? | 계약 | ?? | 21개의 클래스가 포함된 2.6K개의 조항 |
EURLEX-57K(Chalkidis 외, 2019) | ? ? | EU 법률 | ?? | 4.3,000개 라벨이 포함된 57,000개 법률 |
불공정-ToS(Lippi 외, 2018) | ? ? | 계약 | ?? | 9개 클래스가 있는 9.4K 문장 |
계약 요소(Chalkidis et al., 2017) | ? ? | 계약 | ?? | 10개 클래스의 2400개 계약 |
OPP-115(윌슨 외, 2016) | ? ? | 개인 정보 보호법 | ?? | 23,000개 라벨이 포함된 115개 정책 |
데이터세트 | 모래밭 | 도메인 | 언어 | 크기 |
---|---|---|---|---|
BSARD(루이 외, 2022) | ? ? | 벨기에 법률 | ?? | 22.6K개의 후보 법령 조항이 포함된 1.1K개의 질문 |
EU2UK(Chalkidis 외, 2021) | ? ? | EU 및 영국 법률 | ?? | 52.5K 후보 문서가 포함된 2K 쿼리 문서 |
UK2EU(Chalkidis 외, 2021) | ? ? | EU 및 영국 법률 | ?? | 3.9K 후보 문서가 포함된 2.1K 쿼리 문서 |
COLIEE-Case-Law-Retrieval(Rabelo 외, 2020) | ? ? | 캐나다의 선례 | ?? | 128,000개의 후보 사례가 포함된 650개의 쿼리 사례 |
COLIEE-법률-검색(Rabelo et al., 2020) | ? ? | 일본법 | ?? ?? | 768개의 후보 법령 조항이 포함된 808개의 질문 |
CAIL2019-SCM(샤오 외, 2019) | ? | 중국 법원 판결 | ?? | 8.9K의 세 가지 사례 |
데이터세트 | 모래밭 | 도메인 | 언어 | 크기 |
---|---|---|---|---|
CaseHOLD(Zheng 외, 2021) | ? | 미국 사례 보유 | ?? | 53.1K개의 객관식 질문 |
JEC-QA(종 외, 2019) | ? ? | 중국법 | ?? | 26.3K개의 객관식 문제 |
CJRC (Duan 외, 2019) | ? | 중국 법원 판결 | ?? | 10,000개 문서의 50,000개 질문-답변 |
PrivacyQA(Ravichander 외, 2019) | ? | 개인 정보 보호 정책 | ?? | 35개 문서의 1700개 질문-답변 |
데이터세트 | 모래밭 | 도메인 | 언어 | 크기 |
---|---|---|---|---|
COLIEE-Case-Law-Entailment(Rabelo 외, 2020) | ? ? | 캐나다의 선례 | ?? | 관련사건 포함 425건 |
COLIEE-법률-수반(Rabelo et al., 2020) | ? ? | 일본법 | ?? ?? | 관련 법령 조항이 포함된 질문 808개 |
데이터세트 | 모래밭 | 도메인 | 언어 | 크기 |
---|---|---|---|---|
UK-Abs(Shukla 외, 2022) | ? ? | 영국 법원 사건 | ?? | 영국 대법원의 793쌍(사건, 요약 요약) |
IN-Abs(Shukla 외, 2022) | ? ? | 인도 법원 사건 | ?? | 인도 대법원의 7.1K 쌍(사건, 요약 요약) |
IN-Ext(Shukla 외, 2022) | ? ? | 인도 법원 사건 | ?? | 인도 대법원의 50쌍(사건, 추출 요약) |
TOS;DR(Keymanesh 외, 2020) | ? | 서비스 약관 | ?? | 데이터 개인 정보 보호 정책의 1.6K 쌍(계약 텍스트, 요약) |
BillSum(Kornilova 외, 2019) | ? ? | 미국 의회 법안 | ?? | (청구서, 요약) 22.2K 쌍 |
TL;DRLegal(Manor 외, 2019) | ? | 서비스 약관 | ?? | 소프트웨어 라이센스의 84개 쌍(계약 텍스트, 요약) |
TOS;DR(매너 외, 2019) | ? | 서비스 약관 | ?? | 데이터 개인 정보 보호 정책 중 421쌍(계약 텍스트, 요약) |
BVA 사례(Zhong et al., 2019) | ? | 미국 법원 사건 | ?? | 미국 재향 군인 항소 위원회의 92쌍(사례, 요약) |
LCR(갈가니 외, 2012) | ? ? | 호주 법원 사건 | ?? | (케이스, 캐치프레이즈) 3.9K 쌍 |
데이터세트 | 모래밭 | 언어 | 크기 |
---|---|---|---|
Pile of Law(Henderson 외, 2022) | ? ? | ?? | ~256GB의 법률 및 행정 법률 텍스트 |
데이터세트 | 일 | 언어 | 작업 |
---|---|---|---|
FairLex(Chalkidis 외, 2022) | ? ? | ?? ?? ?? ?? ?? | 분류(x1), 법적 판단 예측(x3) |
LexGLUE(Chalkidis 외, 2022) | ? ? | ?? | 분류(x6), 객관식 QA(x1) |
모델 | 모래밭 | 언어 | 크기 |
---|---|---|---|
Legal-HeBERT(Chriqui 외, 2022) | ? ? | ?? | 1억 1천만 |
PoL-BERT-Large(Henderson 외, 2022) | ? ? | ?? | 336M |
이탈리아어-LEGAL-BERT(Licari 및 Comande, 2022) | ? ? | ?? | 1억 1천만 |
JuriBERT(Douka et al., 2021) | ? ? | ?? | {6M, 15M, 42M, 110M} |
맞춤형-LEGAL-BERT(Zheng 외, 2021) | ? ? | ?? | 1억 1천만 |
LEGAL-BERT(Chalkidis 외, 2020) | ? ? | ?? | {35M, 110M} |
LEGAL-GPT-{1,2} (Borchmann 외, 2020) | ? | ?? | {117M, 1.5B} |
2017
] 인공 지능 및 법률 분석: 디지털 시대의 법률 실무를 위한 새로운 도구 , K. Ashley. [링크] 2020-05
] NLP가 법률 시스템에 어떻게 도움이 됩니까: 법적 인공 지능 요약 , H. Zhong et al. [PDF]2019-09
] AI와 법률에서 사례 예측의 역할 변화에 대한 간략한 역사 , K. Ashley [pdf]2018-12
] 법의 딥 러닝: 대규모 말뭉치를 훈련한 초기 적응 및 법률 단어 임베딩 , I. Chalkidis et al. [PDF] 2019-06
] 데이터로서의 법칙: 법률 연구를 위한 자연어 처리의 전망과 과제 , A. Dyevre. [슬라이드]2019-04
] 인공지능과 법 – 개요와 역사 , H. Surden. [동영상]