Traitement juridique du langage naturel
? Ensembles de données
Prédiction du jugement juridique (LJP)
Ensemble de données | Links | Domaine | Langue | Taille |
---|
FSCS (Niklaus et al., 2021) | ? ? | Jugements des tribunaux suisses | ?? ?? ?? | 85 000 cas avec 2 résultats |
CEDH (Chalkidis et al., 2021) | ? ? | Jugements des tribunaux de l'UE | ?? | 11 000 cas avec 11 résultats |
CEDH (Aletras et al., 2019) | ? ? | Jugements des tribunaux de l'UE | ?? | 11,5K cas avec 11 résultats |
CAIL (Xiao et coll., 2018) | ? | Jugements des tribunaux chinois | ?? | 2,6 millions de cas avec 6 résultats |
Classification des textes juridiques (LTC)
Ensemble de données | Links | Domaine | Langue | Taille |
---|
GLC (Papaloukas et al., 2021) | ? ? | Législation grecque | ?? | 47,5 000 lois avec 2,7 000 étiquettes |
CUAD (Hendrycks et al., 2021) | ? ? | Contrats | ?? | 510 contrats avec 41 classes |
MultiEURLEX (Chalkidis et al., 2021) | ? ? | Législation européenne | ?? ?? ?? ?? ?? (18+) | 65 000 lois avec 4,5 000 étiquettes |
LEDGAR (Tuggener et al., 2020) | ? ? | Contrats | ?? | 60,5K contrats avec 12,6K labels |
Découverte de contrat (Borchmann et al., 2020) | ? | Contrats | ?? | 2,6 000 clauses avec 21 classes |
EURLEX-57K (Chalkidis et al., 2019) | ? ? | Législation européenne | ?? | 57 000 lois avec 4,3 000 étiquettes |
ToS injuste (Lippi et al., 2018) | ? ? | Contrats | ?? | 9,4K phrases avec 9 classes |
Éléments du contrat (Chalkidis et al., 2017) | ? ? | Contrats | ?? | 2,4K contrats avec 10 classes |
OPP-115 (Wilson et coll., 2016) | ? ? | Lois sur la confidentialité | ?? | 115 polices avec 23 000 étiquettes |
Récupération d'informations juridiques (LIR)
Ensemble de données | Links | Domaine | Langue | Taille |
---|
BSARD (Louis et al., 2022) | ? ? | Législation belge | ?? | 1,1K questions avec 22,6K articles statutaires candidats |
EU2UK (Chalkidis et al., 2021) | ? ? | Législation européenne et britannique | ?? | 2 000 documents de requête avec 52 500 documents candidats |
UK2EU (Chalkidis et al., 2021) | ? ? | Législation européenne et britannique | ?? | 2 100 documents de requête avec 3 900 documents candidats |
COLIEE-Case-Law-Retrieval (Rabelo et al., 2020) | ? ? | Des précédents canadiens | ?? | 650 cas de requêtes avec 128 000 cas candidats |
COLIEE-Statute-Law-Retrieval (Rabelo et al., 2020) | ? ? | Législation japonaise | ?? ?? | 808 questions avec 768 articles statutaires candidats |
CAIL2019-SCM (Xiao et al., 2019) | ? | Jugements des tribunaux chinois | ?? | 8,9 000 triplets de cas |
Réponse aux questions juridiques (LQA)
Ensemble de données | Links | Domaine | Langue | Taille |
---|
CaseHOLD (Zheng et al., 2021) | ? | Dossiers américains | ?? | 53,1K questions à choix multiples |
JEC-QA (Zhong et al., 2019) | ? ? | loi chinoise | ?? | 26 300 questions à choix multiples |
CJRC (Duan et coll., 2019) | ? | Jugements des tribunaux chinois | ?? | 50 000 questions-réponses provenant de 10 000 documents |
PrivacyQA (Ravichander et al., 2019) | ? | Politiques de confidentialité | ?? | 1,7K questions-réponses provenant de 35 documents |
Implication textuelle juridique (LTE)
Ensemble de données | Links | Domaine | Langue | Taille |
---|
COLIEE-Case-Law-Entailment (Rabelo et al., 2020) | ? ? | Des précédents canadiens | ?? | 425 cas avec cas connexe |
COLIEE-Statut-Law-Entailment (Rabelo et al., 2020) | ? ? | Législation japonaise | ?? ?? | 808 questions avec article statutaire connexe |
Résumé du texte juridique (LTS)
Ensemble de données | Links | Domaine | Langue | Taille |
---|
UK-Abs (Shukla et al., 2022) | ? ? | Affaires judiciaires au Royaume-Uni | ?? | 793 paires de (cas, résumé abstrait) de la Cour suprême du Royaume-Uni |
IN-Abs (Shukla et al., 2022) | ? ? | Affaires judiciaires indiennes | ?? | 7,1 000 paires de (cas, résumé abstrait) de la Cour suprême indienne |
IN-Ext (Shukla et al., 2022) | ? ? | Affaires judiciaires indiennes | ?? | 50 paires de (cas, résumé extractif) de la Cour suprême indienne |
TOS ;DR (Keymanesh et al., 2020) | ? | Conditions d'utilisation | ?? | 1,6 000 paires de (texte de l'accord, résumé) issus des politiques de confidentialité des données |
BillSum (Kornilova et al., 2019) | ? ? | Projets de loi du Congrès américain | ?? | 22,2K paires de (facture, résumé) |
TL;DRLegal (Manor et al., 2019) | ? | Conditions d'utilisation | ?? | 84 paires de (texte de l'accord, résumé) provenant de licences de logiciels |
TOS ;DR (Manor et al., 2019) | ? | Conditions d'utilisation | ?? | 421 paires de (texte de l'accord, résumé) issues des politiques de confidentialité des données |
Cas BVA (Zhong et al., 2019) | ? | Affaires judiciaires américaines | ?? | 92 paires de (cas, résumé) du US Board of Veterans' Appeal |
LCR (Galgani et al., 2012) | ? ? | Affaires judiciaires australiennes | ?? | 3,9K paires de (cas, slogans) |
Modélisation du langage juridique (LLM)
Ensemble de données | Links | Langue | Taille |
---|
Pile de lois (Henderson et al., 2022) | ? ? | ?? | ~256 Go de texte juridique et administratif |
Repères
Ensemble de données | Tâche | Langue | Tâches |
---|
FairLex (Chalkidis et al., 2022) | ? ? | ?? ?? ?? ?? ?? | Classification (x1), prédiction de jugement judiciaire (x3) |
LexGLUE (Chalkidis et al., 2022) | ? ? | ?? | Classification (x6), QA à choix multiples (x1) |
Modèles
Modèle | Links | Langue | Taille |
---|
Juridique-HeBERT (Chriqui et al., 2022) | ? ? | ?? | 110M |
PoL-BERT-Large (Henderson et al., 2022) | ? ? | ?? | 336M |
Italien-LEGAL-BERT (Licari et Comande, 2022) | ? ? | ?? | 110M |
JuriBERT (Douka et al., 2021) | ? ? | ?? | {6 M, 15 M, 42 M, 110 M} |
Custom-LEGAL-BERT (Zheng et al., 2021) | ? ? | ?? | 110M |
LEGAL-BERT (Chalkidis et al., 2020) | ? ? | ?? | {35 M, 110 M} |
LEGAL-GPT-{1,2} (Borchmann et al., 2020) | ? | ?? | {117 millions, 1,5 milliard} |
Livres
- [
2017
] Intelligence artificielle et analyse juridique : nouveaux outils pour la pratique du droit à l'ère numérique , K. Ashley. [lien]
? Enquêtes
- [
2020-05
] Comment la PNL profite-t-elle au système juridique : un résumé de l'intelligence artificielle juridique , H. Zhong et al. [pdf] - [
2019-09
] Un bref historique des rôles changeants de la prédiction des cas dans l'IA et le droit , K. Ashley [pdf] - [
2018-12
] Deep learning en droit : adaptation précoce et intégrations de mots juridiques formées sur de grands corpus , I. Chalkidis et al. [pdf]
? Pourparlers
- [
2019-06
] Le droit comme données : promesses et défis du traitement du langage naturel pour la recherche juridique , A. Dyevre. [diapositives] - [
2019-04
] Intelligence artificielle et droit – Un aperçu et une histoire , H. Surden. [vidéo]
? Conférences et ateliers
- L'atelier sur le traitement du langage juridique naturel (NLLP) [site Web]
- La Conférence internationale sur l'intelligence artificielle et le droit (ICAIL) [site web]
- La Conférence internationale sur les connaissances juridiques et les systèmes d'information (JURIX) [site Web]
- L'atelier EXplainable AI in Law (XAILA) [site Web]
- L'Atelier International de Juris-informatique (JURISIN) [site web]
- Le Concours d'Extraction/Entaillement d'Informations Juridiques (COLIEE) [site internet]
- L'atelier international sur la recherche d'informations juridiques [site Web]