การประมวลผลภาษาธรรมชาติทางกฎหมาย
- ชุดข้อมูล
การทำนายคำพิพากษาทางกฎหมาย (แอลเจพี)
ชุดข้อมูล | ลิงค์ | โดเมน | ภาษา | ขนาด |
---|
FSCS (Niklaus และคณะ 2021) | - - | คำพิพากษาศาลสวิส | - - - | 85,000 เคสพร้อมผลลัพธ์ 2 รายการ |
ECtHR (Chalkidis และคณะ 2021) | - - | คำตัดสินของศาลสหภาพยุโรป | - | 11,000 เคสพร้อมผลลัพธ์ 11 รายการ |
ECHR (Aletras และคณะ 2019) | - - | คำตัดสินของศาลสหภาพยุโรป | - | 11.5K กรณีที่มีผลลัพธ์ 11 รายการ |
CAIL (Xiao และคณะ 2018) | - | คำพิพากษาของศาลจีน | - | 2.6M กรณีที่มีผลลัพธ์ 6 รายการ |
การจัดประเภทข้อความทางกฎหมาย (LTC)
ชุดข้อมูล | ลิงค์ | โดเมน | ภาษา | ขนาด |
---|
GLC (ปาปาลูคัส และคณะ 2021) | - - | กฎหมายกรีก | - | กฎหมาย 47.5K พร้อมป้ายกำกับ 2.7K |
CUAD (เฮนดริกส์ และคณะ 2021) | - - | สัญญา | - | 510 สัญญาพร้อม 41 คลาส |
MultiEURLEX (Chalkidis และคณะ 2021) | - - | กฎหมายของสหภาพยุโรป | - - - - - (18+) | กฎหมาย 65K พร้อมป้ายกำกับ 4.5K |
LEDGAR (Tuggener และคณะ 2020) | - - | สัญญา | - | สัญญา 60.5K พร้อมป้ายกำกับ 12.6K |
การค้นพบสัญญา (Borchmann et al., 2020) | - | สัญญา | - | 2.6K ข้อพร้อม 21 คลาส |
EURLEX-57K (Chalkidis และคณะ 2019) | - - | กฎหมายของสหภาพยุโรป | - | กฎหมาย 57K พร้อมป้ายกำกับ 4.3K |
ToS ที่ไม่ยุติธรรม (Lippi และคณะ 2018) | - - | สัญญา | - | ประโยค 9.4K พร้อม 9 คลาส |
องค์ประกอบสัญญา (Chalkidis et al., 2017) | - - | สัญญา | - | สัญญา 2.4K พร้อม 10 คลาส |
OPP-115 (วิลสัน และคณะ 2016) | - - | กฎหมายความเป็นส่วนตัว | - | นโยบาย 115 ฉบับพร้อมป้ายกำกับ 23K |
การเรียกค้นข้อมูลทางกฎหมาย (แอลไออาร์)
ชุดข้อมูล | ลิงค์ | โดเมน | ภาษา | ขนาด |
---|
BSARD (หลุยส์ และคณะ 2022) | - - | กฎหมายเบลเยียม | - | คำถาม 1.1K คำถามพร้อมบทความทางกฎหมายของผู้สมัคร 22.6K |
EU2UK (ชาลคิดิส และคณะ 2021) | - - | กฎหมายของสหภาพยุโรปและสหราชอาณาจักร | - | เอกสารการสืบค้น 2K พร้อมเอกสารผู้สมัคร 52.5K |
UK2EU (Chalkidis และคณะ 2021) | - - | กฎหมายของสหภาพยุโรปและสหราชอาณาจักร | - | เอกสารการสืบค้น 2.1K พร้อมเอกสารผู้สมัคร 3.9K |
COLIEE-กรณี-กฎหมาย-การดึงข้อมูล (Rabelo et al., 2020) | - - | แบบอย่างของแคนาดา | - | กรณีแบบสอบถาม 650 กรณีพร้อมกรณีผู้สมัคร 128,000 กรณี |
COLIEE-ธรรมนูญ-กฎหมาย-การดึงข้อมูล (Rabelo et al., 2020) | - - | กฎหมายของญี่ปุ่น | - - | 808 คำถามพร้อมบทความทางกฎหมายของผู้สมัคร 768 ข้อ |
CAIL2019-SCM (Xiao และคณะ 2019) | - | คำพิพากษาของศาลจีน | - | เคสจำนวน 8.9,000 เคส |
ตอบคำถามทางกฎหมาย (แอลคิวเอ)
ชุดข้อมูล | ลิงค์ | โดเมน | ภาษา | ขนาด |
---|
CaseHOLD (Zheng และคณะ, 2021) | - | การถือครองคดีของสหรัฐฯ | - | 53.1K คำถามแบบปรนัย |
JEC-QA (จง และคณะ 2019) | - - | กฎหมายจีน | - | คำถามแบบปรนัย 26.3K ข้อ |
CJRC (ด้วน และคณะ 2019) | - | คำพิพากษาของศาลจีน | - | คำถาม-คำตอบ 50,000 รายการจากเอกสาร 10,000 รายการ |
PrivacyQA (Ravichander และคณะ 2019) | - | นโยบายความเป็นส่วนตัว | - | คำถาม-คำตอบ 1.7K ข้อจากเอกสาร 35 ฉบับ |
เนื้อหาทางกฎหมาย (แอลทีอี)
ชุดข้อมูล | ลิงค์ | โดเมน | ภาษา | ขนาด |
---|
COLIEE-กรณี-กฎหมาย-Entailment (Rabelo et al., 2020) | - - | แบบอย่างของแคนาดา | - | 425 คดีพร้อมคดีที่เกี่ยวข้อง |
COLIEE-ธรรมนูญ-กฎหมาย-การบังคับใช้ (Rabelo et al., 2020) | - - | กฎหมายของญี่ปุ่น | - - | 808 คำถามพร้อมบทความทางกฎหมายที่เกี่ยวข้อง |
การสรุปข้อความทางกฎหมาย (LTS)
ชุดข้อมูล | ลิงค์ | โดเมน | ภาษา | ขนาด |
---|
UK-Abs (Shukla และคณะ 2022) | - - | คดีในศาลของสหราชอาณาจักร | - | 793 คู่ (คดี สรุปย่อ) จากศาลฎีกาของสหราชอาณาจักร |
IN-Abs (Shukla และคณะ, 2022) | - - | คดีศาลอินเดีย | - | 7.1K คู่ (คดี สรุปย่อ) จากศาลฎีกาของอินเดีย |
IN-Ext (Shukla et al., 2022) | - - | คดีศาลอินเดีย | - | 50 คู่ (คดี สรุปสารสกัด) จากศาลฎีกาอินเดีย |
TOS;DR (Keymanesh และคณะ 2020) | - | ข้อกำหนดในการให้บริการ | - | 1.6K คู่ (ข้อความข้อตกลง สรุป) จากนโยบายความเป็นส่วนตัวของข้อมูล |
BillSum (คอร์นิโลวา และคณะ 2019) | - - | ร่างกฎหมายรัฐสภาสหรัฐฯ | - | 22.2K คู่ (บิล สรุป) |
TL; DRLegal (Manor และคณะ 2019) | - | ข้อกำหนดในการให้บริการ | - | 84 คู่ (ข้อความข้อตกลง สรุป) จากลิขสิทธิ์ซอฟต์แวร์ |
TOS;DR (คฤหาสน์ และคณะ 2019) | - | ข้อกำหนดในการให้บริการ | - | 421 คู่ (ข้อความข้อตกลง สรุป) จากนโยบายความเป็นส่วนตัวของข้อมูล |
คดี BVA (Zhong et al., 2019) | - | คดีศาลสหรัฐฯ | - | 92 คู่ (กรณี, สรุป) จากการอุทธรณ์ของคณะกรรมการทหารผ่านศึกแห่งสหรัฐอเมริกา |
LCR (กัลกานี และคณะ 2012) | - - | คดีศาลออสเตรเลีย | - | 3.9K คู่ (เคส, บทกลอน) |
การสร้างแบบจำลองภาษากฎหมาย (LLM)
ชุดข้อมูล | ลิงค์ | ภาษา | ขนาด |
---|
กองกฎหมาย (Henderson et al., 2022) | - - | - | ~256GB ของข้อความทางกฎหมายและกฎหมายการบริหาร |
เกณฑ์มาตรฐาน
ชุดข้อมูล | งาน | ภาษา | งาน |
---|
แฟร์เล็กซ์ (Chalkidis et al., 2022) | - - | - - - - - | การจำแนกประเภท (x1) การทำนายคำพิพากษาทางกฎหมาย (x3) |
LexGLUE (Chalkidis และคณะ 2022) | - - | - | การจำแนกประเภท (x6), QA แบบปรนัย (x1) |
โมเดล
แบบอย่าง | ลิงค์ | ภาษา | ขนาด |
---|
กฎหมาย-HeBERT (Chriqui et al., 2022) | - - | - | 110ม |
PoL-BERT-Large (เฮนเดอร์สัน และคณะ 2022) | - - | - | 336ม |
อิตาลี-กฎหมาย-BERT (Licari และ Comande, 2022) | - - | - | 110ม |
JuriBERT (Douka และคณะ, 2021) | - - | - | {6 เดือน 15 เดือน 42 เดือน 110 เดือน} |
กำหนดเอง-กฎหมาย-BERT (Zheng et al., 2021) | - - | - | 110ม |
กฎหมาย-BERT (Chalkidis et al., 2020) | - - | - | {35M, 110M} |
LEGAL-GPT-{1,2} (บอร์ชมันน์ และคณะ 2020) | - | - | {117M, 1.5B} |
หนังสือ
- [
2017
] ปัญญาประดิษฐ์และการวิเคราะห์ทางกฎหมาย: เครื่องมือใหม่สำหรับการปฏิบัติตามกฎหมายในยุคดิจิทัล โดย K. Ashley [ลิงค์]
- แบบสำรวจ
- [
2020-05
] NLP มีประโยชน์ต่อระบบกฎหมายอย่างไร: บทสรุปของปัญญาประดิษฐ์ทางกฎหมาย , H. Zhong และคณะ [ไฟล์ PDF] - [
2019-09
] ประวัติโดยย่อของบทบาทที่เปลี่ยนแปลงของการทำนายกรณีใน AI และกฎหมาย โดย K. Ashley [pdf] - [
2018-12
] การเรียนรู้เชิงลึกด้านกฎหมาย: การปรับตัวตั้งแต่เนิ่นๆ และการฝังคำทางกฎหมายที่ได้รับการฝึกอบรมเกี่ยวกับองค์กรขนาดใหญ่ , I. Chalkidis และคณะ [ไฟล์ PDF]
- พูดคุย
- [
2019-06
] กฎหมายเป็นข้อมูล: คำสัญญาและความท้าทายของการประมวลผลภาษาธรรมชาติเพื่อการวิจัยทางกฎหมาย , A. Dyevre [สไลด์] - [
2019-04
] ปัญญาประดิษฐ์และกฎหมาย – ภาพรวมและประวัติศาสตร์ , H. Surden [วิดีโอ]
- การประชุมและเวิร์คช็อป
- การประชุมเชิงปฏิบัติการการประมวลผลภาษากฎหมายธรรมชาติ (NLLP) [เว็บไซต์]
- การประชุมนานาชาติด้านปัญญาประดิษฐ์และกฎหมาย (ICAIL) [เว็บไซต์]
- การประชุมนานาชาติว่าด้วยความรู้ทางกฎหมายและระบบสารสนเทศ (JURIX) [เว็บไซต์]
- เวิร์กช็อป AI ที่อธิบายได้ในด้านกฎหมาย (XAILA) [เว็บไซต์]
- การประชุมเชิงปฏิบัติการระหว่างประเทศด้านนิติศาสตร์-สารสนเทศ (JURISIN) [เว็บไซต์]
- การแข่งขันในการสกัด/บรรจุข้อมูลทางกฎหมาย (COLIEE) [เว็บไซต์]
- การประชุมเชิงปฏิบัติการระดับนานาชาติเกี่ยวกับการดึงข้อมูลทางกฎหมาย [เว็บไซต์]