ยินดีต้อนรับสู่ที่เก็บ การปรับแต่งและประเมินผล LLM ! - ที่นี่เราเจาะลึกเข้าไปในโลกที่น่าตื่นเต้นของ รูปแบบภาษาขนาดใหญ่ (LLM) การปรับแต่งและการประเมินผลโดยมุ่งเน้นไปที่เทคนิคที่ทันสมัยเพื่อปรับรูปแบบเช่น Flan-T5 , Tinyllama และ Aguila7b สำหรับงาน การประมวลผลภาษาธรรมชาติที่หลากหลาย (NLP) -
เมื่อ LLM กลายเป็นส่วนสำคัญของแอพพลิเคชั่น AI ที่ทันสมัยความสามารถในการปรับแต่งและประเมินโมเดลเหล่านี้ได้อย่างมีประสิทธิภาพไม่เคยมีความสำคัญมากขึ้น ที่เก็บนี้ได้รับการออกแบบมาเพื่อช่วยให้คุณนำทางความซับซ้อนของการปรับแต่งแบบจำลองนำเสนอข้อมูลเชิงลึกและเครื่องมือที่ใช้งานได้จริงเพื่อเพิ่มประสิทธิภาพความถูกต้องและความรับผิดชอบทางจริยธรรมของแบบจำลองของคุณ
ไม่ว่าคุณจะกำลังทำงานอยู่:
พื้นที่เก็บข้อมูลนี้ให้ทรัพยากรเพื่อยกระดับโครงการของคุณให้อยู่ในระดับต่อไป
ฉันอยากจะขยายความกตัญญูอย่างจริงใจให้กับ Santiago Hernándezผู้เชี่ยวชาญด้านความปลอดภัยทางไซเบอร์และปัญญาประดิษฐ์ หลักสูตรที่เหลือเชื่อของเขาเกี่ยวกับการเรียนรู้อย่างลึกซึ้งและ AI Generative ที่ Udemy มีส่วนช่วยในการสร้างการพัฒนาโครงการนี้
สำหรับข้อมูลที่ครอบคลุมเกี่ยวกับโครงการนี้ลองดูบทความสื่อนี้
ในการเริ่มต้นใช้งานดูสมุดบันทึกสำหรับคำแนะนำทีละขั้นตอนเกี่ยวกับการปรับแต่งแบบจำลองและการประเมินผล:
Instruction_Fine_Tuning_LLM_T5.ipynb
: คำแนะนำโดยละเอียดเกี่ยวกับการปรับแต่ง FLAN-T5 สำหรับการสรุปภาษาสเปนEvaluation_and_Analysis_T5_Familiy_LLMs.ipynb
: ข้อมูลเชิงลึกเกี่ยวกับการประเมินและวิเคราะห์แบบจำลอง T5 ต่างๆ -Parameter_Efficient_Fine_Tuning_QLoRA_Legal_Assistance.ipynb
: เรียนรู้เกี่ยวกับการปรับแต่งกับ Qlora สำหรับงานพิเศษเช่นร่างเอกสารทางกฎหมายTinyLLAMA_PPO_RLHF_Avoiding_Offensive_Language.ipynb
: สำรวจกระบวนการปรับจูนของ Tinyllama โดยใช้ PPO และ RLHF เพื่อหลีกเลี่ยงภาษาที่เป็นอันตรายหรือน่ารังเกียจ ?Evaluation_of_Fine_Tuned_Large_Language_Models_for_ILENIA.ipynb
: การประเมินผลของแบบจำลองที่ปรับจูนในกรอบ Ilenia รวมถึงโครงการ Aguila7b และ Latxa ในการศึกษาใหม่นี้เป้าหมายหลักคือการปรับแต่ง Tinyllama โดยใช้เทคนิค การเพิ่มประสิทธิภาพนโยบายใกล้เคียง (PPO) รวมกับ การเรียนรู้เสริมแรงจากข้อเสนอแนะของมนุษย์ (RLHF) วัตถุประสงค์คือเพื่อปรับแต่งความสามารถของแบบจำลองในการหลีกเลี่ยงการสร้างภาษาที่เป็นอันตรายไม่เหมาะสมหรือเป็นพิษในขณะที่รักษาการสร้างเนื้อหาที่มีความหมาย
ไฮไลท์ของการศึกษา:
สำหรับความเข้าใจที่ครอบคลุมเกี่ยวกับวิธีการและผลลัพธ์โปรดดูที่โน้ตบุ๊ก: TinyLLAMA_PPO_RLHF_Avoiding_Offensive_Language.ipynb
โครงการ Ilenia เป็นส่วนหนึ่งของ โครงการยุทธศาสตร์ของสเปนเพื่อการฟื้นตัวทางเศรษฐกิจและการเปลี่ยนแปลง (PECRET) ซึ่งมุ่งเน้นไปที่การพัฒนาทรัพยากรหลายภาษาสำหรับ เศรษฐกิจภาษาใหม่ (NEL) ความคิดริเริ่มนี้สนับสนุนการใช้ภาษาสเปนและภาษาราชการอื่น ๆ เพื่อผลักดันการเติบโตทางเศรษฐกิจและความสามารถในการแข่งขันระหว่างประเทศในด้านต่าง ๆ เช่น AI การแปลและการศึกษา
เป็นส่วนหนึ่งของความพยายามนี้เราประเมิน LLM จากโครงการ Aguila7B และ LATXA ซึ่งออกแบบมาสำหรับงานการประมวลผลข้อความและการพูด การประเมินเหล่านี้มุ่งเน้นไปที่ประสิทธิภาพของแบบจำลองเพื่อให้มั่นใจว่าพวกเขาสอดคล้องกับความต้องการทางสังคมและเทคโนโลยีโดยเฉพาะอย่างยิ่งในบริบทหลายภาษาและข้ามภาษา
ประเด็นสำคัญ:
สำหรับการวิเคราะห์เชิงลึกให้ดูที่โน้ตบุ๊ก: Evaluation_of_Fine_Tuned_Large_Language_Models_for_ILENIA.ipynb
ในโลกที่มีการพัฒนาอย่างรวดเร็วของการประมวลผลภาษาธรรมชาติ (NLP) การใช้ประโยชน์จากแบบจำลองภาษาที่ผ่านการฝึกอบรมมาก่อนได้กลายเป็นสิ่งสำคัญสำหรับการปรับปรุงประสิทธิภาพในงานต่างๆ - ในบรรดาสิ่งเหล่านี้ตระกูล T5 ของโมเดลโดดเด่นสำหรับความเก่งกาจและประสิทธิผลในการจัดการงานภาษาที่หลากหลาย การศึกษาครั้งนี้นำเสนอการประเมินและการวิเคราะห์แบบจำลอง T5 ที่ผ่านการฝึกอบรมมาก่อนโดยมุ่งเน้นไปที่วิธีการทางวิศวกรรมที่รวดเร็วและตัวอย่างไม่กี่นัดสามารถใช้ในการปรับโมเดลเหล่านี้ได้อย่างไร -
ตระกูล T5 รวมถึงโมเดลเช่น T5-base, T5 ขนาดใหญ่และ Flan-T5 ได้แสดงความสามารถที่น่าประทับใจในการสร้างข้อความการตอบคำถามและการแปล ยังมีที่ว่างสำหรับการเพิ่มประสิทธิภาพเสมอ การปรับแต่งโมเดลเหล่านี้โดยใช้วิศวกรรมที่รวดเร็ว-การออกแบบและการจัดโครงสร้างการป้อนข้อมูลด้วยการเรียนรู้ด้วยการเรียนรู้ไม่กี่ครั้งนำเสนอวิธีการที่ทรงพลังในการปรับปรุงประสิทธิภาพของพวกเขาโดยไม่ต้องฝึกอบรมอย่างกว้างขวาง
ในงานนี้เราประเมินแบบจำลอง T5 ที่แตกต่างกันอย่างละเอียดสำรวจว่าเทคนิคทางวิศวกรรมที่รวดเร็วและการตั้งค่าการเรียนรู้ไม่กี่ครั้งส่งผลกระทบต่อประสิทธิภาพของพวกเขา เป้าหมายของเราคือการเปิดเผยแนวทางปฏิบัติที่ดีที่สุดสำหรับการปรับแต่งแบบจำลองที่ได้รับการฝึกอบรมล่วงหน้าเพื่อให้ได้ดีในแอพพลิเคชั่นในโลกแห่งความเป็นจริง โดยการวิเคราะห์จุดแข็งและข้อ จำกัด ของแต่ละโมเดลภายใต้เงื่อนไขที่แตกต่างกันการศึกษาครั้งนี้มีวัตถุประสงค์เพื่อให้ข้อมูลเชิงลึกที่มีคุณค่าในการเพิ่มประสิทธิภาพ LLM ที่ใช้ T5 สำหรับงาน NLP ที่หลากหลาย -
สำหรับคำแนะนำโดยละเอียดของกระบวนการประเมินผลและการค้นพบโปรดดูที่โน้ตบุ๊ก: Evaluation_and_Analysis_T5_Family_LLMs.ipynb
ยินดีต้อนรับสู่โครงการนี้เกี่ยวกับการปรับปรุงรูปแบบภาษา Flan-T5-Small สำหรับการสรุปบทความหนังสือพิมพ์สเปน! - ในคู่มือนี้เรามุ่งเน้นไปที่การเรียนการสอนการปรับแต่งโมเดล Flan-T5-Small เพื่อปรับปรุงความสามารถในการสร้างบทสรุปที่กระชับและแม่นยำของเนื้อหาข่าวในภาษาสเปน
Notebook Instruction_Fine_Tuning_LLM_T5.ipynb
ให้คำแนะนำโดยละเอียดของกระบวนการทั้งหมด มันครอบคลุม:
โดยทำตามคำแนะนำในสมุดบันทึกคุณจะได้เรียนรู้วิธีปรับรูปแบบที่ได้รับการฝึกอบรมมาก่อนที่ทรงพลังนี้เพื่อจัดการการสรุปข้อความภาษาสเปนอย่างมีประสิทธิภาพทำให้สามารถส่งมอบบทสรุปที่ชัดเจนและสอดคล้องกันของบทความข่าว ?
สำหรับคู่มือที่ครอบคลุมโปรดดูที่ Notebook Instruction_Fine_Tuning_LLM_T5.ipynb
สนุกกับการสำรวจและปรับแต่ง! -
ส่วนนี้แนะนำแนวคิดของ การปรับแต่งพารามิเตอร์ที่มีประสิทธิภาพ (PEFT) โดยใช้ Qlora สำหรับการปรับปรุงรูปแบบภาษาในบริบททางกฎหมาย Qlora (การปรับตัวระดับต่ำเชิงปริมาณ) ได้รับการออกแบบมาเพื่อปรับแต่งแบบจำลองภาษาขนาดใหญ่ที่มีพารามิเตอร์น้อยลงอย่างมีประสิทธิภาพลดทั้งข้อกำหนดการคำนวณและหน่วยความจำ
โน้ตบุ๊ก Parameter_Efficient_Fine_Tuning_QLoRA_Legal_Assistance.ipynb
รายละเอียดต่อไปนี้:
วิธีการนี้ช่วยให้สามารถปรับแบบจำลองภาษาได้อย่างมีประสิทธิภาพให้เข้ากับงานพิเศษเช่นการร่างเอกสารทางกฎหมายทำให้มั่นใจได้ว่ามีประสิทธิภาพสูงในขณะที่การจัดการการใช้ทรัพยากรอย่างมีประสิทธิภาพ
สำหรับคู่มือที่ครอบคลุมเกี่ยวกับการปรับแต่ง Qlora โปรดดูที่โน้ตบุ๊กพารามิเตอร์ Parameter_Efficient_Fine_Tuning_QLoRA_Legal_Assistance.ipynb
สำรวจศักยภาพของเทคนิคการปรับจูนที่มีประสิทธิภาพสำหรับการใช้งานทางกฎหมาย! ?
อย่าลังเลที่จะสำรวจทดลองและมีส่วนร่วมในสาขาที่น่าตื่นเต้นของ LLM ความคิดเห็นและการมีส่วนร่วมของคุณยินดีต้อนรับเสมอ! -
มีความสุขในการปรับแต่งและประเมินผล!
ฉันอยากจะขยายความกตัญญูอย่างจริงใจให้กับ Santiago Hernándezผู้เชี่ยวชาญด้านความปลอดภัยทางไซเบอร์และปัญญาประดิษฐ์ หลักสูตรที่เหลือเชื่อของเขาเกี่ยวกับการเรียนรู้อย่างลึกซึ้งและ AI กำเนิดที่มีอยู่ที่ Udemy เป็นเครื่องมือสำคัญในการสร้างการพัฒนาโครงการนี้
การมีส่วนร่วมในโครงการนี้ได้รับการสนับสนุนอย่างสูง! หากคุณสนใจที่จะเพิ่มคุณสมบัติใหม่การแก้ไขข้อบกพร่องหรือเพิ่มประสิทธิภาพการทำงานของโครงการโปรดส่งคำขอดึง
โครงการนี้ได้รับการพัฒนาและดูแลโดย Sergio SánchezSánchez (ซอฟต์แวร์ในฝัน) ขอขอบคุณเป็นพิเศษกับชุมชนโอเพนซอร์ซและผู้สนับสนุนที่ทำให้โครงการนี้เป็นไปได้ หากคุณมีคำถามข้อเสนอแนะหรือข้อเสนอแนะใด ๆ อย่าลังเลที่จะติดต่อที่ [email protected]
โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT ซึ่งเป็นใบอนุญาตซอฟต์แวร์โอเพนซอร์ซที่อนุญาตให้นักพัฒนาใช้งานคัดลอกแก้ไขและแจกจ่ายซอฟต์แวร์ได้อย่างอิสระ ซึ่งรวมถึงการใช้งานทั้งในโครงการส่วนบุคคลและเชิงพาณิชย์โดยมีข้อกำหนดเพียงอย่างเดียวคือการแจ้งเตือนลิขสิทธิ์ดั้งเดิม -
โปรดทราบข้อ จำกัด ต่อไปนี้:
เป้าหมายของใบอนุญาตนี้คือการเพิ่มอิสระให้กับนักพัฒนาในขณะที่ยังคงรับรู้ถึงผู้สร้างดั้งเดิม
MIT License
Copyright (c) 2024 Dream software - Sergio Sánchez
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in all
copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
SOFTWARE.