GPT-J เป็นทางเลือกโอเพ่นซอร์สจาก EleutherAI ไปจนถึง GPT-3 ของ OpenAI พร้อมให้ทุกคนดาวน์โหลด โดยสามารถปรับแต่ง GPT-J ให้ทำงานได้เช่นเดียวกับโมเดลขนาดใหญ่ในงาน NLP ต่างๆ รวมถึงการตอบคำถาม การวิเคราะห์ความรู้สึก และการรับรู้เอนทิตีที่มีชื่อ
ลองใช้ GPT-J ด้วยตัวคุณเองบน Paperspace ด้วย IPU (Intelligence Processing Unit) ของ Graphcore ซึ่งเป็นโปรเซสเซอร์แบบขนานขนาดใหญ่รูปแบบใหม่ที่ช่วยเร่งความเร็วความฉลาดของเครื่องจักร เข้าถึงการประมวลผล IPU ขั้นสูงและคุ้มต้นทุนตามความต้องการในระบบคลาวด์บน Paperspace เพื่อสร้าง ปรับแต่ง และปรับใช้โมเดล AI เช่น GPT-J
โน๊ตบุ๊ค | กรอบ | พิมพ์ | ลองฟรี |
---|---|---|---|
Entailment ข้อความบน IPU โดยใช้ GPT-J - การปรับแต่งอย่างละเอียด | กอดหน้า | การปรับแต่งแบบละเอียด | |
การสร้างข้อความด้วย GPT-J 6B | กอดหน้า | การอนุมาน | |
การสร้างข้อความที่เร็วขึ้นด้วย GPT-J โดยใช้ Weight Quantization 4 บิตบน IPU | กอดหน้า | การอนุมาน |
ใน Textual Entailment บน IPU โดยใช้ GPT-J - สมุดบันทึกการปรับแต่ง เราจะแสดงวิธีปรับแต่งโมเดล GPT-J ที่ได้รับการฝึกล่วงหน้าซึ่งทำงานบนระบบ 16-IPU บน Paperspace เราจะอธิบายวิธีที่คุณสามารถปรับแต่ง GPT-J สำหรับ Text Entailment บนชุดข้อมูล GLUE MNLI เพื่อให้บรรลุประสิทธิภาพของ SOTA ในขณะที่ประหยัดต้นทุนมากกว่าญาติที่ใหญ่กว่ามาก
ใน การสร้างข้อความด้วยโน้ตบุ๊ก GPT-J 6B เราสาธิตให้เห็นว่าการรัน GPT-J บน Graphcore IPU นั้นง่ายเพียงใด โดยใช้โมเดลนี้ และ ? จุดตรวจดุมของตุ้มน้ำหนักโมเดล
ใน การสร้างข้อความที่เร็วขึ้นด้วย GPT-J โดยใช้ Weight Quantization แบบ 4 บิตบนสมุดบันทึก IPU เราจะแสดงวิธีใช้การวัดปริมาณแบบกลุ่มเพื่อบีบอัดพารามิเตอร์โมเดลเป็น 4 บิตโดยไม่มีการปรับแต่งอย่างละเอียด โดยใช้หน่วยความจำน้อยลง 4 เท่า และเร่งการอนุมานบน GPT- J คูณ ~1.5x
หากต้องการใช้ GPT-J บน IPU เพิ่มเติมหรือพูดคุยกับผู้เชี่ยวชาญ โปรดติดต่อเรา
เข้าร่วมชุมชนที่กำลังเติบโตของเราและโต้ตอบกับผู้เชี่ยวชาญ AI นักพัฒนา IPU และนักวิจัย รับฟังข่าวสาร IPU ล่าสุดและเข้าถึงโมเดลใหม่ล่าสุดของเรา
เนื้อหาของที่เก็บนี้จัดทำขึ้นตามเงื่อนไขของใบอนุญาต MIT ดูไฟล์ใบอนุญาตที่ให้มาเพื่อดูรายละเอียด