microGPT เป็นการนำโมเดล Generative Pre-trained Transformer (GPT) ไปใช้เพียงเล็กน้อย สำหรับงานการประมวลผลภาษาธรรมชาติ ได้รับการออกแบบมาให้เรียบง่ายและใช้งานง่าย ทำให้เป็นตัวเลือกที่ยอดเยี่ยมสำหรับการใช้งานขนาดเล็กหรือสำหรับการเรียนรู้และการทดลองกับแบบจำลองเชิงกำเนิด
การฝึกอบรมซ้ำ 300,000 ครั้ง
pip install -r requirements.txt
tokenizer/train_tokenizer.py
เพื่อสร้างไฟล์โทเค็น โมเดลจะสร้างข้อความโทเค็นตามนั้นdatasets/prepare_dataset.py
เพื่อสร้างไฟล์ชุดข้อมูลtrain.py
เพื่อเริ่มการฝึกอบรม~แก้ไขไฟล์ที่ระบุไว้ข้างต้นหากคุณต้องการเปลี่ยนพารามิเตอร์
หากต้องการแก้ไขพารามิเตอร์การสร้างโมเดล ให้ไปที่ inference.py
ไปที่ส่วนนี้:
# Parameters (Edit here):
n_tokens = 1000
temperature = 0.8
top_k = 0
top_p = 0.9
model_path = 'models/microGPT.pth'
# Edit input here
context = "The magical wonderland of"
สนใจปรับใช้เป็นเว็บแอปหรือไม่? ลองดู microGPT-deploy !
ประสิทธิภาพตั้งแต่เริ่มต้น: พัฒนาตั้งแต่ต้นจนจบ microGPT แสดงถึงแนวทางที่มีประสิทธิภาพสำหรับโมเดล GPT ที่ได้รับการยกย่อง มันแสดงให้เห็นถึงประสิทธิภาพที่โดดเด่นในขณะที่ยังคงรักษาคุณภาพไว้เล็กน้อย
สนามเด็กเล่นแห่งการเรียนรู้: ออกแบบมาสำหรับบุคคลที่กระตือรือร้นที่จะเจาะลึกเข้าไปในโลกของ AI สถาปัตยกรรมของ microGPT มอบโอกาสพิเศษในการทำความเข้าใจการทำงานภายในของแบบจำลองเชิงกำเนิด มันเป็นแท่นปล่อยจรวดสำหรับฝึกฝนทักษะและเพิ่มความเข้าใจให้ลึกซึ้งยิ่งขึ้น
โรงไฟฟ้าขนาดเล็ก: นอกเหนือจากการเรียนรู้และการทดลองแล้ว microGPT ยังเป็นตัวเลือกที่เหมาะสมสำหรับแอปพลิเคชันขนาดเล็ก ช่วยให้คุณสามารถบูรณาการการสร้างภาษาที่ขับเคลื่อนด้วย AI เข้ากับโปรเจ็กต์ที่ประสิทธิภาพและประสิทธิภาพเป็นสิ่งสำคัญยิ่ง
ความสามารถในการปรับแต่ง: ความสามารถในการปรับตัวของ microGPT ช่วยให้คุณสามารถแก้ไขและปรับแต่งโมเดลให้เหมาะกับเป้าหมายเฉพาะของคุณ โดยนำเสนอผืนผ้าใบสำหรับการสร้างโซลูชัน AI ที่ปรับให้เหมาะกับความต้องการของคุณ
เส้นทางแห่งการเรียนรู้: ใช้ microGPT เป็นก้าวสำคัญในการทำความเข้าใจรากฐานของแบบจำลองเชิงกำเนิด การออกแบบและเอกสารที่สามารถเข้าถึงได้ทำให้เกิดสภาพแวดล้อมในอุดมคติสำหรับผู้ที่เพิ่งเริ่มใช้ AI
Experimentation Lab: เข้าร่วมการทดลองโดยปรับแต่งและทดสอบพารามิเตอร์ของ microGPT ความเรียบง่ายและความสามารถรอบด้านของโมเดลนี้ทำให้เกิดรากฐานอันอุดมสมบูรณ์สำหรับนวัตกรรม
หากคุณต้องการมีส่วนร่วม โปรดปฏิบัติตามหลักเกณฑ์เหล่านี้:
การมีส่วนร่วมในพื้นที่เก็บข้อมูลนี้แสดงว่าคุณตกลงที่จะปฏิบัติตามหลักจรรยาบรรณของเรา และการมีส่วนร่วมของคุณจะถูกเผยแพร่ภายใต้ใบอนุญาตเดียวกันกับพื้นที่เก็บข้อมูล
โมเดลนี้ได้รับแรงบันดาลใจจาก Andrej Karpathy มาสร้าง GPT จากวิดีโอเริ่มต้นและ Andrej Kaparthy nanoGPT พร้อมการแก้ไขสำหรับโปรเจ็กต์นี้กันดีกว่า