ยินดีต้อนรับสู่ repo ของฉัน! ฉันใช้สถาปัตยกรรม Transformer ตั้งแต่เริ่มต้นโดยใช้ PyTorch ฉันพยายามอ่านองค์ประกอบย่อยที่สำคัญทั้งหมด โดยเพิ่มบันทึกย่อและการชี้แจงที่ครอบคลุม วัตถุประสงค์หลักของพื้นที่เก็บข้อมูลนี้คือการให้ความรู้และคำอธิบายที่แม่นยำสำหรับแต่ละองค์ประกอบ
คุณจะอธิบายส่วนประกอบทั้งหมดที่อธิบายไว้ในรายงานต้นฉบับ นอกเหนือจากการสร้างสถาปัตยกรรมแล้ว บันทึกย่อยังให้ข้อมูลเชิงลึกเพื่อทำความเข้าใจเหตุผลเบื้องหลังบล็อกทั้งหมดของสถาปัตยกรรมนี้ ฉันยังพยายามกำหนดพารามิเตอร์และตัวแปรที่ฉันพบว่าน่าสับสนเมื่อศึกษาพวกมัน (เช่น d_v กับ d_k)
นี่คือบล็อกที่คุณจะได้เรียนรู้การสร้างด้วยพื้นที่เก็บข้อมูลนี้ ทั้งหมดนี้ถูกสร้างขึ้นตั้งแต่เริ่มต้น ซึ่งจะช่วยให้คุณมีความเข้าใจที่ดีเกี่ยวกับสิ่งที่อยู่ภายใต้ประทุน
สถาปัตยกรรมหม้อแปลงไฟฟ้าคือสถาปัตยกรรม SOTA ที่อยู่เบื้องหลังความก้าวหน้าที่เกี่ยวข้องกับ AI มากที่สุด สิ่งสำคัญคือต้องทำความเข้าใจว่าเกิดอะไรขึ้นในการใช้งานครั้งแรกของสัตว์ร้ายตัวนี้ นอกจากนี้ยังเป็นทักษะที่ดีหากคุณต้องการก้าวไปสู่เส้นทางการวิจัย คุณต้องเข้าใจต้นกำเนิดเพื่อที่จะรู้ว่าต้องปรับปรุงอะไร!
คำตอบสำหรับคำถามนี้คือใช่ ให้ฉันอธิบาย.
ฉันคงจะโกหกถ้าฉันบอกคุณว่าคุณสบายดีโดยไม่มีพื้นฐานเกี่ยวกับเวิร์กโฟลว์ PyTorch คุณจำเป็นต้องรู้พื้นฐาน เช่น วิธีเริ่มต้นออบเจ็กต์ nn.Module เล่นกับเทนเซอร์ หรือทำความเข้าใจว่าทำไมจึงต้องนำการแปลงไปใช้ นอกจากนั้น คุณจะต้องมีความรู้พื้นฐานเกี่ยวกับการเรียนรู้เชิงลึก/การเรียนรู้ของเครื่อง (เช่น เลเยอร์เชิงเส้นคืออะไร มิติข้อมูลคืออะไร การฝังคืออะไร)