مرحبا بكم في الريبو الخاص بي! أقوم بتنفيذ بنية المحولات من الصفر باستخدام PyTorch. حاولت الاطلاع على جميع المكونات الفرعية الرئيسية، وإضافة ملاحظات وتوضيحات موسعة. الهدف الرئيسي لهذا المستودع هو توفير المعرفة والتفسيرات الدقيقة لكل مكون.
سوف تمر بجميع المكونات الموضحة في الورقة الأصلية. وبصرف النظر عن بناء البنية، توفر الملاحظات رؤى لفهم الأساس المنطقي وراء كل كتل هذه البنية. لقد حاولت أيضًا تحديد المعلمات والمتغيرات التي وجدتها مربكة عند دراستها (على سبيل المثال، d_v vs d_k).
هذه هي الكتل التي ستتعلم كيفية بنائها باستخدام هذا المستودع. تم بناء كل هذه العناصر من الصفر، مما سيوفر لك فهمًا جيدًا لما يوجد تحت غطاء المحرك.
بنية المحولات هي بنية SOTA التي تقف وراء التطورات الأكثر صلة بالذكاء الاصطناعي. من المهم أن نفهم ما يجري في التنفيذ الأصلي لهذا الوحش. إنها أيضًا مهارة جيدة إذا كنت تتطلع إلى السير في مسار البحث؛ أنت بحاجة إلى فهم الأصول لتتمكن من معرفة ما يجب تحسينه!
الجواب على هذا السؤال هو نعم. اسمحوا لي أن أشرح.
سأكون كاذبًا إذا أخبرتك أنك بخير بدون خلفية عن سير عمل PyTorch. أنت بحاجة إلى معرفة الأساسيات، مثل كيفية تهيئة كائنات nn.Module، أو اللعب بالموترات، أو فهم سبب ضرورة تطبيق التحويلات. وبصرف النظر عن ذلك، ستحتاج أيضًا إلى المعرفة الأساسية بالتعلم العميق/التعلم الآلي (على سبيل المثال، ما هي الطبقة الخطية؟ ما هي الأبعاد؟ ما هو التضمين؟).