รายชื่อหลักสูตรระดับมหาวิทยาลัยฟรี คุณภาพสูง ที่รวบรวมไว้พร้อมวิดีโอบรรยายที่เกี่ยวข้องกับสาขา Computer Vision
สัญญาณและระบบ 6.003 (MIT) ศาสตราจารย์เดนนิส ฟรีแมน
[คอร์ส]
Signals and Systems 6.003 ครอบคลุมพื้นฐานของการวิเคราะห์สัญญาณและระบบ โดยมุ่งเน้นไปที่การแสดงสัญญาณเวลาไม่ต่อเนื่องและเวลาต่อเนื่อง (ฟังก์ชันเอกฐาน เลขชี้กำลังและเรขาคณิตเชิงซ้อน การแทนฟูริเยร์ การแปลงลาปลาซและ Z การสุ่มตัวอย่าง) และการแทนเชิงเส้น เวลา - ระบบคงที่ (ผลต่างและสมการเชิงอนุพันธ์ บล็อกไดอะแกรม ฟังก์ชันของระบบ ขั้วและศูนย์ การบิด แรงกระตุ้นและขั้นตอน การตอบสนอง, การตอบสนองความถี่) การประยุกต์ใช้งานส่วนใหญ่มาจากวิศวกรรมศาสตร์และฟิสิกส์ รวมถึงการตอบสนองและการควบคุม การสื่อสาร และการประมวลผลสัญญาณ
การประมวลผลสัญญาณดิจิตอล ECSE-4530 (สถาบันสารพัดช่าง Rensselaer), Richard Radke
[หลักสูตร] [YouTube]
หลักสูตรนี้ให้การปฏิบัติที่ครอบคลุมเกี่ยวกับทฤษฎี การออกแบบ และการนำอัลกอริธึมการประมวลผลสัญญาณดิจิทัลไปใช้ ในช่วงครึ่งแรกของหลักสูตร เราเน้นการวิเคราะห์โดเมนความถี่และการแปลงรูป Z ในช่วงครึ่งหลังของหลักสูตร เราจะตรวจสอบหัวข้อขั้นสูงในการประมวลผลสัญญาณ รวมถึงการประมวลผลสัญญาณหลายอัตรา การออกแบบตัวกรอง การกรองแบบปรับตัว การออกแบบควอไลเซอร์ และการประมาณค่าสเปกตรัมพลังงาน หลักสูตรนี้ค่อนข้างไม่ขึ้นอยู่กับการใช้งาน เพื่อเป็นรากฐานทางทฤษฎีที่แข็งแกร่งสำหรับการศึกษาด้านการสื่อสาร การควบคุม หรือการประมวลผลภาพในอนาคต หลักสูตรนี้เดิมเปิดสอนในระดับบัณฑิตศึกษา แต่ได้รับการปรับปรุงใหม่ในปี 2552 ให้เป็นระดับอาวุโส
การประมวลผลสัญญาณดิจิทัล (EPFL), เปาโล ปรันโดนี, มาร์ติน เวตเตอร์ลี
[คอร์ส]
ในชุดหลักสูตรสี่หลักสูตรนี้ คุณจะได้เรียนรู้พื้นฐานของการประมวลผลสัญญาณดิจิทัลตั้งแต่พื้นฐาน เริ่มต้นจากคำจำกัดความพื้นฐานของสัญญาณเวลาแบบไม่ต่อเนื่อง เราจะดำเนินการผ่านการวิเคราะห์ฟูริเยร์ การออกแบบตัวกรอง การสุ่มตัวอย่าง การประมาณค่า และการหาปริมาณ เพื่อสร้างชุดเครื่องมือ DSP ที่ครบถ้วนเพียงพอที่จะวิเคราะห์ระบบการสื่อสารเชิงปฏิบัติโดยละเอียด ตัวอย่างและการสาธิตเชิงปฏิบัติจะถูกใช้เป็นประจำเพื่อปิดช่องว่างระหว่างทฤษฎีและการปฏิบัติ
การประมวลผลภาพและวิดีโอ: จากดาวอังคารสู่ฮอลลีวูดโดยแวะที่โรงพยาบาล (มหาวิทยาลัย Duke) ศาสตราจารย์ Guillermo Sapiro
[หลักสูตร] [YouTube]
ในหลักสูตรนี้ คุณจะได้เรียนรู้วิทยาศาสตร์เบื้องหลังวิธีสร้าง เปลี่ยนแปลง จัดเก็บ และใช้งานรูปภาพและวิดีโอดิจิทัล เราจะมาดูโลกอันกว้างใหญ่ของการถ่ายภาพดิจิทัล ตั้งแต่วิธีที่คอมพิวเตอร์และกล้องดิจิทัลสร้างภาพ ไปจนถึงวิธีการใช้เอฟเฟกต์พิเศษทางดิจิทัลในภาพยนตร์ฮอลลีวูด ไปจนถึงวิธีที่ Mars Rover สามารถส่งภาพถ่ายข้ามอวกาศนับล้านไมล์
หลักสูตรนี้เริ่มต้นด้วยการดูว่าระบบการมองเห็นของมนุษย์ทำงานอย่างไร จากนั้นจะสอนคุณเกี่ยวกับวิศวกรรม คณิตศาสตร์ และวิทยาการคอมพิวเตอร์ที่ทำให้ภาพดิจิทัลทำงานได้ คุณจะได้เรียนรู้อัลกอริธึมพื้นฐานที่ใช้ในการปรับภาพ สำรวจมาตรฐาน JPEG และ MPEG สำหรับการเข้ารหัสและการบีบอัดภาพวิดีโอ และเรียนรู้เพิ่มเติมเกี่ยวกับการแบ่งส่วนภาพ การกำจัดจุดรบกวน และการกรอง สุดท้ายนี้เราจะปิดท้ายด้วยเทคนิคการประมวลผลภาพที่ใช้ในทางการแพทย์
ข้อมูลเบื้องต้นเกี่ยวกับการประมวลผลภาพดิจิทัล ECSE-4540 (Rensselaer Polytechnic Institute), Richard Radke
[หลักสูตร] [YouTube]
ความรู้เบื้องต้นเกี่ยวกับการประมวลผลภาพ ครอบคลุมทั้งด้านการวิเคราะห์และการนำไปปฏิบัติ หัวข้อต่างๆ ได้แก่ ระบบการมองเห็นของมนุษย์ กล้องและการสร้างภาพ การสุ่มตัวอย่างและการหาปริมาณภาพ การปรับปรุงภาพในโดเมนเชิงพื้นที่และความถี่ การออกแบบตัวกรอง การฟื้นฟูภาพ การเข้ารหัสและการบีบอัดภาพ การประมวลผลภาพทางสัณฐานวิทยา การประมวลผลภาพสี การแบ่งส่วนภาพ และภาพ การฟื้นฟู ตัวอย่างและการมอบหมายงานในโลกแห่งความเป็นจริงที่มาจากการถ่ายภาพดิจิทัลสำหรับผู้บริโภค การรักษาความปลอดภัยและการเฝ้าระวัง และการประมวลผลภาพทางการแพทย์ หลักสูตรนี้เป็นพื้นฐานที่ดีสำหรับหลักสูตรการประมวลผลภาพและคอมพิวเตอร์วิทัศน์ระดับบัณฑิตศึกษาของเรา
พื้นฐานของการประมวลผลภาพและวิดีโอดิจิทัล (มหาวิทยาลัย Northwestern) ศาสตราจารย์ Aggelos K. Katsaggelos
[คอร์ส]
หลักสูตรนี้จะครอบคลุมพื้นฐานการประมวลผลภาพและวิดีโอ เราจะจัดทำกรอบทางคณิตศาสตร์เพื่ออธิบายและวิเคราะห์ภาพและวิดีโอเป็นสัญญาณสองและสามมิติในโดเมนเชิงพื้นที่ เชิงพื้นที่ และความถี่ ในชั้นเรียนนี้ คุณจะไม่เพียงแต่จะได้เรียนรู้ทฤษฎีเบื้องหลังงานการประมวลผลขั้นพื้นฐาน รวมถึงการปรับปรุงรูปภาพ/วิดีโอ การกู้คืน และการบีบอัด - แต่คุณยังจะได้เรียนรู้วิธีการปฏิบัติงานการประมวลผลที่สำคัญเหล่านี้ในทางปฏิบัติโดยใช้เทคนิคและเครื่องมือที่ล้ำสมัย . เราจะแนะนำและใช้เครื่องมือดังกล่าวที่หลากหลาย ตั้งแต่กล่องเครื่องมือเพิ่มประสิทธิภาพไปจนถึงเทคนิคทางสถิติ นอกจากนี้ยังจะเน้นย้ำถึงบทบาทพิเศษที่กระจัดกระจายในการประมวลผลภาพและวิดีโอสมัยใหม่อีกด้วย ในทุกกรณี รูปภาพและวิดีโอตัวอย่างที่เกี่ยวข้องกับโดเมนแอปพลิเคชันเฉพาะจะถูกนำมาใช้
การประมวลผลภาพและสัญญาณหลายมิติ EENG 510 (Colorado School of Mines), William Hoff
[หลักสูตร] [YouTube]
หลักสูตรนี้จะช่วยให้นักเรียนมีพื้นฐานทางทฤษฎีเพื่อให้พวกเขาสามารถประยุกต์ใช้ภาพอันล้ำสมัยและเทคนิคการประมวลผลสัญญาณหลายมิติ หลักสูตรนี้จะสอนให้นักเรียนแก้ปัญหาเชิงปฏิบัติที่เกี่ยวข้องกับการประมวลผลข้อมูลหลายมิติ เช่น รูปภาพ ลำดับวิดีโอ และข้อมูลเชิงปริมาตร ประเภทของปัญหาที่นักเรียนคาดหวังให้แก้ไข ได้แก่ การวัดขนาดอัตโนมัติจากข้อมูลหลายมิติ และการฟื้นฟู การสร้างใหม่ หรือการบีบอัดข้อมูลหลายมิติ เครื่องมือที่ใช้ในการแก้ไขปัญหาเหล่านี้ประกอบด้วยวิธีการแยกคุณลักษณะ เทคนิคการกรอง เทคนิคการแบ่งส่วน และวิธีการแปลงที่หลากหลาย
การประมวลผลภาพดิจิทัล (IIT Kanpur) ศาสตราจารย์ พี.เค. บิสวาส
[หลักสูตร] [YouTube]
การประมวลผลและการวิเคราะห์ภาพ ECS 173 (UC Davis), ศาสตราจารย์ โอเว่น คาร์ไมเคิล
[หลักสูตร] [YouTube]
เทคนิคในการดึงข้อมูลระดับสูงจากภาพที่สร้างโดยกล้อง เซ็นเซอร์พื้นผิวสามมิติ และอุปกรณ์ทางการแพทย์โดยอัตโนมัติ การใช้งานทั่วไป ได้แก่ การตรวจจับวัตถุในภาพประเภทต่างๆ และการอธิบายจำนวนประชากรของตัวอย่างทางชีววิทยาที่ปรากฏในภาพทางการแพทย์
การประมวลผลภาพดิจิทัล EE225B (UC Berkeley), ศ. Avideh Zakhor
[คอร์ส]
หลักสูตรนี้ครอบคลุมหัวข้อต่อไปนี้: ลำดับและระบบ 2 มิติ ระบบที่แยกส่วนได้ ส่วนฉายภาพ thm การสร้างใหม่จากการฉายภาพและข้อมูลฟูริเยร์บางส่วน การแปลง Z สมการต่างๆ ความสามารถในการคำนวณแบบเรียกซ้ำ 2D DFT และ FFT การออกแบบตัวกรอง 2D FIR ดวงตาของมนุษย์ การรับรู้ คุณสมบัติการมองเห็นทางจิตฟิสิกส์ การวัดแสงและการวัดสี ระบบทัศนศาสตร์และระบบภาพ การเพิ่มประสิทธิภาพของภาพ การฟื้นฟูภาพ การปรับเปลี่ยนภาพทางเรขาคณิต การประมวลผลภาพทางสัณฐานวิทยา ฮาล์ฟโทน การตรวจจับขอบ การบีบอัดภาพ: การหาปริมาณสเกลาร์ การเข้ารหัสแบบไม่สูญเสียข้อมูล การเข้ารหัสฮัฟฟ์แมน เทคนิคพจนานุกรมการเข้ารหัสทางคณิตศาสตร์ การเข้ารหัสรูปคลื่นและการแปลง DCT, KLT, ฮาดัมมาร์ด, พีระมิดการเข้ารหัสหลายความละเอียด การเข้ารหัสย่านความถี่ย่อย, การเข้ารหัสเศษส่วน, การหาปริมาณเวกเตอร์, การประมาณค่าการเคลื่อนไหวและการชดเชย, มาตรฐาน: JPEG, MPEG, H.xxx, ล่วงหน้า และหลังการประมวลผล การเข้ารหัสภาพและวิดีโอที่ปรับขนาดได้ การสื่อสารภาพและวิดีโอผ่านช่องทางที่มีเสียงดัง
การประมวลผลภาพดิจิทัล I EE637 (มหาวิทยาลัย Purdue), ศาสตราจารย์ Charles A. Bouman
[หลักสูตร] [YouTube]
เทคนิคเบื้องต้นในการประมวลผลภาพดิจิทัลเพื่อการเพิ่มประสิทธิภาพ การบีบอัด การบูรณะ การสร้างใหม่ และการวิเคราะห์ การบรรยายและการทดลองในห้องปฏิบัติการครอบคลุมหัวข้อต่างๆ มากมาย รวมถึงสัญญาณและระบบ 2 มิติ การวิเคราะห์ภาพ การแบ่งส่วนภาพ การมองเห็นไม่มีสี การประมวลผลภาพสี ระบบสร้างภาพสี การทำให้ภาพคมชัด การประมาณค่า การแบ่งส่วน การกรองเชิงเส้นและไม่เชิงเส้น การพิมพ์และการแสดงภาพ การบีบอัดภาพ การฟื้นฟูภาพ และการตรวจเอกซเรย์
การสร้างภาพขนาดใหญ่เชิงปริมาณ: จากภาพสู่สถิติ (ETH Zurich), KS Mader, M. Stampanoni
[หลักสูตร] [YouTube] [GitHub]
การบรรยายมุ่งเน้นไปที่งานที่ท้าทายในการดึงตัวชี้วัดเชิงปริมาณที่แข็งแกร่งออกจากข้อมูลการถ่ายภาพ และมีวัตถุประสงค์เพื่อลดช่องว่างระหว่างการประมวลผลสัญญาณบริสุทธิ์และวิทยาศาสตร์เชิงทดลองของการถ่ายภาพ หลักสูตรนี้จะมุ่งเน้นไปที่เทคนิค ความสามารถในการขยายขนาด และการวิเคราะห์ที่ขับเคลื่อนด้วยวิทยาศาสตร์
หลักการแรกของคอมพิวเตอร์วิทัศน์ ศรี นายาร์
[เว็บไซต์] [YouTube]
First Principles of Computer Vision เป็นชุดการบรรยายที่นำเสนอโดย Shree Nayar ซึ่งเป็นอาจารย์ในภาควิชาวิทยาการคอมพิวเตอร์ คณะวิศวกรรมศาสตร์และวิทยาศาสตร์ประยุกต์ มหาวิทยาลัยโคลัมเบีย Computer Vision คือองค์กรแห่งการสร้างเครื่องจักรที่ "มองเห็น" ซีรีส์นี้มุ่งเน้นไปที่รากฐานของการมองเห็นทางกายภาพและคณิตศาสตร์ และออกแบบมาสำหรับนักเรียน ผู้ปฏิบัติงาน และผู้สนใจที่ไม่มีความรู้เกี่ยวกับการมองเห็นของคอมพิวเตอร์มาก่อน
คอมพิวเตอร์วิทัศน์ CAP5415 (UCF), ดร. มูบารัค ชาห์
[หลักสูตร 2012] [หลักสูตร 2014] [YouTube 2012] [YouTube 2014]
หลักสูตรนี้เป็นระดับเบื้องต้น โดยจะครอบคลุมหัวข้อพื้นฐานของคอมพิวเตอร์วิทัศน์ และแนะนำแนวทางพื้นฐานบางประการสำหรับการวิจัยเกี่ยวกับคอมพิวเตอร์วิทัศน์
รู้เบื้องต้นเกี่ยวกับคอมพิวเตอร์วิทัศน์ CS-6476 (Georgia Tech)
[หลักสูตร] [ยูดาซิตี้]
คอมพิวเตอร์วิทัศน์ EENG 512 (Colorado School of Mines), William Hoff
[ยูทูป]
หลักสูตรนี้ให้ภาพรวมของสาขานี้ โดยเริ่มจากการสร้างภาพและการประมวลผลภาพระดับต่ำ จากนั้นเราจะลงรายละเอียดเกี่ยวกับทฤษฎีและเทคนิคในการแยกคุณลักษณะต่างๆ ออกจากรูปภาพ การวัดรูปร่างและตำแหน่ง และการจดจำวัตถุ
คอมพิวเตอร์วิทัศน์ 3 มิติ CS4277/CS5477 (มหาวิทยาลัยแห่งชาติสิงคโปร์), Gim Hee Lee
[ยูทูป]
หลักสูตรนี้เป็นหลักสูตรเบื้องต้นเกี่ยวกับ 3D Computer Vision ซึ่งบันทึกไว้สำหรับการเรียนรู้ออนไลน์ที่ NUS เนื่องจากสถานการณ์โควิด-19 หัวข้อที่ครอบคลุม ได้แก่: การบรรยายครั้งที่ 1: เรขาคณิตฉายภาพ 2D และ 1D การบรรยายครั้งที่ 2: การเคลื่อนไหวของร่างกายแข็งเกร็งและเรขาคณิตฉายภาพ 3 มิติ การบรรยายครั้งที่ 3: จุดวงกลมและทรงกรวยสัมบูรณ์ การบรรยายครั้งที่ 4: การประมาณค่าโฮโมกราฟีที่แข็งแกร่ง การบรรยายครั้งที่ 5: รุ่นของกล้องและการสอบเทียบ การบรรยายครั้งที่ 6: มาตรวิทยามุมมองเดียว การบรรยายครั้งที่ 7: เมทริกซ์พื้นฐานและจำเป็น การบรรยายครั้งที่ 8: การประมาณค่าแบบสัมบูรณ์จากจุดหรือเส้น การบรรยายครั้งที่ 9: เรขาคณิตสามมุมมองจากจุดและ/หรือเส้น การบรรยายครั้งที่ 10: โครงสร้างจากการเคลื่อนไหว (SfM) และการปรับมัด การบรรยายครั้งที่ 11: สเตอริโอสองมุมมองและหลายมุมมอง การบรรยายครั้งที่ 12: กล้องทั่วไป การบรรยายครั้งที่ 13: การปรับเทียบอัตโนมัติ
เรขาคณิตหลายมุมมองในคอมพิวเตอร์วิทัศน์ (IT Sligo), Sean Mullery
[ยูทูป]
คอมพิวเตอร์วิทัศน์ (ไอไอที คานปูร์) ศาสตราจารย์ ชยันต มุกโภทัยย
[คอร์ส]
หลักสูตรนี้จะครอบคลุมทั้งทฤษฎีและการคำนวณที่เกี่ยวข้องกับเรขาคณิตของการถ่ายภาพ และการทำความเข้าใจฉาก นอกจากนี้ยังจะให้ความรู้เกี่ยวกับการจัดกลุ่ม การจำแนกประเภท และเทคนิคการเรียนรู้เชิงลึกที่ใช้ในพื้นที่นี้
คอมพิวเตอร์วิทัศน์ CS-442 (EPFL), Pascal Fua
[คอร์ส]
ผู้เรียนจะได้รู้จักเทคนิคพื้นฐานของสาขาคอมพิวเตอร์วิทัศน์ พวกเขาจะได้เรียนรู้การใช้เทคนิคการประมวลผลภาพตามความเหมาะสม เราจะมุ่งเน้นไปที่ภาพขาวดำและสีที่ได้มาจากกล้องวิดีโอมาตรฐาน เราจะแนะนำเทคนิคการประมวลผลขั้นพื้นฐาน เช่น การตรวจจับขอบ การแบ่งส่วน การแสดงลักษณะพื้นผิว และการจดจำรูปร่าง
คอมพิวเตอร์วิทัศน์ CS 543 (มหาวิทยาลัยอิลลินอยส์), Derek Hoiem
[หลักสูตร] [บันทึก]
ในหลักสูตรนี้ เราจะครอบคลุมแนวคิดพื้นฐานและอัลกอริทึมของคอมพิวเตอร์วิทัศน์หลายประการ: เรขาคณิตมุมมองเดียวและหลายมุมมอง การจัดแสง ตัวกรองเชิงเส้น พื้นผิว จุดสนใจ การติดตาม RANSAC การจัดกลุ่ม K-mean การแบ่งส่วน อัลกอริธึม EM การรับรู้ และอื่นๆ ในการบ้าน คุณจะต้องนำแนวคิดเหล่านี้ไปปฏิบัติจริง เนื่องจากหลักสูตรนี้เป็นหลักสูตรการสำรวจ เราจะไม่ลงลึกในหัวข้อใดๆ มากนัก แต่เมื่อสิ้นสุดหลักสูตร คุณควรเตรียมพร้อมสำหรับการตรวจสอบและการประยุกต์ใช้ที่เกี่ยวข้องกับการมองเห็นเพิ่มเติม
คอมพิวเตอร์วิทัศน์สำหรับวิชวลเอฟเฟกต์ ECSE-6969, Richard Radke
[หลักสูตร] [YouTube]
หลักสูตรนี้เน้นหัวข้อการวิจัยที่รองรับวิชวลเอฟเฟกต์ขั้นสูงที่กำลังแพร่หลายมากขึ้นในโฆษณา มิวสิกวิดีโอ และภาพยนตร์ หัวข้อต่างๆ รวมถึงอัลกอริธึมการมองเห็นคอมพิวเตอร์แบบคลาสสิกที่ใช้เป็นประจำในฮอลลีวูด (เช่น การปูหน้าจอสีน้ำเงิน โครงสร้างจากการเคลื่อนไหว การไหลของแสง และการติดตามคุณสมบัติ) และการพัฒนาล่าสุดที่น่าตื่นเต้นที่สร้างพื้นฐานสำหรับเอฟเฟกต์ในอนาคต (เช่น การปูภาพตามธรรมชาติ การผสมภาพหลายภาพ การกำหนดเป้าหมายภาพใหม่ และการสังเคราะห์มุมมอง) นอกจากนี้เรายังหารือเกี่ยวกับเทคโนโลยีที่อยู่เบื้องหลังการจับภาพเคลื่อนไหวและการเก็บข้อมูลสามมิติ การวิเคราะห์วิดีโอเบื้องหลังและการสัมภาษณ์เชิงลึกกับศิลปินวิชวลเอฟเฟกต์ฮอลลีวูดเชื่อมโยงแนวคิดทางคณิตศาสตร์กับการสร้างภาพยนตร์ในโลกแห่งความเป็นจริง
การประมวลผลภาพและคอมพิวเตอร์วิทัศน์ (CBCSL), Aleix M. Martinez
[ยูทูป]
ความลับโบราณของการมองเห็นคอมพิวเตอร์ (มหาวิทยาลัยวอชิงตัน), โจเซฟ เรดมอน
[หลักสูตร] [YouTube]
ชั้นเรียนนี้เป็นการแนะนำทั่วไปเกี่ยวกับคอมพิวเตอร์วิทัศน์ โดยครอบคลุมเทคนิคมาตรฐานในการประมวลผลภาพ เช่น การกรอง การตรวจจับขอบ สเตอริโอ โฟลว์ ฯลฯ (การมองเห็นแบบเก่า) รวมถึงคอมพิวเตอร์วิทัศน์ที่ใช้การเรียนรู้ของเครื่องรุ่นใหม่กว่า
คอมพิวเตอร์วิทัศน์ขั้นสูง CAP6412 (UCF), ดร. มูบารัค ชาห์
[หลักสูตร 2019] [YouTube]
นี่คือ Advanced Computer Vision ซึ่งจะทำให้นักศึกษาระดับบัณฑิตศึกษาได้สัมผัสกับการวิจัยที่ล้ำสมัย ในแต่ละชั้นเรียน เราจะอภิปรายงานวิจัยล่าสุดหนึ่งฉบับที่เกี่ยวข้องกับงานวิจัยปัจจุบัน โดยเฉพาะการใช้ Deep Learning คอมพิวเตอร์วิทัศน์เป็นงานวิจัยที่กระตือรือร้นมากมานานหลายทศวรรษ และนักวิจัยก็ได้ทำงานเพื่อแก้ไขปัญหาที่ท้าทายที่สำคัญ ในช่วงไม่กี่ปีที่ผ่านมา การเรียนรู้เชิงลึกที่เกี่ยวข้องกับโครงข่ายประสาทเทียมได้เข้ามาขัดขวางการมองเห็นของคอมพิวเตอร์ ด้วยการใช้การเรียนรู้เชิงลึก ความก้าวหน้าอย่างมากเกิดขึ้นในเวลาอันสั้นในการแก้ปัญหาที่ยากลำบาก และผลลัพธ์ที่น่าประทับใจมากได้รับในการจำแนกรูปภาพและวิดีโอ การแปลเป็นภาษาท้องถิ่น การแบ่งส่วนความหมาย ฯลฯ เทคนิคใหม่ ชุดข้อมูล ฮาร์ดแวร์และไลบรารีซอฟต์แวร์กำลังเกิดขึ้นเกือบทุก วัน. Deep Computer Vision ส่งผลต่อการวิจัยด้านวิทยาการหุ่นยนต์ ความเข้าใจภาษาธรรมชาติ คอมพิวเตอร์กราฟิก การวิเคราะห์หลายรูปแบบ ฯลฯ
คอมพิวเตอร์วิทัศน์ 1: วิธีการเปลี่ยนแปลง (TU München) ศาสตราจารย์ Daniel Cremers
[หลักสูตร] [YouTube]
วิธีการแปรผันเป็นหนึ่งในเทคนิคคลาสสิกที่สุดในการปรับฟังก์ชันต้นทุนให้เหมาะสมในมิติที่สูงกว่า ความท้าทายหลายประการในคอมพิวเตอร์วิทัศน์และในขอบเขตการวิจัยอื่นๆ สามารถกำหนดเป็นวิธีการที่หลากหลายได้ ตัวอย่าง ได้แก่ การลดสัญญาณรบกวน การลดความเบลอ การแบ่งส่วนภาพ การติดตาม การประมาณการไหลของแสง การประมาณความลึกจากภาพสเตอริโอ หรือการสร้าง 3D ใหม่จากหลายมุมมอง
ในชั้นเรียนนี้ ฉันจะแนะนำแนวคิดพื้นฐานของวิธีการแปรผัน แคลคูลัสออยเลอร์-ลากรองจ์ และสมการเชิงอนุพันธ์ย่อย ผมจะอภิปรายว่าความท้าทายด้านการมองเห็นของคอมพิวเตอร์และการวิเคราะห์ภาพตามลำดับสามารถนำมาเป็นปัญหาที่หลากหลายได้อย่างไร และจะแก้ไขได้อย่างไรอย่างมีประสิทธิภาพ ในช่วงท้ายของชั้นเรียน ฉันจะพูดถึงสูตรผสมแบบนูนและการผ่อนคลายแบบนูนซึ่งช่วยให้สามารถคำนวณวิธีแก้ปัญหาที่เหมาะสมที่สุดหรือใกล้เคียงที่สุดในสภาพแวดล้อมแบบแปรผันได้
คอมพิวเตอร์วิทัศน์ II: เรขาคณิตหลายมุมมอง (TU München), ศาสตราจารย์ Daniel Cremers
[หลักสูตร] [YouTube]
การบรรยายจะแนะนำแนวคิดพื้นฐานของการสร้างภาพ - การฉายเปอร์สเปคทีฟและการเคลื่อนไหวของกล้อง เป้าหมายคือการสร้างโลกสามมิติขึ้นมาใหม่และการเคลื่อนไหวของกล้องจากหลายภาพ ด้วยเหตุนี้ เราจึงพิจารณาความสอดคล้องระหว่างจุดต่างๆ ในภาพต่างๆ และข้อจำกัดต่างๆ ที่เกี่ยวข้อง เพื่อให้สามารถคำนวณการเคลื่อนไหวและโครงสร้าง 3 มิติได้ การบรรยายเน้นเป็นพิเศษที่คำอธิบายทางคณิตศาสตร์เกี่ยวกับการเคลื่อนไหวของร่างกายที่แข็งแรงและการฉายภาพเปอร์สเปคทีฟ สำหรับการประมาณการเคลื่อนไหวของกล้องและเรขาคณิต 3 มิติ เราจะใช้ทั้งวิธีสเปกตรัมและวิธีการปรับให้เหมาะสมแบบไม่เชิงเส้น
วิทัศน์คอมพิวเตอร์ขั้นสูง (CBCSL), Aleix M. Martinez
[ยูทูป]
บัณฑิตวิทยาลัยภาคฤดูร้อนด้านคอมพิวเตอร์วิทัศน์ (IPAM ที่ UCLA)
[คอร์ส]
Photogrammetry I & II (มหาวิทยาลัยบอนน์), Cyrill Stachniss
[หลักสูตร] [YouTube]
การตรวจจับอุปกรณ์พกพาและวิทยาการหุ่นยนต์ I (มหาวิทยาลัยบอนน์), Cyrill Stachniss
[คอร์ส]
Mobile Sensing And Robotics II (มหาวิทยาลัยบอนน์), Cyrill Stachniss
[หลักสูตร] [YouTube]
การทำแผนที่หุ่นยนต์ (มหาวิทยาลัยบอนน์), Cyrill Stachniss
[หลักสูตร] [YouTube]
การบรรยายจะครอบคลุมหัวข้อและเทคนิคต่างๆ ในบริบทของการสร้างแบบจำลองสภาพแวดล้อมด้วยหุ่นยนต์เคลื่อนที่ เราจะกล่าวถึงเทคนิคต่างๆ เช่น SLAM กับกลุ่มตัวกรองคาลมาน ตัวกรองข้อมูล ตัวกรองอนุภาค นอกจากนี้เรายังจะตรวจสอบแนวทางที่ใช้กราฟ การลดข้อผิดพลาดกำลังสองน้อยที่สุด เทคนิคสำหรับการจดจำสถานที่และการทำแผนที่ตามลักษณะที่ปรากฏ และการเชื่อมโยงข้อมูล
ไบโอเมตริกซ์ (IIT Kanpur) ศาสตราจารย์ Phalguni Gupta
[หลักสูตร] [YouTube]
ความรู้เบื้องต้นเกี่ยวกับลักษณะและจุดมุ่งหมายของไบโอเมตริกซ์ พื้นฐานการประมวลผลภาพ การใช้งานภาพขั้นพื้นฐาน การกรอง การปรับปรุง การทำให้คมชัด การตรวจจับขอบ การปรับให้เรียบ การปรับปรุง การกำหนดขอบเขต การแปลเป็นภาษาท้องถิ่น อนุกรมฟูริเยร์, DFT, ตัวผกผันของ DFT ระบบไบโอเมตริกซ์ การระบุตัวตนและการตรวจสอบ FAR/FRR ปัญหาการออกแบบระบบ การระบุเชิงบวก/เชิงลบ ความปลอดภัยของระบบไบโอเมตริกซ์, โปรโตคอลการรับรองความถูกต้อง, การกระจายคะแนนที่ตรงกัน, เส้นโค้ง ROC, เส้นโค้ง DET, เส้นโค้ง FAR/FRR ข้อผิดพลาดโดยรวมที่คาดหวัง, EER, ตำนานเกี่ยวกับชีวมิติ และการบิดเบือนความจริง การเลือกไบโอเมตริกซ์ที่เหมาะสม คุณลักษณะไบโอเมตริกซ์ แผนภูมิ Zephyr ประเภทของไบโอเมตริกหลายรายการ การตรวจสอบระบบหลายโมเดล กลยุทธ์การทำให้เป็นมาตรฐาน วิธีการฟิวชั่น การระบุหลายโมเดล ความปลอดภัยของระบบไบโอเมตริกซ์ ช่องโหว่ของระบบไบโอเมตริกซ์ การหลบเลี่ยง การได้มาอย่างลับๆ การควบคุมคุณภาพ การสร้างเทมเพลต การทำงานร่วมกัน การจัดเก็บข้อมูล ระบบจดจำใบหน้า, ลายเซ็น, ลายนิ้วมือ, หู, ม่านตา ฯลฯ
CS231n Convolutional Neural Networks สำหรับการรู้จำภาพ (สแตนฟอร์ด)
[หลักสูตร] [YouTube]
หลักสูตรนี้เป็นการเจาะลึกรายละเอียดของสถาปัตยกรรมการเรียนรู้เชิงลึก โดยมุ่งเน้นที่การเรียนรู้แบบจำลองจากต้นทางถึงปลายทางสำหรับงานเหล่านี้ โดยเฉพาะการจัดหมวดหมู่รูปภาพ ในระหว่างหลักสูตร 10 สัปดาห์ นักเรียนจะได้เรียนรู้การใช้งาน ฝึกอบรม และแก้ไขข้อบกพร่องของโครงข่ายประสาทเทียมของตนเอง และได้รับความเข้าใจโดยละเอียดเกี่ยวกับการวิจัยล้ำสมัยในด้านคอมพิวเตอร์วิทัศน์ การมอบหมายขั้นสุดท้ายจะเกี่ยวข้องกับการฝึกอบรมเครือข่ายประสาทเทียมแบบหมุนวนพารามิเตอร์หลายล้านพารามิเตอร์ และนำไปใช้กับชุดข้อมูลการจำแนกประเภทรูปภาพที่ใหญ่ที่สุด (ImageNet) เราจะมุ่งเน้นไปที่การสอนวิธีการตั้งค่าปัญหาของการจดจำภาพ อัลกอริธึมการเรียนรู้ (เช่น การเผยแพร่กลับ) เทคนิคทางวิศวกรรมเชิงปฏิบัติสำหรับการฝึกอบรม และการปรับแต่งเครือข่าย และแนะนำนักเรียนผ่านการมอบหมายงานจริงและโครงงานหลักสูตรสุดท้าย ความเป็นมาและเนื้อหาส่วนใหญ่ของหลักสูตรนี้จะดึงมาจาก ImageNet Challenge
การเรียนรู้เชิงลึกเพื่อการมองเห็นคอมพิวเตอร์ (มหาวิทยาลัยมิชิแกน), จัสติน จอห์นสัน
[คอร์ส]
หลักสูตรนี้เป็นการเจาะลึกรายละเอียดของวิธีการเรียนรู้เชิงลึกที่ใช้โครงข่ายประสาทเทียมสำหรับคอมพิวเตอร์วิทัศน์ ในระหว่างหลักสูตรนี้ นักเรียนจะได้เรียนรู้การใช้งาน ฝึกอบรม และแก้ไขข้อบกพร่องของโครงข่ายประสาทเทียมของตนเอง และได้รับความเข้าใจโดยละเอียดเกี่ยวกับการวิจัยที่ล้ำสมัยในด้านคอมพิวเตอร์วิทัศน์ เราจะครอบคลุมอัลกอริทึมการเรียนรู้ สถาปัตยกรรมโครงข่ายประสาทเทียม และเทคนิคทางวิศวกรรมเชิงปฏิบัติสำหรับการฝึกอบรมและปรับแต่งเครือข่ายสำหรับงานจดจำภาพ
Convolutional Neural Networks ศาสตราจารย์ แอนดรูว์ อึ้ง
[คอร์ส]
หลักสูตรนี้จะสอนวิธีสร้างโครงข่ายประสาทเทียมแบบหมุนวนและนำไปใช้กับข้อมูลภาพ ด้วยการเรียนรู้เชิงลึก คอมพิวเตอร์วิทัศน์จึงทำงานได้ดีกว่าเมื่อสองปีที่แล้ว และช่วยให้สามารถใช้งานแอปพลิเคชันที่น่าตื่นเต้นมากมาย ตั้งแต่การขับขี่อัตโนมัติอย่างปลอดภัย การจดจำใบหน้าที่แม่นยำ ไปจนถึงการอ่านภาพรังสีวิทยาโดยอัตโนมัติ
Convolutional Networks, เอียน กู๊ดเฟลโลว์
[ยูทูป]
ระบบประสาทสัมผัส 9.04 (MIT), ศาสตราจารย์ Peter H. Schiller, ศาสตราจารย์ M. Christian Brown
[หลักสูตร] [YouTube]
หลักสูตรนี้ตรวจสอบฐานประสาทของการรับรู้ทางประสาทสัมผัส มุ่งเน้นไปที่การศึกษาทางสรีรวิทยาและกายวิภาคของระบบประสาทของสัตว์เลี้ยงลูกด้วยนมตลอดจนการศึกษาพฤติกรรมของสัตว์และมนุษย์ หัวข้อต่างๆ ได้แก่ รูปแบบการมองเห็น การรับรู้สีและความลึก การตอบสนองทางการได้ยินและการแปลเสียงเฉพาะที่ และการรับรู้ทางกายและประสาทสัมผัส
การรับรู้ทางสายตาและสมอง (มหาวิทยาลัยดุ๊ก), เดล เพอร์เวส
[คอร์ส]
ผู้เรียนจะได้เรียนรู้ถึงปัญหาที่การมองเห็นต้องเผชิญ โดยใช้การรับรู้เป็นแนวทาง หลักสูตรนี้จะพิจารณาว่าสิ่งที่เรามองเห็นเกิดขึ้นจากระบบการมองเห็นได้อย่างไร ปัญหาสำคัญในการมองเห็นคืออะไร และการรับรู้ทางสายตาบ่งชี้วิธีการทำงานของสมองอย่างไร หลักฐานจะมาจากประสาทวิทยาศาสตร์ จิตวิทยา ประวัติความเป็นมาของวิทยาศาสตร์การมองเห็น และสิ่งที่ปรัชญามีส่วนร่วม แม้ว่าการอภิปรายจะได้รับแจ้งจากกายวิภาคและสรีรวิทยาของระบบการมองเห็น แต่จุดเน้นอยู่ที่การรับรู้ เราเห็นโลกทางกายภาพในรูปแบบที่แปลก และเป้าหมายคือการทำความเข้าใจว่าทำไม
วิสัยทัศน์ระดับสูง (CBCSL)
[ยูทูป]
Machine Learning CS229 (Stanford), ศาสตราจารย์ แอนดรูว์ อึ้ง
[หลักสูตร] [YouTube]
หลักสูตรนี้ให้ข้อมูลเบื้องต้นแบบกว้างๆ เกี่ยวกับการเรียนรู้ของเครื่องและการจดจำรูปแบบทางสถิติ หัวข้อต่างๆ ได้แก่: การเรียนรู้แบบมีผู้สอน (การเรียนรู้แบบกำเนิด/แบบเลือกปฏิบัติ, การเรียนรู้แบบพาราเมตริก/แบบไม่มีพารามิเตอร์, โครงข่ายประสาทเทียม, เครื่องเวกเตอร์สนับสนุน); การเรียนรู้แบบไม่มีผู้ดูแล (การจัดกลุ่ม การลดขนาด วิธีเคอร์เนล) ทฤษฎีการเรียนรู้ (การแลกเปลี่ยนอคติ/ความแปรปรวน ทฤษฎี VC อัตรากำไรขั้นต้นสูง) การเรียนรู้แบบเสริมกำลังและการควบคุมแบบปรับตัว หลักสูตรนี้ยังจะกล่าวถึงการประยุกต์ใช้การเรียนรู้ของเครื่องล่าสุด เช่น การควบคุมหุ่นยนต์ การทำเหมืองข้อมูล การนำทางอัตโนมัติ ชีวสารสนเทศศาสตร์ การรู้จำเสียง และการประมวลผลข้อมูลข้อความและเว็บ
Machine Learning CS156 (Caltech), ศ. Yaser Abu-Mostafa
[หลักสูตร] [YouTube]
หลักสูตรนี้เป็นหลักสูตรเบื้องต้นโดยศาสตราจารย์ Yaser Abu-Mostafa จาก Caltech เกี่ยวกับแมชชีนเลิร์นนิงที่ครอบคลุมทฤษฎีพื้นฐาน อัลกอริทึม และแอปพลิเคชัน การเรียนรู้ของเครื่อง (ML) ช่วยให้ระบบคอมพิวเตอร์สามารถปรับเปลี่ยนประสิทธิภาพด้วยประสบการณ์ที่สะสมจากข้อมูลที่สังเกตได้ เทคนิค ML ถูกนำมาใช้อย่างกว้างขวางในด้านวิศวกรรม วิทยาศาสตร์ การเงิน และการพาณิชย์ เพื่อสร้างระบบที่เราไม่มีข้อกำหนดทางคณิตศาสตร์ที่ครบถ้วน (และครอบคลุมระบบจำนวนมาก) หลักสูตรนี้สร้างสมดุลระหว่างทฤษฎีและการปฏิบัติ และครอบคลุมทั้งด้านคณิตศาสตร์และฮิวริสติก
การเรียนรู้ของเครื่องเพื่อคอมพิวเตอร์วิทัศน์ (มหาวิทยาลัยไฮเดลเบิร์ก) ศาสตราจารย์ เฟรด แฮมเพรชต์
[หลักสูตร] [YouTube]
หลักสูตรนี้ครอบคลุมวิธีการเรียนรู้ของเครื่องขั้นสูงที่เรียกว่า "การทำนายแบบมีโครงสร้าง" เป้าหมายคือการคาดการณ์หลายครั้งซึ่งมีปฏิสัมพันธ์ในลักษณะที่ไม่ไม่สำคัญ และเราคำนึงถึงปฏิสัมพันธ์เหล่านี้ทั้งในระหว่างการฝึกอบรมและในเวลาทดสอบ
การเรียนรู้ของเครื่องสำหรับหุ่นยนต์และคอมพิวเตอร์วิทัศน์ (TU München), ดร. รูดอล์ฟ ทรีเบล
[หลักสูตร] [YouTube]
ในการบรรยายนี้ นักเรียนจะได้เรียนรู้เกี่ยวกับวิธีการเรียนรู้ของเครื่องที่ใช้บ่อยที่สุดในแอปพลิเคชันคอมพิวเตอร์วิทัศน์และหุ่นยนต์ จุดมุ่งหมายหลักของการบรรยายคือการได้รับภาพรวมโดยกว้างของวิธีการที่มีอยู่ และเพื่อทำความเข้าใจแรงจูงใจและแนวคิดหลักในบริบทของการมองเห็นคอมพิวเตอร์และการจดจำรูปแบบ
การเรียนรู้ของเครื่องสำหรับระบบอัจฉริยะ CS4780 (Cornell), ศาสตราจารย์ Killian Weberger
[หลักสูตร] [YouTube]
เป้าหมายของหลักสูตรนี้คือการให้ข้อมูลเบื้องต้นเกี่ยวกับการเรียนรู้ของเครื่อง หลักสูตรนี้จะสอนทักษะพื้นฐานในการตัดสินใจเลือกอัลกอริทึมการเรียนรู้ที่จะใช้สำหรับปัญหาใด เขียนโค้ดอัลกอริทึมการเรียนรู้ของคุณเอง และประเมินและแก้ไขข้อบกพร่อง
ความรู้เบื้องต้นเกี่ยวกับการเรียนรู้ของเครื่องและการจดจำรูปแบบ (CBCSL), Aleix M. Martinez
[ยูทูป]
การเรียนรู้ของเครื่องประยุกต์ COMS W4995 (โคลัมเบีย), Andreas C. Müller
[หลักสูตร] [YouTube]
ชั้นเรียนนี้นำเสนอแนวทางการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูลแบบลงมือปฏิบัติจริง ชั้นเรียนอภิปรายถึงการประยุกต์ใช้วิธีการเรียนรู้ของเครื่อง เช่น SVM, Random Forests, Gradient Boosting และโครงข่ายประสาทเทียมบนชุดข้อมูลในโลกแห่งความเป็นจริง รวมถึงการเตรียมข้อมูล การเลือกแบบจำลอง และการประเมินผล คลาสนี้มาเสริม COMS W4721 โดยอาศัยการใช้งานโอเพ่นซอร์สที่มีอยู่ใน scikit-learn และ tensor flow สำหรับการใช้งานทั้งหมด นอกเหนือจากการใช้โมเดลแล้ว เรายังจะหารือเกี่ยวกับเครื่องมือและแนวปฏิบัติในการพัฒนาซอฟต์แวร์ที่เกี่ยวข้องกับการผลิตโมเดลการเรียนรู้ของเครื่อง
การเรียนรู้ของเครื่องความน่าจะเป็นและสถิติ (มหาวิทยาลัยTübingen), Prof. Philipp Hennig, Prof. U. von Luxburg
[หลักสูตร] [YouTube]
จุดเน้นของการบรรยายคือทั้งด้านอัลกอริธึมและทฤษฎีของการเรียนรู้ของเครื่อง เราจะครอบคลุมอัลกอริทึมมาตรฐานหลายประการ และเรียนรู้เกี่ยวกับหลักการทั่วไปและผลลัพธ์ทางทฤษฎีสำหรับการสร้างอัลกอริทึมการเรียนรู้ของเครื่องที่ดี หัวข้อมีตั้งแต่ผลลัพธ์ที่เป็นที่ยอมรับไปจนถึงผลลัพธ์ล่าสุด
ความรู้เบื้องต้นเกี่ยวกับการเรียนรู้ของเครื่องสำหรับผู้เขียนโค้ด (fast.ai) เจเรมี ฮาวเวิร์ด
[หลักสูตร] [YouTube]
สอนโดย Jeremy Howard (ผู้แข่งขันอันดับ 1 ของ Kaggle เป็นเวลา 2 ปีติดต่อกันและเป็นผู้ก่อตั้ง Enlitic) เรียนรู้โมเดลแมชชีนเลิร์นนิงที่สำคัญที่สุด รวมถึงวิธีสร้างโมเดลด้วยตนเองตั้งแต่เริ่มต้น ตลอดจนทักษะสำคัญในการจัดเตรียมข้อมูล การตรวจสอบโมเดล และการสร้างผลิตภัณฑ์ข้อมูล มีบทเรียนประมาณ 24 ชั่วโมง และคุณควรวางแผนที่จะใช้เวลาประมาณ 8 ชั่วโมง ชั่วโมงต่อสัปดาห์เป็นเวลา 12 สัปดาห์เพื่อให้เนื้อหาสมบูรณ์ หลักสูตรนี้อิงจากบทเรียนที่บันทึกไว้ที่มหาวิทยาลัยซานฟรานซิสโกสำหรับหลักสูตรวิทยาศาสตรมหาบัณฑิตสาขาวิชาวิทยาศาสตร์ข้อมูล เราถือว่าคุณมีประสบการณ์ในการเขียนโค้ดอย่างน้อยหนึ่งปี และจดจำสิ่งที่คุณเรียนรู้ในวิชาคณิตศาสตร์ระดับมัธยมศึกษาตอนปลาย หรือเตรียมพร้อมที่จะทำการศึกษาอิสระเพื่อฟื้นฟูความรู้ของคุณ
การเรียนรู้ของเครื่องเบื้องต้น ECE 5984 (Virginia Tech) ศาสตราจารย์ Dhruv Batra
[หลักสูตร] [YouTube]
Deep Learning CS230 (Stanford), ศาสตราจารย์ Andrew Ng, Kian Katanforoosh
[หลักสูตร] [YouTube]
Deep Learning เป็นหนึ่งในทักษะด้าน AI ที่เป็นที่ต้องการมากที่สุด ในหลักสูตรนี้ คุณจะได้เรียนรู้รากฐานของการเรียนรู้เชิงลึก เข้าใจวิธีสร้างโครงข่ายประสาทเทียม และเรียนรู้วิธีเป็นผู้นำโปรเจ็กต์แมชชีนเลิร์นนิงที่ประสบความสำเร็จ คุณจะได้เรียนรู้เกี่ยวกับเครือข่าย Convolutional, RNN, LSTM, Adam, Dropout, BatchNorm, การเริ่มต้น Xavier/He และอื่นๆ อีกมากมาย
ความเชี่ยวชาญด้านการเรียนรู้เชิงลึก ศาสตราจารย์ Andrew Ng, Kian Katanforoosh
[คอร์ส]
ใน 5 หลักสูตร คุณจะได้เรียนรู้พื้นฐานของ Deep Learning เข้าใจวิธีสร้างโครงข่ายประสาทเทียม และเรียนรู้วิธีเป็นผู้นำโครงการ Machine Learning ที่ประสบความสำเร็จ คุณจะได้เรียนรู้เกี่ยวกับเครือข่าย Convolutional, RNN, LSTM, Adam, Dropout, BatchNorm, การเริ่มต้น Xavier/He และอื่นๆ อีกมากมาย คุณจะได้ทำงานเกี่ยวกับกรณีศึกษาจากการดูแลสุขภาพ การขับรถอัตโนมัติ การอ่านภาษามือ การสร้างเพลง และการประมวลผลภาษาธรรมชาติ คุณจะเชี่ยวชาญไม่เพียงแต่ทฤษฎีเท่านั้น แต่ยังได้เห็นว่ามันถูกนำไปใช้ในอุตสาหกรรมอย่างไรอีกด้วย คุณจะได้ฝึกฝนแนวคิดเหล่านี้ทั้งหมดใน Python และใน TensorFlow ซึ่งเราจะสอน
การเรียนรู้เชิงลึก EE-559 (EPFL), François Fleuret
[คอร์ส]
หลักสูตรนี้เป็นการแนะนำการเรียนรู้เชิงลึกโดยละเอียด โดยมีตัวอย่างในเฟรมเวิร์ก PyTorch: วัตถุประสงค์ของการเรียนรู้ของเครื่องและความท้าทายหลัก การทำงานของเทนเซอร์ การสร้างความแตกต่างอัตโนมัติ การไล่ระดับลง เทคนิคเฉพาะสำหรับการเรียนรู้เชิงลึก (แบทช์นอร์ม การออกกลางคัน เครือข่ายที่เหลือ) การทำความเข้าใจรูปภาพ , แบบจำลองกำเนิด, แบบจำลองกำเนิดที่ขัดแย้งกัน, แบบจำลองที่เกิดซ้ำ, แบบจำลองความสนใจ, NLP
ข้อมูลเบื้องต้นเกี่ยวกับการเรียนรู้เชิงลึก 6.S191 (MIT), Alexander Amini และ Ava Soleimany
[หลักสูตร] [YouTube]
หลักสูตรเบื้องต้นของ MIT เกี่ยวกับวิธีการเรียนรู้เชิงลึกพร้อมการประยุกต์ใช้กับคอมพิวเตอร์วิทัศน์ การประมวลผลภาษาธรรมชาติ ชีววิทยา และอีกมากมาย! นักเรียนจะได้รับความรู้พื้นฐานเกี่ยวกับอัลกอริธึมการเรียนรู้เชิงลึก และได้รับประสบการณ์เชิงปฏิบัติในการสร้างโครงข่ายประสาทเทียมใน TensorFlow ปิดท้ายหลักสูตรด้วยการแข่งขันเสนอโครงการพร้อมผลตอบรับจากเจ้าหน้าที่และคณะผู้ให้การสนับสนุนในอุตสาหกรรม ข้อกำหนดเบื้องต้นถือว่าแคลคูลัส (เช่น การหาอนุพันธ์) และพีชคณิตเชิงเส้น (เช่น การคูณเมทริกซ์) เราจะพยายามอธิบายเรื่องอื่นไปพร้อมกัน! ประสบการณ์ใน Python มีประโยชน์แต่ไม่จำเป็น
การเรียนรู้เชิงลึกเชิงปฏิบัติสำหรับผู้เขียนโค้ด (fast.ai), เจเรมี ฮาวเวิร์ด
[หลักสูตร] [YouTube]
การเรียนรู้เชิงลึกสำหรับผู้เขียนโค้ดด้วย fastai และ PyTorch: แอปพลิเคชัน AI ที่ไม่มีปริญญาเอก
การเรียนรู้เชิงลึกเพื่อการรับรู้ ECE 6504 (Virginia Tech), ศ. Dhruv Batra
[หลักสูตร] [YouTube]
หลักสูตรนี้จะทำให้นักเรียนได้สัมผัสกับการวิจัยที่ล้ำสมัย เริ่มจากการทบทวนความรู้พื้นฐานของโครงข่ายประสาทเทียม ไปจนถึงการพัฒนาล่าสุด
การบรรยายการเรียนรู้เชิงลึกและปัญญาประดิษฐ์ (MIT)
[หลักสูตร] [YouTube]
รู้เบื้องต้นเกี่ยวกับการเรียนรู้เชิงลึก 11-785 (มหาวิทยาลัยคาร์เนกี้เมลลอน)
[หลักสูตร] [YouTube]
ในหลักสูตรนี้ เราจะเรียนรู้เกี่ยวกับพื้นฐานของ Deep Neural Network และการประยุกต์กับงาน AI ต่างๆ เมื่อจบหลักสูตร คาดว่านักเรียนจะมีความคุ้นเคยอย่างมากกับวิชานี้ และสามารถประยุกต์การเรียนรู้เชิงลึกกับงานต่างๆ ได้ พวกเขายังจะอยู่ในตำแหน่งที่จะเข้าใจวรรณกรรมปัจจุบันในหัวข้อนี้และขยายความรู้ผ่านการศึกษาเพิ่มเติม
คอมพิวเตอร์กราฟิก มช. 15-462/662 (มหาวิทยาลัยคาร์เนกี้เมลลอน)
[เว็บไซต์] [YouTube]
วิดีโอบรรยายสำหรับชั้นเรียนคอมพิวเตอร์กราฟิกเบื้องต้นที่ Carnegie Mellon University
คอมพิวเตอร์กราฟิกส์ (มหาวิทยาลัยอูเทรคต์), Wolfgang Huerst
[ยูทูป]
บันทึกจากการบรรยายเบื้องต้นเกี่ยวกับคอมพิวเตอร์กราฟิก จัดทำโดย Wolfgang Hürst มหาวิทยาลัย Utrecht ประเทศเนเธอร์แลนด์ ตั้งแต่เดือนเมษายน 2555 ถึงเดือนมิถุนายน 2555
คอมพิวเตอร์กราฟิก ECS175 (UC Davis), ศาสตราจารย์ เคนเน็ธ จอย
[ยูทูป]
คอมพิวเตอร์กราฟิก (ECS175) สอนหลักการพื้นฐานของคอมพิวเตอร์กราฟิก 3 มิติ เนื้อหาจะเน้นไปที่เทคนิคทางคณิตศาสตร์เบื้องต้นสำหรับการวางตำแหน่งวัตถุในพื้นที่สามมิติ เลนส์เชิงเรขาคณิตที่จำเป็นในการพิจารณาว่าแสงสะท้อนจากพื้นผิวอย่างไร และวิธีการใช้ระบบคอมพิวเตอร์และวิธีการใช้อัลกอริธึมและเทคนิคที่จำเป็นในการสร้างพื้นฐาน 3- ภาพประกอบที่มีมิติ หัวข้อโดยละเอียดจะประกอบด้วยหัวข้อต่อไปนี้: เรขาคณิตการเปลี่ยนแปลง การวางตำแหน่งของกล้องเสมือนและแหล่งกำเนิดแสง การสร้างแบบจำลองแบบลำดับชั้นของวัตถุที่ซับซ้อน การเรนเดอร์แบบจำลองที่ซับซ้อน อัลกอริธึมการแรเงา และวิธีการในการเรนเดอร์และการแรเงาวัตถุโค้ง
คอมพิวเตอร์กราฟิก CS184 (UC Berkeley), Ravi Ramamoorthi
[คอร์ส]
หลักสูตรนี้เป็นการแนะนำพื้นฐานของคอมพิวเตอร์กราฟิก 3 มิติ หัวข้อที่ครอบคลุม ได้แก่ การแปลง 2D และ 3D, การเขียนโปรแกรมกราฟิก 3D แบบโต้ตอบด้วย OpenGL, โมเดลการแรเงาและการจัดแสง, การสร้างแบบจำลองทางเรขาคณิตโดยใช้เส้นโค้ง Bézier และ B-Spline, การเรนเดอร์คอมพิวเตอร์กราฟิกรวมถึง Ray Tracing และการส่องสว่างทั่วโลก, การประมวลผลสัญญาณสำหรับการลบรอยหยักและการทำแผนที่พื้นผิว และแอนิเมชั่นและจลนศาสตร์ผกผัน โดยจะเน้นทั้งด้านคณิตศาสตร์และเรขาคณิตของกราฟิก ตลอดจนความสามารถในการเขียนโปรแกรมกราฟิก 3 มิติที่สมบูรณ์
หลักสูตร Rendering / Ray Tracing (TU Wien), Károly Zsolnai-Fehér
[หลักสูตร] [YouTube]
หลักสูตรนี้มีจุดมุ่งหมายเพื่อให้ภาพรวมของวิธีการเรนเดอร์พื้นฐานและล้ำสมัย มีการแนะนำวิธีการออฟไลน์ เช่น การติดตามรังสีและเส้นทาง การทำแผนที่โฟตอน และอัลกอริธึมอื่นๆ อีกมากมาย และมีการอธิบายการปรับแต่งต่างๆ มีการสรุปพื้นฐานของฟิสิกส์ที่เกี่ยวข้อง เช่น ทัศนศาสตร์เชิงเรขาคณิต ปฏิกิริยาระหว่างพื้นผิวและสื่อกับแสงและกล้อง มีการแนะนำเครื่องมือของ Monte Carlo ซึ่งใช้อย่างมากในอัลกอริทึมหลายอย่างและการปรับแต่งในรูปแบบของการสุ่มตัวอย่างแบบแบ่งชั้นและวิธีการของ Metropolis-Hastings