Une liste organisée de cours universitaires gratuits et de haute qualité avec des conférences vidéo liées au domaine de la vision par ordinateur.
Signaux et systèmes 6.003 (MIT), professeur Dennis Freeman
[Cours]
Signaux et systèmes 6.003 couvre les principes fondamentaux de l'analyse des signaux et des systèmes, en se concentrant sur les représentations de signaux à temps discret et à temps continu (fonctions de singularité, exponentielles et géométriques complexes, représentations de Fourier, transformées de Laplace et Z, échantillonnage) et les représentations de signaux linéaires et temporels. -systèmes invariants (différences et équations différentielles, schémas fonctionnels, fonctions du système, pôles et zéros, convolution, réponses impulsionnelles et échelonnées, réponses en fréquence). Les applications proviennent largement de l'ingénierie et de la physique, y compris la rétroaction et le contrôle, les communications et le traitement du signal.
Traitement du signal numérique ECSE-4530 (Institut polytechnique Rensselaer), Richard Radke
[Cours] [YouTube]
Ce cours fournit un traitement complet de la théorie, de la conception et de la mise en œuvre des algorithmes de traitement du signal numérique. Dans la première moitié du cours, nous mettons l'accent sur l'analyse du domaine fréquentiel et de la transformée en Z. Dans la seconde moitié du cours, nous étudions des sujets avancés en matière de traitement du signal, notamment le traitement du signal multi-taux, la conception de filtres, le filtrage adaptatif, la conception de quantificateurs et l'estimation du spectre de puissance. Le cours est assez indépendant de l'application, afin de fournir une base théorique solide pour des études futures dans les domaines des communications, du contrôle ou du traitement d'images. Ce cours était initialement offert au niveau des études supérieures, mais a été réorganisé en 2009 pour être de niveau supérieur.
Traitement numérique du signal (EPFL), Paolo Prandoni, Martin Vetterli
[Cours]
Dans cette série de quatre cours, vous apprendrez les bases du traitement numérique du signal de A à Z. En partant de la définition de base d'un signal à temps discret, nous passerons par l'analyse de Fourier, la conception de filtres, l'échantillonnage, l'interpolation et la quantification pour créer un ensemble d'outils DSP suffisamment complet pour analyser en détail un système de communication pratique. Des exemples pratiques et des démonstrations seront régulièrement utilisés pour combler le fossé entre la théorie et la pratique.
Traitement d'images et de vidéos : de Mars à Hollywood avec un arrêt à l'hôpital (Université Duke), Prof. Guillermo Sapiro
[Cours] [YouTube]
Dans ce cours, vous apprendrez la science derrière la façon dont les images et vidéos numériques sont créées, modifiées, stockées et utilisées. Nous examinerons le vaste monde de l'imagerie numérique, depuis la manière dont les ordinateurs et les appareils photo numériques forment des images jusqu'à la manière dont les effets spéciaux numériques sont utilisés dans les films hollywoodiens, en passant par la manière dont le Mars Rover a pu envoyer des photographies à travers des millions de kilomètres d'espace.
Le cours commence par examiner le fonctionnement du système visuel humain, puis vous enseigne l'ingénierie, les mathématiques et l'informatique qui font fonctionner les images numériques. Vous apprendrez les algorithmes de base utilisés pour ajuster les images, explorerez les normes JPEG et MPEG pour l'encodage et la compression des images vidéo, et découvrirez ensuite la segmentation d'images, la suppression du bruit et le filtrage. Enfin, nous terminerons par les techniques de traitement d'images utilisées en médecine.
Introduction au traitement d'images numériques ECSE-4540 (Institut polytechnique Rensselaer), Richard Radke
[Cours] [YouTube]
Une introduction au domaine du traitement d'images, couvrant à la fois les aspects analytiques et de mise en œuvre. Les sujets incluent le système visuel humain, les caméras et la formation d'images, l'échantillonnage et la quantification d'images, l'amélioration d'images dans les domaines spatial et fréquentiel, la conception de filtres, la restauration d'images, le codage et la compression d'images, le traitement d'images morphologiques, le traitement d'images couleur, la segmentation d'images et l'imagerie. reconstruction. Exemples et missions du monde réel tirés de l'imagerie numérique grand public, de la sécurité et de la surveillance, ainsi que du traitement d'images médicales. Ce cours constitue une bonne base pour nos cours approfondis de traitement d'images et de vision par ordinateur.
Fondamentaux du traitement numérique de l'image et de la vidéo (Université Northwestern), Prof. Aggelos K. Katsaggelos
[Cours]
Ce cours couvrira les fondamentaux du traitement d'image et de vidéo. Nous fournirons un cadre mathématique pour décrire et analyser des images et des vidéos en tant que signaux bidimensionnels et tridimensionnels dans les domaines spatial, spatio-temporel et fréquentiel. Dans ce cours, vous apprendrez non seulement la théorie derrière les tâches de traitement fondamentales, notamment l'amélioration, la récupération et la compression des images/vidéos, mais vous apprendrez également à effectuer ces tâches de traitement clés en pratique à l'aide de techniques et d'outils de pointe. . Nous présenterons et utiliserons une grande variété de ces outils – des boîtes à outils d'optimisation aux techniques statistiques. L'accent sera également mis sur le rôle particulier que joue la parcimonie dans le traitement moderne de l'image et de la vidéo. Dans tous les cas, des exemples d’images et de vidéos appartenant à des domaines d’application spécifiques seront utilisés.
Traitement d'image et de signal multidimensionnel EENG 510 (Colorado School of Mines), William Hoff
[Cours] [YouTube]
Ce cours fournit à l'étudiant les connaissances théoriques lui permettant d'appliquer les techniques de pointe de traitement d'images et de signaux multidimensionnels. Le cours apprend aux étudiants à résoudre des problèmes pratiques impliquant le traitement de données multidimensionnelles telles que des images, des séquences vidéo et des données volumétriques. Les types de problèmes que les étudiants sont censés résoudre sont la mesure automatisée à partir de données multidimensionnelles et la restauration, la reconstruction ou la compression de données multidimensionnelles. Les outils utilisés pour résoudre ces problèmes comprennent une variété de méthodes d'extraction de caractéristiques, de techniques de filtrage, de techniques de segmentation et de méthodes de transformation.
Traitement d'images numériques (IIT Kanpur), Prof. PK Biswas
[Cours] [YouTube]
Traitement et analyse d'images ECS 173 (UC Davis), professeur Owen Carmichael
[Cours] [YouTube]
Techniques d'extraction automatisée d'informations de haut niveau à partir d'images générées par des caméras, des capteurs de surface tridimensionnels et des dispositifs médicaux. Les applications typiques incluent la détection d'objets dans divers types d'images et la description de populations de spécimens biologiques apparaissant dans l'imagerie médicale.
Traitement d'images numériques EE225B (UC Berkeley), Prof. Avideh Zakhor
[Cours]
Ce cours couvre les sujets suivants : séquences et systèmes 2D, systèmes séparables, tranches de projection, reconstruction à partir de projections et d'informations de Fourier partielles, transformée en Z, différentes équations, calculabilité récursive, DFT et FFT 2D, conception de filtres FIR 2D ; œil humain, perception, propriétés psychophysiques de la vision, photométrie et colorimétrie, optique et systèmes d'image ; amélioration d'image, restauration d'image, modification géométrique d'image, traitement d'image morphologique, demi-teinte, détection de contours, compression d'image : quantification scalaire, codage sans perte, codage de Huffman, techniques de dictionnaire de codage arithmétique, codage de forme d'onde et de transformation DCT, KLT, Hadammard, pyramide de codage multirésolution, codage de sous-bandes, codage fractal, quantification vectorielle, estimation et compensation de mouvement, normes : JPEG, MPEG, H.xxx, pré- et post-traitement, codage d'image et vidéo évolutif, communication d'image et vidéo sur des canaux bruyants.
Traitement d'images numériques I EE637 (Purdue University), Prof. Charles A. Bouman
[Cours] [YouTube]
Introduction aux techniques de traitement d'images numériques pour l'amélioration, la compression, la restauration, la reconstruction et l'analyse. Cours et expériences en laboratoire couvrant un large éventail de sujets, notamment les signaux et systèmes 2D, l'analyse d'images, la segmentation d'images ; vision achromatique, traitement d'images couleur, systèmes d'imagerie couleur, netteté d'images, interpolation, décimation, filtrage linéaire et non linéaire, impression et affichage d'images ; compression d'images, restauration d'images et tomographie.
Big Imaging quantitative : des images aux statistiques (ETH Zurich), KS Mader, M. Stampanoni
[Cours] [YouTube] [GitHub]
La conférence se concentre sur la tâche difficile d'extraire des mesures quantitatives robustes à partir de données d'imagerie et vise à combler le fossé entre le traitement pur du signal et la science expérimentale de l'imagerie. Le cours se concentrera sur les techniques, l'évolutivité et l'analyse scientifique.
Premiers principes de la vision par ordinateur, Shree Nayar
[Site Web] [YouTube]
Premiers principes de la vision par ordinateur est une série de conférences présentée par Shree Nayar, professeur au département d'informatique de la faculté d'ingénierie et des sciences appliquées de l'université de Columbia. La vision par ordinateur consiste à construire des machines qui « voient ». Cette série se concentre sur les fondements physiques et mathématiques de la vision et a été conçue pour les étudiants, les praticiens et les passionnés qui n'ont aucune connaissance préalable en vision par ordinateur.
Vision par ordinateur CAP5415 (UCF), Dr Mubarak Shah
[Cours 2012] [Cours 2014] [YouTube 2012] [YouTube 2014]
Le cours est de niveau introduction. Il couvrira les sujets fondamentaux de la vision par ordinateur et présentera quelques approches fondamentales pour la recherche en vision par ordinateur.
Introduction à la vision par ordinateur CS-6476 (Georgia Tech)
[Cours] [Udacité]
Vision par ordinateur EENG 512 (École des mines du Colorado), William Hoff
[YouTube]
Ce cours donne un aperçu de ce domaine, en commençant par la formation d'images et le traitement d'images de bas niveau. Nous expliquons ensuite en détail la théorie et les techniques permettant d'extraire des caractéristiques d'images, de mesurer la forme et l'emplacement et de reconnaître des objets.
Vision par ordinateur 3D CS4277/CS5477 (Université nationale de Singapour), Gim Hee Lee
[YouTube]
Il s'agit d'un cours d'introduction à la vision par ordinateur 3D qui a été enregistré pour l'apprentissage en ligne à NUS en raison du COVID-19. Les sujets abordés comprennent : Cours 1 : Géométrie projective 2D et 1D. Cours 2 : Mouvement du corps rigide et géométrie projective 3D. Cours 3 : Points circulaires et conique absolue. Cours 4 : Estimation d'homographie robuste. Cours 5 : Modèles de caméras et calibrage. Cours 6 : Métrologie à vue unique. Cours 7 : Les matrices fondamentales et essentielles. Cours 8 : Estimation de pose absolue à partir de points ou de lignes. Cours 9 : Géométrie à trois vues à partir de points et/ou de lignes. Conférence 10 : Structure à partir du mouvement (SfM) et ajustement des faisceaux. Conférence 11 : Stéréo à deux vues et multi-vues. Cours 12 : Caméras généralisées. Conférence 13 : Auto-étalonnage.
Géométrie à vues multiples en vision par ordinateur (IT Sligo), Sean Mullery
[YouTube]
Vision par ordinateur (IIT Kanpur), professeur Jayanta Mukhopadhyay
[Cours]
Le cours couvrira de manière complète la théorie et le calcul liés à la géométrie de l'imagerie et à la compréhension des scènes. Il fournira également une exposition aux techniques de clustering, de classification et d'apprentissage profond appliquées dans ce domaine.
Vision par ordinateur CS-442 (EPFL), Pascal Fua
[Cours]
Les étudiants seront initiés aux techniques de base du domaine de la vision par ordinateur. Ils apprendront à appliquer les techniques de traitement d'images, le cas échéant. Nous nous concentrerons sur les images noir et blanc et couleur acquises à l'aide de caméras vidéo standards. Nous présenterons des techniques de traitement de base, telles que la détection des contours, la segmentation, la caractérisation des textures et la reconnaissance des formes.
Vision par ordinateur CS 543 (Université de l'Illinois), Derek Hoiem
[Cours] [Enregistrements]
Dans ce cours, nous aborderons de nombreux concepts et algorithmes de base de la vision par ordinateur : géométrie à vue unique et multi-vue, éclairage, filtres linéaires, texture, points d'intérêt, suivi, RANSAC, clustering K-means, segmentation, algorithme EM. , la reconnaissance, etc. Lors des devoirs, vous mettrez en pratique plusieurs de ces concepts. Comme il s'agit d'un cours d'enquête, nous n'approfondirons aucun sujet, mais à la fin du cours, vous devez être prêt à toute enquête et application plus approfondie liée à la vision.
Vision par ordinateur pour les effets visuels ECSE-6969, Richard Radke
[Cours] [YouTube]
Ce cours met l'accent sur les sujets de recherche qui sous-tendent les effets visuels avancés qui sont de plus en plus courants dans les publicités, les vidéoclips et les films. Les sujets incluent les algorithmes classiques de vision par ordinateur utilisés régulièrement à Hollywood (tels que le tapis sur écran bleu, la structure à partir du mouvement, le flux optique et le suivi des caractéristiques) et des développements récents passionnants qui constituent la base des effets futurs (tels que le tapis d'image naturel, composition multi-images, reciblage d’images et synthèse de vues). Nous discutons également des technologies derrière la capture de mouvement et l'acquisition de données tridimensionnelles. L'analyse de vidéos en coulisses et d'entretiens approfondis avec des artistes d'effets visuels hollywoodiens relient les concepts mathématiques à la réalisation de films du monde réel.
Traitement d'images et vision par ordinateur (CBCSL), Aleix M. Martinez
[YouTube]
Les anciens secrets de la vision par ordinateur (Université de Washington), Joseph Redmon
[Cours] [YouTube]
Ce cours est une introduction générale à la vision par ordinateur. Il couvre les techniques standard de traitement d'image telles que le filtrage, la détection des contours, la stéréo, le flux, etc. (vision à l'ancienne), ainsi que la vision par ordinateur plus récente basée sur l'apprentissage automatique.
Vision par ordinateur avancée CAP6412 (UCF), Dr Mubarak Shah
[Cours 2019] [YouTube]
Il s'agit d'une vision par ordinateur avancée qui exposera les étudiants diplômés à la recherche de pointe. Dans chaque cours, nous discuterons d'un document de recherche récent lié aux domaines actifs de la recherche actuelle, en particulier utilisant le Deep Learning. La vision par ordinateur est un domaine de recherche très actif depuis de nombreuses décennies et les chercheurs travaillent à la résolution de problèmes importants et complexes. Au cours des dernières années, l’apprentissage profond impliquant les réseaux de neurones artificiels a constitué une force perturbatrice dans la vision par ordinateur. Grâce à l'apprentissage profond, d'énormes progrès ont été réalisés en très peu de temps dans la résolution de problèmes difficiles et des résultats très impressionnants ont été obtenus en matière de classification, de localisation, de segmentation sémantique, etc. d'images et de vidéos. De nouvelles techniques, ensembles de données, bibliothèques matérielles et logicielles émergent presque chaque jour. jour. La vision par ordinateur profond a un impact sur la recherche en robotique, en compréhension du langage naturel, en infographie, en analyse multimodale, etc.
Vision par ordinateur I : méthodes variationnelles (TU München), Prof. Daniel Cremers
[Cours] [YouTube]
Les méthodes variationnelles font partie des techniques les plus classiques d’optimisation des fonctions de coût en dimension supérieure. De nombreux défis en vision par ordinateur et dans d’autres domaines de recherche peuvent être formulés sous forme de méthodes variationnelles. Les exemples incluent le débruitage, l'élimination du flou, la segmentation d'images, le suivi, l'estimation du flux optique, l'estimation de la profondeur à partir d'images stéréo ou la reconstruction 3D à partir de vues multiples.
Dans ce cours, j'introduirai les concepts de base des méthodes variationnelles, du calcul d'Euler-Lagrange et des équations aux dérivées partielles. Je discuterai de la manière dont les défis respectifs de la vision par ordinateur et de l'analyse d'images peuvent être présentés comme des problèmes variationnels et de la manière dont ils peuvent être résolus efficacement. Vers la fin du cours, je discuterai des formulations convexes et des relaxations convexes qui permettent de calculer des solutions optimales ou quasi optimales dans le cadre variationnel.
Vision par ordinateur II : géométrie à vues multiples (TU München), Prof. Daniel Cremers
[Cours] [YouTube]
La conférence présente les concepts de base de la formation d'images : projection en perspective et mouvement de la caméra. Le but est de reconstruire le monde tridimensionnel et le mouvement de la caméra à partir de plusieurs images. A cette fin, on détermine les correspondances entre les points dans diverses images et les contraintes respectives qui permettent de calculer le mouvement et la structure 3D. Le cours met particulièrement l'accent sur les descriptions mathématiques du mouvement d'un corps rigide et de la projection en perspective. Pour estimer le mouvement de la caméra et la géométrie 3D, nous utiliserons à la fois des méthodes spectrales et des méthodes d'optimisation non linéaire.
Vision par ordinateur avancée (CBCSL), Aleix M. Martinez
[YouTube]
École d'été supérieure en vision par ordinateur (IPAM à UCLA)
[Cours]
Photogrammétrie I & II (Université de Bonn), Cyrill Stachniss
[Cours] [YouTube]
Détection mobile et robotique I (Université de Bonn), Cyrill Stachniss
[Cours]
Détection mobile et robotique II (Université de Bonn), Cyrill Stachniss
[Cours] [YouTube]
Cartographie robotique (Université de Bonn), Cyrill Stachniss
[Cours] [YouTube]
La conférence couvrira différents sujets et techniques dans le contexte de la modélisation de l'environnement avec des robots mobiles. Nous aborderons des techniques telles que le SLAM avec la famille des filtres de Kalman, des filtres d'informations, des filtres à particules. Nous étudierons en outre les approches basées sur les graphiques, la minimisation des erreurs des moindres carrés, les techniques de reconnaissance de lieux et de cartographie basée sur l'apparence, ainsi que l'association de données.
Biométrie (IIT Kanpur), professeur Phalguni Gupta
[Cours] [YouTube]
Introduction des traits biométriques et de leur objectif, bases du traitement d'image, opérations de base sur l'image, filtrage, amélioration, netteté, détection des contours, lissage, amélioration, seuillage, localisation. Série de Fourier, DFT, inverse de DFT. Système biométrique, identification et vérification. FAR/FRR, problèmes de conception du système. Identification positive/négative. Sécurité du système biométrique, protocoles d'authentification, distribution des scores de correspondance, courbe ROC, courbe DET, courbe FAR/FRR. Erreur globale attendue, EER, mythes biométriques et fausses déclarations. Sélection de données biométriques appropriées. Attributs biométriques, cartes Zephyr, types de multi-biométrie. Vérification sur système multimodèle, stratégie de normalisation, méthodes de Fusion, identification multimodèle. Sécurité du système biométrique, vulnérabilités du système biométrique, contournement, acquisition secrète, contrôle qualité, génération de modèles, interopérabilité, stockage de données. Systèmes de reconnaissance : visage, signature, empreinte digitale, oreille, iris, etc.
Réseaux de neurones convolutifs CS231n pour la reconnaissance visuelle (Stanford)
[Cours] [YouTube]
Ce cours est une plongée approfondie dans les détails des architectures d'apprentissage profond en mettant l'accent sur l'apprentissage de modèles de bout en bout pour ces tâches, en particulier la classification d'images. Au cours du cours de 10 semaines, les étudiants apprendront à mettre en œuvre, entraîner et déboguer leurs propres réseaux de neurones et acquerront une compréhension détaillée de la recherche de pointe en vision par ordinateur. La mission finale consistera à former un réseau neuronal convolutif de plusieurs millions de paramètres et à l'appliquer sur le plus grand ensemble de données de classification d'images (ImageNet). Nous nous concentrerons sur l'enseignement de la configuration du problème de la reconnaissance d'images, des algorithmes d'apprentissage (par exemple la rétropropagation), des astuces d'ingénierie pratiques pour la formation et le réglage fin des réseaux et guiderons les étudiants à travers des devoirs pratiques et un projet de cours final. Une grande partie du contexte et du matériel de ce cours sera tirée du ImageNet Challenge.
Apprentissage profond pour la vision par ordinateur (Université du Michigan), Justin Johnson
[Cours]
Ce cours est une plongée approfondie dans les détails des méthodes d'apprentissage profond basées sur les réseaux neuronaux pour la vision par ordinateur. Au cours de ce cours, les étudiants apprendront à mettre en œuvre, former et déboguer leurs propres réseaux de neurones et acquerront une compréhension détaillée de la recherche de pointe en vision par ordinateur. Nous aborderons les algorithmes d'apprentissage, les architectures de réseaux neuronaux et les astuces d'ingénierie pratiques pour la formation et le réglage fin des réseaux pour les tâches de reconnaissance visuelle.
Réseaux de neurones convolutifs, professeur Andrew Ng
[Cours]
Ce cours vous apprendra à créer des réseaux de neurones convolutifs et à les appliquer aux données d'image. Grâce au deep learning, la vision par ordinateur fonctionne bien mieux qu’il y a à peine deux ans, ce qui permet de nombreuses applications passionnantes allant de la conduite autonome sûre à la reconnaissance précise des visages, en passant par la lecture automatique des images radiologiques.
Réseaux convolutifs, Ian Goodfellow
[YouTube]
Systèmes sensoriels 9.04 (MIT), Prof. Peter H. Schiller, Prof. M. Christian Brown
[Cours] [YouTube]
Ce cours examine les bases neuronales de la perception sensorielle. L'accent est mis sur les études physiologiques et anatomiques du système nerveux des mammifères ainsi que sur les études comportementales des animaux et des humains. Les sujets incluent le motif visuel, la perception des couleurs et de la profondeur, les réponses auditives et la localisation du son, ainsi que la perception somatosensorielle.
Perception visuelle et cerveau (Université Duke), Dale Purves
[Cours]
Les apprenants seront initiés aux problèmes auxquels la vision est confrontée, en utilisant la perception comme guide. Le cours examinera comment ce que nous voyons est généré par le système visuel, quel est le problème central de la vision et ce que la perception visuelle indique sur le fonctionnement du cerveau. Les preuves proviendront des neurosciences, de la psychologie, de l’histoire de la science de la vision et de l’apport de la philosophie. Bien que les discussions soient éclairées par l’anatomie et la physiologie du système visuel, l’accent est mis sur la perception. Nous voyons le monde physique d’une manière étrange, et le but est de comprendre pourquoi.
Vision de haut niveau (CBCSL)
[YouTube]
Machine Learning CS229 (Stanford), professeur Andrew Ng
[Cours] [YouTube]
Ce cours fournit une introduction générale à l'apprentissage automatique et à la reconnaissance statistique de formes. Les sujets comprennent : l'apprentissage supervisé (apprentissage génératif/discriminatif, apprentissage paramétrique/non paramétrique, réseaux neuronaux, machines à vecteurs de support) ; apprentissage non supervisé (clustering, réduction de dimensionnalité, méthodes noyaux) ; théorie de l'apprentissage (compromis biais/variance ; théorie du capital-risque ; marges importantes) ; apprentissage par renforcement et contrôle adaptatif. Le cours abordera également les applications récentes de l'apprentissage automatique, telles que le contrôle robotique, l'exploration de données, la navigation autonome, la bioinformatique, la reconnaissance vocale et le traitement de données textuelles et Web.
Apprentissage automatique CS156 (Caltech), professeur Yaser Abu-Mostafa
[Cours] [YouTube]
Il s'agit d'un cours d'introduction du professeur Yaser Abu-Mostafa de Caltech sur l'apprentissage automatique qui couvre la théorie de base, les algorithmes et les applications. L'apprentissage automatique (ML) permet aux systèmes informatiques d'améliorer leurs performances de manière adaptative grâce à l'expérience accumulée à partir des données observées. Les techniques de ML sont largement appliquées dans les domaines de l'ingénierie, des sciences, de la finance et du commerce pour créer des systèmes pour lesquels nous ne disposons pas de spécifications mathématiques complètes (et qui couvrent de nombreux systèmes). Le cours équilibre théorie et pratique et couvre les aspects mathématiques et heuristiques.
Apprentissage automatique pour la vision par ordinateur (Université de Heidelberg), Prof. Fred Hamprecht
[Cours] [YouTube]
Ce cours couvre les méthodes avancées d'apprentissage automatique permettant ce que l'on appelle la « prédiction structurée ». L’objectif est de faire plusieurs prédictions qui interagissent de manière non triviale ; et nous prenons en compte ces interactions aussi bien pendant la formation que lors des tests.
Apprentissage automatique pour la robotique et la vision par ordinateur (TU München), Dr Rudolph Triebel
[Cours] [YouTube]
Dans cette conférence, les étudiants seront initiés aux méthodes d'apprentissage automatique les plus fréquemment utilisées dans les applications de vision par ordinateur et de robotique. L'objectif principal du cours est d'obtenir un large aperçu des méthodes existantes et de comprendre leurs motivations et leurs idées principales dans le contexte de la vision par ordinateur et de la reconnaissance de formes.
Apprentissage automatique pour les systèmes intelligents CS4780 (Cornell), professeur Killian Weiberger
[Cours] [YouTube]
L'objectif de ce cours est de donner une introduction au domaine de l'apprentissage automatique. Le cours vous apprendra les compétences de base pour décider quel algorithme d'apprentissage utiliser pour quel problème, coder votre propre algorithme d'apprentissage, l'évaluer et le déboguer.
Introduction à l'apprentissage automatique et à la reconnaissance de formes (CBCSL), Aleix M. Martinez
[YouTube]
Apprentissage automatique appliqué COMS W4995 (Columbia), Andreas C. Müller
[Cours] [YouTube]
Ce cours offre une approche pratique de l'apprentissage automatique et de la science des données. Le cours discute de l'application de méthodes d'apprentissage automatique telles que les SVM, les forêts aléatoires, le gradient boosting et les réseaux de neurones sur des ensembles de données du monde réel, y compris la préparation des données, la sélection et l'évaluation des modèles. Cette classe complète COMS W4721 dans la mesure où elle s'appuie entièrement sur les implémentations open source disponibles dans scikit-learn et Tensor Flow pour toutes les implémentations. Outre l'application de modèles, nous discuterons également des outils et des pratiques de développement logiciel pertinents pour la production de modèles d'apprentissage automatique.
Apprentissage automatique probabiliste et statistique (Université de Tübingen), Prof. Philipp Hennig, Prof. U. von Luxburg
[Cours] [YouTube]
L'accent est mis sur les aspects algorithmiques et théoriques de l'apprentissage automatique. Nous couvrirons de nombreux algorithmes standards et découvrirons les principes généraux et les résultats théoriques pour créer de bons algorithmes d'apprentissage automatique. Les sujets vont de résultats bien établis à des résultats très récents.
Introduction à l'apprentissage automatique pour les codeurs (fast.ai), Jeremy Howard
[Cours] [YouTube]
Enseigné par Jeremy Howard (concurrent n°1 de Kaggle depuis 2 ans et fondateur d'Enlitic). Apprenez les modèles d'apprentissage automatique les plus importants, y compris comment les créer vous-même à partir de zéro, ainsi que les compétences clés en matière de préparation de données, de validation de modèles et de création de produits de données. Il y a environ 24 heures de cours et vous devriez prévoir d'y consacrer environ 8 heures. heures par semaine pendant 12 semaines pour compléter le matériel. Le cours est basé sur des leçons enregistrées à l'Université de San Francisco pour le programme Masters of Science in Data Science. Nous supposons que vous avez au moins un an d'expérience en codage et que vous vous souvenez de ce que vous avez appris en mathématiques au lycée ou que vous êtes prêt à faire des études indépendantes pour rafraîchir vos connaissances.
Introduction à l'apprentissage automatique ECE 5984 (Virginia Tech), Prof. Dhruv Batra
[Cours] [YouTube]
Deep Learning CS230 (Stanford), Professeur Andrew Ng, Kian Katanforoosh
[Cours] [YouTube]
Le Deep Learning est l’une des compétences les plus recherchées en IA. Dans ce cours, vous apprendrez les fondements du Deep Learning, comprendrez comment créer des réseaux de neurones et apprendrez à mener avec succès des projets d'apprentissage automatique. Vous découvrirez les réseaux convolutifs, les RNN, le LSTM, Adam, Dropout, BatchNorm, l'initialisation Xavier/He, et plus encore.
Spécialisation Deep Learning, Prof. Andrew Ng, Kian Katanforoosh
[Cours]
En cinq cours, vous apprendrez les bases du Deep Learning, comprendrez comment créer des réseaux de neurones et apprendrez à mener avec succès des projets d'apprentissage automatique. Vous découvrirez les réseaux convolutifs, les RNN, le LSTM, Adam, Dropout, BatchNorm, l'initialisation Xavier/He, et plus encore. Vous travaillerez sur des études de cas dans les domaines des soins de santé, de la conduite autonome, de la lecture de la langue des signes, de la génération de musique et du traitement du langage naturel. Vous maîtriserez non seulement la théorie, mais vous verrez également comment elle est appliquée dans l'industrie. Vous mettrez en pratique toutes ces idées en Python et en TensorFlow, que nous enseignerons.
Apprentissage profond EE-559 (EPFL), François Fleuret
[Cours]
Ce cours est une introduction approfondie au deep-learning, avec des exemples dans le framework PyTorch : objectifs et principaux défis du machine learning, opérations tensorielles, différenciation automatique, descente de gradient, techniques spécifiques au deep learning (batchnorm, dropout, réseaux résiduels), compréhension des images. , modèles génératifs, modèles génératifs contradictoires, modèles récurrents, modèles d'attention, PNL.
Introduction au Deep Learning 6.S191 (MIT), Alexander Amini et Ava Soleimany
[Cours] [YouTube]
Cours d'introduction du MIT aux méthodes d'apprentissage profond avec des applications à la vision par ordinateur, au traitement du langage naturel, à la biologie et bien plus encore ! Les étudiants acquerront des connaissances fondamentales sur les algorithmes d'apprentissage profond et acquerront une expérience pratique dans la création de réseaux de neurones dans TensorFlow. Le cours se termine par un concours de propositions de projets avec les commentaires du personnel et d'un panel de sponsors de l'industrie. Les prérequis supposent le calcul (c'est-à-dire la prise de dérivées) et l'algèbre linéaire (c'est-à-dire la multiplication matricielle), nous essaierons d'expliquer tout le reste en cours de route ! Une expérience en Python est utile mais pas nécessaire.
Apprentissage profond pratique pour les codeurs (fast.ai), Jeremy Howard
[Cours] [YouTube]
Deep Learning pour les codeurs avec fastai et PyTorch : applications d'IA sans doctorat.
Apprentissage profond pour la perception ECE 6504 (Virginia Tech), Prof. Dhruv Batra
[Cours] [YouTube]
Ce cours exposera les étudiants à des recherches de pointe, depuis un rappel des bases des réseaux de neurones jusqu'aux développements récents.
Conférences sur l'apprentissage profond et l'intelligence artificielle (MIT)
[Cours] [YouTube]
Introduction au Deep Learning 11-785 (Université Carnegie Mellon)
[Cours] [YouTube]
Dans ce cours, nous découvrirons les bases des réseaux de neurones profonds et leurs applications à diverses tâches d'IA. À la fin du cours, on s'attend à ce que les étudiants soient très familiers avec le sujet et soient capables d'appliquer le Deep Learning à une variété de tâches. Ils seront également en mesure de comprendre une grande partie de la littérature actuelle sur le sujet et d’élargir leurs connaissances grâce à des études plus approfondies.
Infographie CMU 15-462/662 (Université Carnegie Mellon)
[Site Web] [YouTube]
Vidéos de conférences pour le cours d'introduction à l'infographie à l'Université Carnegie Mellon.
Infographie (Université d'Utrecht), Wolfgang Huerst
[YouTube]
Enregistrements d'une conférence d'introduction à l'infographie donnée par Wolfgang Hürst, Université d'Utrecht, Pays-Bas, d'avril 2012 à juin 2012.
Infographie ECS175 (UC Davis), professeur Kenneth Joy
[YouTube]
L'infographie (ECS175) enseigne les principes de base de l'infographie tridimensionnelle. L'accent sera mis sur les techniques mathématiques élémentaires pour positionner des objets dans un espace tridimensionnel, l'optique géométrique nécessaire pour déterminer comment la lumière rebondit sur les surfaces, et les moyens d'utiliser un système informatique et des méthodes pour mettre en œuvre les algorithmes et les techniques nécessaires pour produire des 3- illustrations dimensionnelles. Les sujets détaillés comprendront les sujets suivants : géométrie transformationnelle, positionnement des caméras virtuelles et des sources de lumière, modélisation hiérarchique d'objets complexes, rendu de modèles complexes, algorithmes d'ombrage et méthodes de rendu et d'ombrage d'objets courbes.
Infographie CS184 (UC Berkeley), Ravi Ramamoorthi
[Cours]
Ce cours est une introduction aux fondements de l'infographie 3D. Les sujets abordés incluent les transformations 2D et 3D, la programmation graphique 3D interactive avec OpenGL, les modèles d'ombrage et d'éclairage, la modélisation géométrique à l'aide des courbes de Bézier et B-Spline, le rendu infographique incluant le lancer de rayons et l'éclairage global, le traitement du signal pour l'anticrénelage et le mappage de texture, et animation et cinématique inverse. L'accent sera mis sur les aspects mathématiques et géométriques du graphisme, ainsi que sur la capacité d'écrire des programmes graphiques 3D complets.
Cours de rendu/ray tracing (TU Wien), Károly Zsolnai-Fehér
[Cours] [YouTube]
Ce cours vise à donner un aperçu des méthodes de rendu de base et de pointe. Des méthodes hors ligne telles que le traçage de rayons et de chemins, la cartographie de photons et de nombreux autres algorithmes sont introduites et divers affinements sont expliqués. Les bases de la physique impliquée, telles que l'optique géométrique, l'interaction des surfaces et des médias avec la lumière et les modèles de caméra, sont décrites. L'appareil des méthodes de Monte Carlo est présenté, qui est largement utilisé dans plusieurs algorithmes, et son raffinement sous forme d'échantillonnage stratifié et la méthode Metropolis-Hastings sont expliqués.