Olá, sou Karan, um estudante do ensino médio que mora em Cingapura. Tendo passado o último ano explorando a área de Inteligência Artificial (IA) e Aprendizado de Máquina (ML), acredito que não existe um caminho de aprendizagem nesta área que seja construído especificamente para alunos do Ensino Médio . Esta é minha tentativa de criar um.
Desde que comecei a minha jornada nesta área, procuro dedicar algumas horas todos os dias para entender o máximo que posso, seja assistindo a vídeos no Youtube, realizando projetos pessoais ou simplesmente lendo livros. Fui orientado por colegas mais velhos que têm muito mais experiência do que eu, mas sei que tal orientação não está disponível para todos - portanto, esta é a minha tentativa de transmitir todos os aprendizados em um documento concreto.
Todas as informações que compilei neste guia destinam-se a alunos do ensino médio que desejam se destacar nesta área emergente. Destina-se a ser seguido cronologicamente e, ao contrário da maioria dos guias/caminhos de aprendizagem que encontrei, não requer uma compreensão de álgebra linear, derivadas parciais e outros conceitos matemáticos complexos que não se encontram nos programas do ensino médio. No entanto, inclui um curso que cobre os fundamentos da matemática essencial para o aprendizado de máquina - cujo nível eu consideraria comparável ao da matemática do ensino médio. Se você seguir esse caminho regularmente, acredito que poderá chegar a um nível razoavelmente proficiente em cerca de três meses. No entanto, este caminho de aprendizagem fornece conteúdo que pode mantê-lo aprendendo pelo resto do seu tempo no ensino médio.
Então, vamos lá.
Eu sugiro fortemente o Python como ponto de partida, pois é uma linguagem que atende a maioria dos requisitos quando se trata de ser usada no domínio de IA/ML - além de ser extremamente fácil de aprender, ela fornece bibliotecas e estruturas para praticamente todos os algoritmos básicos conhecido na área. Embora R seja útil, acho que Python é muito mais adequado para alunos do ensino médio devido à sua legibilidade e aprendizagem. Além da programação básica, em particular para Machine Learning, as bibliotecas mais úteis são Numpy, Pandas e Matplotlib.
Para aqueles que nunca programaram antes, sugiro fazer um curso oferecido pela Universidade de Toronto (uma das melhores universidades para IA/ML no momento). Levará algumas semanas, mas valerá a pena - a maior parte do conhecimento que você adquire neste curso pode ser aplicado a qualquer outra linguagem de programação, a única diferença é a sintaxe. O curso é gratuito e pode ser conferido aqui.
Para aqueles que têm experiência em codificação em uma linguagem além do Python, basta dar uma olhada neste tutorial para obter uma compreensão básica da sintaxe do Python - não deve demorar mais do que um dia.
ML e IA são construídos sobre princípios matemáticos como cálculo, álgebra linear, probabilidade, estatística e otimização - muitos profissionais esperançosos de IA (como eu) acham isso assustador. Este curso sobre edX Essential Math for Machine Learning: Python Edition da Microsoft não foi projetado para torná-lo um matemático. Em vez disso, visa ajudá-lo a aprender alguns conceitos fundamentais essenciais e a notação usada para expressá-los. O curso oferece uma abordagem prática para trabalhar com dados e aplicar as técnicas que você aprendeu em situações de problemas do mundo real. A ajuda financeira está disponível para quem precisa.
Agora, depois de aprender o básico do Python, você precisa entender as duas bibliotecas fundamentais usadas na área - Numpy e Pandas, que são usadas principalmente para manipulação, representação e armazenamento de dados. Matplotlib, a terceira biblioteca 'principal' da área, é usada para visualizar esses dados por meio de gráficos e diagramas - mas falaremos disso mais tarde. Esses dois cursos juntos não devem durar mais do que alguns dias: Numpy e Pandas.
Com isso no bolso de trás, agora você deve estar definido na programação básica necessária para aprender aprendizado de máquina e inteligência artificial.
Se existe um curso universal para aprendizado de máquina, esse curso é o de Andrew Ng. Pode parecer um pouco desafiador para estudantes do ensino médio, pois se refere a conceitos como derivadas parciais
mas acredito firmemente que não é necessário entendê-los para obter conhecimento tangível do curso. Achei particularmente benéfico assistir novamente a algumas palestras das semanas 3 a 5 - esses tópicos são avançados, por isso pode parecer um pouco rápido na primeira vez que você assistir. Não fique muito preocupado se você não conseguir seguir completamente o núcleo da matemática, especialmente no que diz respeito ao cálculo - parte disso certamente requer conhecimento matemático de nível universitário. É mais importante que você seja capaz de seguir o processo de pensamento que o Prof. Ng usa ao transmitir seu conhecimento, pois isso permite que você compreenda o que está acontecendo nos bastidores dos processos de aprendizado de máquina.
Eu o encorajaria a fazer anotações durante o curso, pois anotar o que você aprendeu ajuda a garantir que você realmente entenda as informações transmitidas. A conclusão dos tutoriais e exercícios de programação não é essencial, pois são feitos em Matlab - o que (na minha experiência) pode ser difícil de entender, pois é uma linguagem baseada em matrizes. Mas não se preocupe, estaremos fazendo exatamente os mesmos (e muito mais avançados) algoritmos em Python em pouco tempo.
Este curso gratuito pode ser encontrado aqui.
Implementar algoritmos de ML sem o conhecimento matemático de nível universitário que alimenta os detalhes básicos desses algoritmos parece uma tarefa paradoxal - no entanto, uma equipe da Austrália decidiu fazer exatamente isso.
Kirill Eremenko e Hadelin de Ponteves, dois pesquisadores que fazem parte da equipe 'SuperDataScience', são absolutamente fantásticos em encontrar maneiras relevantes de aplicar algoritmos simples na vida real. Além disso, eles se aprofundam adequadamente para entender a funcionalidade do algoritmo, mas sem a matemática complexa que um estudante do ensino médio não seria capaz de entender. O curso deles cobre Python e R, embora eu não me preocupe com R neste momento - basta seguir os tutoriais do Python. Além disso, se você achar que eles estão um pouco lentos demais, jogue este curso na velocidade de 1,25x (eu fiz isso e achei muito mais adequado ao meu aprendizado).
O curso deles está na Udemy e é oferecido apenas na versão paga, embora a Udemy regularmente tenha descontos de 90% ou mais em seus cursos. Ele pode ser encontrado aqui e geralmente custa cerca de US$ 10. Abrange tudo, desde algoritmos de regressão básicos até redes neurais profundas, sendo que esta última é a arquitetura central usada em muitos aplicativos modernos, como ChatGPT e AlphaFold. Se você deseja explorar áreas ainda mais avançadas, o curso Deep Learning é oferecido ao final do Machine Learning com 90% de desconto.
Se não estiver disposto a pagar por este curso, você pode conferir o curso gratuito Deep Learning do Google aqui ou o curso gratuito da Universidade de Michigan aqui. Na minha opinião, porém, estes estão longe de ser tão completos quanto os cursos da equipe SuperDataScience.
Para esses cursos, fazer anotações não é uma necessidade - existem toneladas de 'folhas de dicas de algoritmos' online, que oferecem uma rápida introdução sobre como eles funcionam. Este site lista alguns.
Agora que você abordou uma ampla variedade de conceitos de aprendizado de máquina, é hora de usar esse conhecimento de forma independente para concluir alguns projetos. Eu sugiro explorar o Kaggle e o UCI Machine Learning Repository - encontre um conjunto de dados de seu interesse e modele algumas soluções para problemas aos quais eles se relacionam. Experimente diferentes algoritmos e trabalhe para otimizar o desempenho.
Certifique-se de que os conjuntos de dados que você usa sejam simples e limpos por natureza - ou seja, eles não devem exigir muito pré-processamento ou conhecimento específico do domínio para trabalhar. Alguns conjuntos de dados fáceis que surgiram na minha cabeça são Iris, Wine, Breast Cancer Wisconsin, Autism Screening, Congress Voting, Handwriting Digits MNIST e Fashion MNIST.
Se você alguma vez se deparar com um obstáculo, Stack Overflow é seu melhor amigo - eles têm uma resposta para quase todas as perguntas que você tiver. Caso contrário, basta postar uma - você receberá respostas dentro de algumas horas! Não há muito mais nesta etapa - quando você descobrir que está confortável com todo o processo de modelagem, de trás para frente, sinta-se à vontade para seguir em frente!
Agora você não deve apenas ter um conhecimento amplo e amplo de todos os princípios básicos, mas também a capacidade de aplicá-los a alguns problemas de dados do mundo real. No entanto, é importante entender que esses princípios básicos não abrangem todo o mundo do ML/IA - em vez disso, muitos deles são formas conhecidas de lidar com esses problemas de dados há anos, mas infelizmente só mais recentemente os computadores foram poderosos o suficiente para realmente aproveitar em um tempo de execução razoável. A maior parte do trabalho moderno na área concentra-se em melhorá-los de várias maneiras novas e na construção de sistemas tangenciais a estes que aproveitam os algoritmos subjacentes, mas os melhoram, ampliam e aprimoram de várias maneiras. Assim, sugiro que você encontre uma área de interesse no campo mais amplo de Aprendizado de Máquina e se aprofunde nela para ter mais experiência com o estado da arte dessa área como é hoje. Você provavelmente não terá tempo para se tornar especialista em todas as áreas que descrevi durante seu período no ensino médio, mas tente conquistar uma ou duas.
Antes de entrar nessas áreas, recomendo entender verdadeiramente o que se trata - uma simples pesquisa no YouTube por uma explicação de alto nível lhe dará tudo que você precisa. Então vamos lá.
Visão Computacional: Esta área refere-se a fazer com que os computadores vejam e entendam coisas usando um tipo especial de rede neural. Stanford publica seu curso on-line aqui, com palestras, notas de curso e tarefas disponíveis on-line. Faça isso, mas não se preocupe com o fato de a matemática às vezes ser muito complicada - o curso tem como objetivo principal aprofundar seu conhecimento, o que inevitavelmente acontecerá. Você também pode consultar o OpenCV, uma biblioteca de visão computacional que faz muitas coisas complexas para você. Um ótimo tutorial pode ser encontrado aqui. Quando terminar, dê uma olhada em conjuntos de dados de imagens mais avançados no Kaggle e UCI, ou até mesmo participe de algumas competições Kaggle.
Processamento de Linguagem Natural: Compreender como os computadores aprendem a falar também é um tópico de destaque hoje. Mais uma vez, Stanford oferece um ótimo curso online que pode ser encontrado aqui. Se você não entende alguns conceitos matemáticos, não se preocupe, apenas entenda como esse domínio funciona. Para implementações, você pode realizar este curso da Udemy. No entanto, você pode, alternativamente, assistir a alguns dos vídeos do conhecido aluno de máquina Siraj Raval. Depois de fazer isso, tente realizar projetos simples e conhecidos, como construir um chatbot, análise de sentimentos ou criar letras para uma música - pesquisas simples no YouTube devem ajudá-lo. Aplicativos mais modernos como ChatGPT e Claude são construídos em um sistema baseado em rede neural chamado Large Language Models, que é baseado principalmente na arquitetura Transformer - este curso de Andrew Ng é um bom ponto de partida.
Aprendizagem por Reforço: Este domínio concentra-se em como as máquinas aprendem a agir em um determinado ambiente, e sua aplicação mais popular é na área de videogames. Siraj Raval tem uma playlist muito boa sobre isso, que pode ser encontrada aqui. Se você está procurando tutoriais baseados em implementação usando especificamente um pacote de alto nível como Tensorflow, Denny Britz tem um conjunto sólido de tutoriais que pode ser encontrado aqui. O curso UCL de David Silver também é ótimo, embora os iniciantes possam achar um pouco complicado - ele pode ser encontrado aqui. Depois de terminar isso, é bastante lógico começar a baixar projetos básicos ou jogos online e adicionar um elemento de IA para controlar como os agentes agem. Orientações simples podem novamente ser encontradas através de uma simples pesquisa no Youtube.
Ciência e análise de dados: este campo é um domínio emergente com inúmeras oportunidades de emprego interessantes e é amplamente utilizado na maioria das corporações modernas para obter insights a partir da quantidade de dados coletados a fim de informar as decisões de negócios. Sugiro realizar o curso pago da SuperDataScience ou o curso gratuito baseado em Python da UC San Diego, embora você possa encontrar caminhos de aprendizagem específicos para ciência de dados com uma simples pesquisa no Google. Você também pode usar os links a seguir para aprender SQL e Matplotlib, que são linguagens tangenciais usadas para muitas análises de dados modernas. A vantagem de aprender isso no nível estudantil é a empregabilidade - tenho vários amigos no ensino médio que receberam ofertas de estágios em ciência de dados, pois os insights obtidos no trabalho nesta disciplina podem ser instantaneamente monetizados pelas empresas. A tomada de decisões baseada em dados é realmente a única forma de tomada de decisão no mundo corporativo atual.
Existem também áreas como Máquinas Boltzmann (usadas para sistemas de recomendação), Redes Adversiais (IA melhorando a IA) e Algoritmos Genéticos (melhorando uma solução para um problema de forma semelhante à evolução natural), mas na minha opinião, a combinação de seu nicho a aplicabilidade e a exigência de níveis mais avançados de matemática os tornam menos desejáveis como ponto de partida. Sinta-se à vontade para explorá-los se você tiver uma paixão particular por um deles, embora eles também não estejam tão bem documentados quanto as outras áreas, o que pode tornar seu domínio um pouco mais complicado.
Se quiser trabalhar neste campo a longo prazo, é crucial compreender a partir de uma perspectiva mais holística - com isto quero dizer aprender sobre descobertas inovadoras, o discurso sobre como deve ser aplicado e as suas implicações gerais na sociedade. Você deve começar a fazer as coisas listadas nesta seção assim que tiver o entendimento necessário de como a tecnologia funciona - acredito que um bom ponto de partida é começar a Seção 4 deste caminho de aprendizagem. Este tipo de informação pode não ajudar especificamente na implementação de algoritmos para problemas de dados, mas para uma tecnologia que é tão integrante do mundo de hoje, realmente ajuda a moldar uma compreensão mais robusta do seu papel, verdadeiro potencial e limites.
Há algumas coisas que um aluno do ensino médio pode fazer para aprofundar seu conhecimento geral da área e torná-lo mais informado:
Comece a ler artigos de pesquisa: gostaria de enfatizar que eles não são tão desafiadores quanto parecem. Embora a matemática que rege as técnicas modernas possa ser muito avançada, simplesmente obter exposição ao que está acontecendo nas linhas de frente da indústria nunca é uma coisa ruim. Se você encontrar um que não entende, basta largá-lo - há alternativas mais do que suficientes para mantê-lo ocupado. Este site oferece uma série de ótimos artigos para começar, mas depois de terminá-los, oferece uma lista mais longa - basta ler aqueles nos quais você está interessado ou relacionados à sua área de 'especialização' na Seção 5. É útil manter um pequeno diário de aprendizados de cada artigo. Se você não consegue realmente entender muitos desses artigos de pesquisa, tente ler este guia que escrevi, que fornece análises mais digeríveis de algumas inovações recentes. Este canal do Youtube também oferece uma série de explicações mais introdutórias de artigos, cada uma abordada em apenas dois minutos.
Siga os pioneiros: pessoas como Andrew Ng, Ian Goodfellow e Yann LeCunn são entrevistadas regularmente, fornecendo a perspectiva dos 'fundadores' do que hoje conhecemos como IA e ML. Este canal do Youtube reúne o melhor dessas palestras e as compila em um recurso central – assista uma por noite e garanto que você se sentirá um especialista em semanas.
Mantenha-se atualizado com a área: Wired é uma das melhores plataformas para quem se interessa por tecnologia. Ele publica várias histórias relacionadas à IA todos os dias (embora nem todo mundo o faça hoje em dia?), Que podem ser encontradas aqui. É uma maneira rápida e envolvente de entender as tendências da época. Como alternativa, assine o bot do Facebook Messenger do TechCrunch - ele geralmente contém artigos interessantes relacionados à IA e fornece informações todos os dias.
Entenda as implicações: não há melhor maneira de fazer isso do que ouvindo as palestras do TED. Seus palestrantes são extremamente conhecedores da área e há uma ênfase crescente na IA em seus discursos. Uma coleção de vídeos pode ser encontrada aqui.
A Filosofia: A IA tem seus apoiadores e seus opositores. A filosofia por trás disso, no entanto, é intrigante. Meus livros favoritos que exploram essa área e são adequados para estudantes do ensino médio incluem 'How to Create a Mind', de Ray Kurzweil, e 'Life 3.0', de Max Tegmark - experimente. Eles analisam a trajetória de longo prazo da IA, que pode não parecer tão relevante no dia a dia, mas ajuda a compreender o contexto mais amplo da tecnologia como um todo.
Contribuindo: Se você é o tipo de pessoa que gosta de aprender com a experiência dos outros, confira canais de discurso como este grupo do Facebook, onde as pessoas postam regularmente artigos e artigos esclarecedores relacionados aos avanços na área. Alternativamente, para conversas mais casuais, verifique subreddits sobre IA como este.
Aprofunde-se na matemática: Sim, você precisa de fundamentos de matemática de nível universitário para isso, mas se você for um bom estudante de matemática, nada o impedirá de fazer alguns cursos online. A Microsoft tem um curso gratuito sobre o qual ouvi coisas boas e que exige apenas matemática de nível médio. Este tópico do Quora também possui ótimos recursos que você deve conferir. 3Blue1Brown também é um nome famoso na comunidade, já que seus vídeos no Youtube são fantásticos para aprender matemática (principalmente álgebra linear e cálculo) por trás de alguns dos conceitos mais complicados.
Já ouvi muitas pessoas me dizerem que aprender aprendizado de máquina e inteligência artificial é muito difícil para um estudante do ensino médio não escrever isso - com um caminho de aprendizagem bem pavimentado, pode ser estudado por qualquer pessoa. E com isso, desejo a todos boa sorte na realização deste caminho de aprendizagem.
Se você tiver acréscimos ou possíveis melhorias neste guia, sinta-se à vontade para fazer um PR para este repositório. E para comentários, colaborações ou apenas dúvidas gerais, sinta-se à vontade para escrever para mim @ [email protected].