路线图 2024 - 西班牙语数据工程
又一个包含西班牙语数据工程基本概念、技术挑战和资源的存储库?
您想为存储库做出贡献吗?访问贡献指南
注意:以下学习路线是根据个人判断设计的,目的是通过我在互联网上找到的免费西班牙语材料来促进对数据工程感兴趣的人的学习。它不是一个明确的指南或课程,而是一个资源列表,随着时间的推移,可以通过社区的贡献进行改进。
数据工程英文书籍
英语 DE 设计模式
编程
基础知识
我们从理解编程和逻辑的基本概念开始。本部分可以在学习您选择的编程语言的同时进行开发。
- 课程:Platzi 基础编程
- 视频:算法和 TodoCode 编程简介
- 视频:TodoCode 伪代码练习
- 视频:Datademia 命令行
- 视频:Fazt 的 Bash 脚本
- 阅读:Linux 命令行和 Shell 简介,来自 Microsoft Learn
?编程语言
我建议从 Python 开始,因为它的学习曲线友好且在当今行业中很流行。然而,值得注意的是,数据处理也可以使用 R、Java、Scala、Julia 等来完成。
- 视频:Python from 0 by PildorasInformáticas
- 课程:FreeCodeCamp 的 Python 科学计算
- 课程:FreeCodeCamp 的 Python 大学代数
- 课程:哈佛 CS50 的 Python 编程简介,由 FreeCodeCamp 副标题
- 课程:来自 FreeCodeCamp 的中级 Python 副标题
- 课程:Kaggle Pandas
- 视频:Ada Lovecode 的正则表达式
- 视频:BettaTech 面向对象编程原理
- 视频:Absolute 借助 Minecraft 解释面向对象编程
- 课程:米格尔·拉兹 (Miguel Raz) 为匆忙的人准备的 Julia
Excel
使用 Git 进行版本控制
了解版本控制不仅在团队工作时很有价值,而且还使我们能够跟踪、理解和管理对项目所做的更改,从而保持高效和协作的开发。
- 视频:什么是版本控制以及为什么它对编程如此重要?通过数据德米亚
- 课程:MoureDev 的 Git 和 Github
- 视频:TodoCode 的 Git 和 Github
- 阅读:Attlasian 的《正确使用 Git》
- 游戏:学习 Git 分支
更多工具
- 笔记本:Google Collab、Jupyter 或 Deepnote
- 文本编辑器:VSCode、Spyder 或 Google IDX
数据库
基础知识
在这种情况下,是时候学习数据库了。尽管我个人推荐 PostgreSQL 用于结构化数据,而 MongoDB 用于非结构化数据,但选择使用的数据库管理器由您自行决定。然而,还有许多其他选择:MySQL、SQLite 等。
- 视频:TodoCode 数据库简介
- 阅读:TodoPostgreSQL的DDL、DML和DCL的区别
- 视频:存储过程#1,作者:Héctor de León
- 视频:存储过程#2,作者:Héctor de León
- 视频:Fazt 的 MongoDB
- 视频:MitoCode 的 MongoDB
SQL
您还将学习 SQL,一种用于管理和操作关系数据库的查询语言。
- 视频:来自拉丁美洲数据工程的 SQL
- Kaggle 的 SQL 简介
- Kaggle 高级 SQL
?设计
现在我们继续更高级的概念,这将帮助我们设计数据库、数据湖、数据仓库、模式等。
- 视频:何时使用 SQL,何时使用 NoSQL?作者:赫克托·德·莱昂
- 视频:NoSQL 数据库如何建模?来自你好世界
- 阅读:Oracle 面向图形的数据库
- 视频:图数据库、Datahack 基础知识和实践
大数据
接下来是了解大数据的一些概念。此外,无需深入钻研,获取有关人工智能、商业智能和数据分析的基础知识也是很有趣的。
基础知识
- 视频:面向 Datahack 傻瓜的大数据
- 阅读:大数据:它是什么以及它如何帮助我的业务?来自 Salesforce
- 认证:使用罗萨里奥大学的大数据设计和编程物联网解决方案
- 认证:加州大学圣地亚哥分校大数据
- 视频:大数据和 Databits 隐私
- 视频:智能数据数据治理
- 视频:软件大师如何在不超出预算的情况下开始数据治理
分析和数据探索
- 认证:数据分析专业基础知识,来自 Microsoft 和 LinkedIn
- 认证:Google数据分析专业证书
- 认证:IBM 数据分析师专业证书
- 课程:FreeCodeCamp 的 Python 数据分析
- 视频:讲故事:如何将您的内容变成故事?通过编码器屋
统计数据
?人工智能
- 课程:FreeCodeCamp 的 Python 机器学习
- 频道:LearnIA 与 Ligdi Gonzalez
- 视频:从 Dot CSV 学习人工智能
- 视频:如何在 Datalytics 数据工程中使用 ChatGPT
- 课程:人工智能,哥伦比亚大学副标题
?商业智能
- 视频:Google 商业智能证书,副标题为 Google Career
- 视频:适合所有人的商业智能!通过皮尔卡拉
数据可视化
数据处理
本节是数据工程的核心,我们将了解什么是数据管道、什么是 ETL、编排器等等。另外,我留下了一个关键概念的列表,我将在将来使用它们各自的资源进行更新,如果您有兴趣详细学习它们,您可以搜索存储库中上传的书籍。
- 频道:CodinEric
- 频道:拉丁美洲数据工程
- 频道:Datademia
- 渠道:数据分析
- 博客:开始(英文)
- DataWars学习平台
? ETL 和数据管道
- 视频:数据工程:RockingData 数据项目的核心之旅
- 视频:如何成为一名真正的数据工程师?通过数据位
- 视频:Rocio Chavez 用 Python 进行数据预处理
- 视频:R 中的数据预处理,作者:Rocio Chavez
- 视频:A/B 测试:来自 SantanDev 的数据,而非意见
- 增量负载
- 消息队列
- 计划任务表达式
❄️ 高级数据库
- 关系模型
- 维度模型
- 事实和维度
- 数据湖、数据集市、数据仓库和 Dataqube
- 基于列和基于行的布局
- 星型和雪花型方案
- 关于读取和写入方案
?协调者
- 视频:来自 Data Engineering LATAM 的 Airflow
- 视频:使用 Apache Airflow 自动化创意 - Software Guru 的 Yesi Díaz
- 视频:LEARNING-BI 的 Pentaho Spoon
- 视频:Luigi,西雅图数据专家字幕
- 阅读:微软的 Azure 数据工厂
?架构
- 批量数据处理
- 实时处理或流式处理
- Lambda 和 kappa 架构
- 阅读:AWS OLAP 和 OLTP 之间的主要区别
- 视频:使用 Databits Spark 批量和流式构建 ETL
- 阅读:Atlassian 虚拟机和容器比较
- 视频:剥皮书呆子的码头工人
- 视频:Kubernetes,作者:Pelado Nerd
- 正在阅读:什么是分布式系统?通过 Atlassian
- 视频:来自拉丁美洲数据工程的 Spark
- 视频:Spark Mexico 数据工程的基础设施即代码
- 视频:NullSafe Architect 的 Apache Spark
- 视频:NullSafe 架构师的 Apache Kafka
?测试
- 视频:远大前程:CodingEric 在 PyConAr 2020 上像专业人士一样验证数据管道
- 视频:Patricio Miner 在 #QSConf 2023 上使用 Python 进行 ETL 测试及其自动化
云
了解云计算知识很有用。在这一点上,我建议考虑准备官方认证。尽管这些考试通常需要付费,但您可以从业内最著名的提供商那里找到免费的官方准备资源。
☁️ 云基础知识
- 视频:Datahack 云计算基础知识
- 阅读:发现 Platzi 云的优点和缺点
- 阅读:Platzi 的云中大数据架构
官方认证
- 谷歌云数据工程
- 视频:学习大数据的 Google Cloud (GCP)
- 微软Azure数据工程
- 视频:拉丁美洲数据工程 Azure
- 视频:学习大数据的 Azure 认证
- 使用 Microsoft Azure Fabric 进行数据工程
- AWS 数据工程
职位搜索
最后,我给您留下一些阅读材料和视频,提供与系统领域求职相关的建议和经验。稍后,将添加与该主题相关的技术挑战和其他资源。
?尖端
- 视频:如何获得数据工程领域的第一份工作?从墨西哥火花
- 视频:TodoCode IT 世界的工作技巧
- 视频:进入 Maxi Program 系统的必备要素
- 主题:填写 @natayadev 的 LinkedIn 个人资料的提示
- 主题:@natayadev 提供的有关获得 IT 远程工作的提示
- 主题:如何创建简洁易读的简历,作者:@iamdoomling
- 主题:我给你留下了这些在人力资源面试中生存的技巧,来自 @iamdoomling
- 视频:在公司、初创公司或自由职业者中编程哪个更好?通过@iamdoomling
- 视频:我完成了编程训练营,现在做什么?通过@iamdoomling
- 视频:来自阿根廷的承包商@iamdoomling
- 播客:Jonatan Ariste 的 DevRock
技术挑战
- (2023) 存储库:MoureDev 社区代码挑战
- (2024) 存储库:MoureDev 社区编程挑战路线图
进行中 ?
如果您觉得这个存储库有用,请给我一个星星