แผนงานปี 2024 - วิศวกรรมข้อมูลเป็นภาษาสเปน
อีกหนึ่งพื้นที่เก็บข้อมูลที่มีแนวคิดพื้นฐาน ความท้าทายทางเทคนิค และทรัพยากรเกี่ยวกับวิศวกรรมข้อมูลในภาษาสเปน?
คุณต้องการสนับสนุนพื้นที่เก็บข้อมูลหรือไม่? เยี่ยมชมคู่มือการมีส่วนร่วม
หมายเหตุ: เส้นทางการเรียนรู้ต่อไปนี้ได้รับการออกแบบตาม ดุลยพินิจส่วนบุคคล โดยมีแนวคิดในการอำนวยความสะดวกในการศึกษาของผู้ที่สนใจด้านวิศวกรรมข้อมูลด้วยสื่อภาษาสเปนฟรีที่ฉันพบบนอินเทอร์เน็ต ไม่ใช่ แนวทางหรือหลักสูตรที่ชัดเจน แต่เป็น รายการทรัพยากรที่สามารถปรับปรุงได้เมื่อเวลาผ่านไปด้วยการสนับสนุนจากชุมชน
หนังสือวิศวกรรมข้อมูลเป็นภาษาอังกฤษ
รูปแบบการออกแบบสำหรับ DE เป็นภาษาอังกฤษ
การเขียนโปรแกรม
พื้นฐาน
เราเริ่มต้นด้วยการทำความเข้าใจแนวคิดพื้นฐานของการเขียนโปรแกรมและตรรกะ ส่วนนี้สามารถพัฒนาไปพร้อมกับการเรียนรู้ภาษาการเขียนโปรแกรมที่คุณเลือก
- หลักสูตร: การเขียนโปรแกรมพื้นฐานของ Platzi
- วิดีโอ: ข้อมูลเบื้องต้นเกี่ยวกับอัลกอริทึมและการเขียนโปรแกรม TodoCode
- วิดีโอ: แบบฝึกหัด TodoCode Pseudocode
- วิดีโอ: บรรทัดคำสั่ง Datademia
- วิดีโอ: Bash scripting โดย Fazt
- การอ่าน: ข้อมูลเบื้องต้นเกี่ยวกับ Linux Command Line และ Shell จาก Microsoft Learn
- ภาษาโปรแกรม
ฉันขอแนะนำให้เริ่มต้นด้วย Python เนื่องจากมีช่วงการเรียนรู้ที่เป็นมิตรและความแพร่หลายในอุตสาหกรรมปัจจุบัน อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบว่าการประมวลผลข้อมูลสามารถทำได้ด้วย R, Java, Scala, Julia และอื่นๆ
- วิดีโอ: Python จาก 0 โดย PildorasInformáticas
- หลักสูตร: คอมพิวเตอร์เชิงวิทยาศาสตร์ด้วย Python จาก FreeCodeCamp
- หลักสูตร: พีชคณิตวิทยาลัยด้วย Python จาก FreeCodeCamp
- หลักสูตร: บทนำเกี่ยวกับการเขียนโปรแกรมด้วย Python ของ Harvard CS50 บรรยายโดย FreeCodeCamp
- หลักสูตร: คำบรรยาย Intermediate Python จาก FreeCodeCamp
- หลักสูตร: Kaggle Pandas
- วิดีโอ: นิพจน์ทั่วไปโดย Ada Lovecode
- วิดีโอ: หลักการเขียนโปรแกรมเชิงวัตถุของ BettaTech
- วิดีโอ: การเขียนโปรแกรมเชิงวัตถุอธิบายด้วย Minecraft โดย Absolute
- หลักสูตร: Julia สำหรับคนรีบร้อน โดย Miguel Raz
เอ็กเซล
การควบคุมเวอร์ชันด้วย Git
การเรียนรู้เกี่ยวกับการควบคุมเวอร์ชันไม่เพียงมีประโยชน์เมื่อทำงานเป็นทีมเท่านั้น แต่ยังช่วยให้เราสามารถติดตาม ทำความเข้าใจ และจัดการการเปลี่ยนแปลงที่เกิดขึ้นกับโครงการของเรา และด้วยเหตุนี้จึงรักษาการพัฒนาที่มีประสิทธิภาพและการทำงานร่วมกัน
- วิดีโอ: การควบคุมเวอร์ชันคืออะไร และเหตุใดจึงสำคัญสำหรับการเขียนโปรแกรม โดย Datademia
- หลักสูตร: Git และ Github โดย MoureDev
- วิดีโอ: Git และ Github โดย TodoCode
- การอ่าน: ใช้ Git อย่างถูกต้องโดย Attlasian
- เกม: เรียนรู้ Git Branching
เครื่องมือเพิ่มเติม
- สมุดบันทึก: Google Collab, Jupyter หรือ Deepnote
- โปรแกรมแก้ไขข้อความ: VSCode, Spyder หรือ Google IDX
ฐานข้อมูล
พื้นฐาน
ในกรณีนี้ถึงเวลาที่ต้องเรียนรู้เกี่ยวกับฐานข้อมูล ตัวเลือกตัวจัดการฐานข้อมูลที่จะใช้นั้นขึ้นอยู่กับดุลยพินิจของคุณ แม้ว่าฉันจะแนะนำ PostgreSQL สำหรับข้อมูลที่มีโครงสร้างและ MongoDB สำหรับข้อมูลที่ไม่มีโครงสร้างเป็นการส่วนตัวก็ตาม อย่างไรก็ตาม มีตัวเลือกอื่นๆ มากมาย: MySQL, SQLite และอื่นๆ
- วิดีโอ: ข้อมูลเบื้องต้นเกี่ยวกับฐานข้อมูล TodoCode
- การอ่าน: ความแตกต่างระหว่าง DDL, DML และ DCL ของ TodoPostgreSQL
- วิดีโอ: Stored Procedures #1 โดย Héctor de Leon
- วิดีโอ: Stored Procedures #2 โดย Héctor de Leon
- วิดีโอ: MongoDB โดย Fazt
- วิดีโอ: MongoDB โดย MitoCode
SQL
นอกจากนี้คุณยังจะได้เรียนรู้ SQL ซึ่งเป็นภาษาคิวรีสำหรับการจัดการและจัดการฐานข้อมูลเชิงสัมพันธ์
- วิดีโอ: SQL จาก Data Engineering LATAM
- ข้อมูลเบื้องต้นเกี่ยวกับ SQL โดย Kaggle
- Kaggle ขั้นสูง SQL
- ออกแบบ
ตอนนี้เราดำเนินการต่อด้วยแนวคิดขั้นสูงเพิ่มเติมที่จะช่วยเราออกแบบฐานข้อมูล Data Lake คลังข้อมูล สคีมา ฯลฯ
- วิดีโอ: เมื่อใดจึงควรใช้ SQL และเมื่อใดจึงควรใช้ NoSQL โดย เฮกเตอร์ เด เลออน
- วิดีโอ: ฐานข้อมูล NoSQL มีการสร้างแบบจำลองอย่างไร จากเฮลโลเวิลด์
- การอ่าน: ฐานข้อมูลเชิงกราฟของ Oracle
- วิดีโอ: ฐานข้อมูลกราฟ ข้อมูลพื้นฐานและแนวทางปฏิบัติของ Datahack
ข้อมูลขนาดใหญ่
สิ่งต่อไปคือการทำความเข้าใจแนวคิดบางประการของ Big Data นอกจากนี้ยังเป็นเรื่องที่น่าสนใจที่จะได้รับความรู้พื้นฐานเกี่ยวกับปัญญาประดิษฐ์ ระบบธุรกิจอัจฉริยะ และการวิเคราะห์ข้อมูลโดยไม่จำเป็นต้องเจาะลึกเกินไป
พื้นฐาน
- วิดีโอ: Big Data สำหรับ Datahack Dummies
- การอ่าน: Big Data: คืออะไร และช่วยธุรกิจของฉันได้อย่างไร จากเซลส์ฟอร์ซ
- การรับรอง: ออกแบบและตั้งโปรแกรมโซลูชัน IoT ด้วยการใช้ Big Data จาก Universidad del Rosario
- การรับรอง: Big Data จากมหาวิทยาลัยแคลิฟอร์เนียซานดิเอโก
- วิดีโอ: ความเป็นส่วนตัวของข้อมูลขนาดใหญ่และ Databits
- วิดีโอ: การกำกับดูแลข้อมูลข้อมูลอัจฉริยะ
- วิดีโอ: วิธีเริ่มต้นใช้งานการกำกับดูแลข้อมูลโดยไม่ทำลายงบประมาณโดย Software Guru
การวิเคราะห์และการสำรวจข้อมูล
- การรับรอง: Professional Fundamentals of Data Analytics จาก Microsoft และ LinkedIn
- การรับรอง: ใบรับรองผู้เชี่ยวชาญด้านการวิเคราะห์ข้อมูลของ Google
- การรับรอง: ใบรับรอง IBM Data Analyst Professional
- หลักสูตร: การวิเคราะห์ข้อมูลด้วย Python จาก FreeCodeCamp
- วิดีโอ: การเล่าเรื่อง: จะเปลี่ยนเนื้อหาของคุณให้เป็นเรื่องราวได้อย่างไร โดย Coderhouse
สถิติ
- ปัญญาประดิษฐ์
- หลักสูตร: Machine Learning ด้วย Python จาก FreeCodeCamp
- ช่อง: LearnIA กับ Ligdi Gonzalez
- วิดีโอ: เรียนรู้ปัญญาประดิษฐ์จาก Dot CSV
- วิดีโอ: วิธีใช้ ChatGPT ในงานวิศวกรรมข้อมูล Datalytics
- หลักสูตร: ปัญญาประดิษฐ์ บรรยายจากมหาวิทยาลัยโคลัมเบีย
- ระบบธุรกิจอัจฉริยะ
- วิดีโอ: ใบรับรอง Google Business Intelligence มีคำบรรยายจาก Google Career
- วิดีโอ: ระบบธุรกิจอัจฉริยะสำหรับทุกคน! โดย PEALCALA
ดาต้าวิซ
การประมวลผลข้อมูล
ในส่วนนี้คือหัวใจสำคัญของวิศวกรรมข้อมูล เราจะมาดูว่าไปป์ไลน์ข้อมูลคืออะไร ETL คืออะไร ผู้เรียบเรียง และอื่นๆ อีกมากมาย นอกจากนี้ ฉันทิ้งรายการแนวคิดหลักที่ฉันจะอัปเดตพร้อมกับแหล่งข้อมูลที่เกี่ยวข้องในอนาคต หากคุณสนใจที่จะเรียนรู้แนวคิดเหล่านี้โดยละเอียด คุณสามารถค้นหาหนังสือที่อัปโหลดในพื้นที่เก็บข้อมูลได้
- ช่อง: CodenEric
- Channel: วิศวกรรมข้อมูล LATAM
- ช่อง : ดาต้าดีเมีย
- ช่องทาง: Datalytics
- บล็อก: เริ่มต้น (ภาษาอังกฤษ)
- แพลตฟอร์มการเรียนรู้ DataWars
- ETL และไปป์ไลน์ข้อมูล
- วิดีโอ: วิศวกรรมข้อมูล: การเดินทางสู่หัวใจของโครงการข้อมูล RockingData
- วิดีโอ: จะเป็น Data Engineer ได้อย่างไร โดย Databits
- วิดีโอ: การประมวลผลข้อมูลล่วงหน้าใน Python โดย Rocio Chavez
- วิดีโอ: การประมวลผลข้อมูลล่วงหน้าใน R โดย Rocio Chavez
- วิดีโอ: การทดสอบ A/B: ข้อมูล ไม่ใช่ความคิดเห็นจาก SantanDev
- โหลดที่เพิ่มขึ้น
- คิวการส่งข้อความ
- นิพจน์ครอน
❄️ฐานข้อมูลขั้นสูง
- โมเดลเชิงสัมพันธ์
- โมเดลมิติ
- ข้อเท็จจริงและมิติข้อมูล
- Datalake, Datamart, Datawarehouse และ Dataqube
- เค้าโครงตามคอลัมน์และตามแถว
- แผนการดาวและเกล็ดหิมะ
- ในรูปแบบการอ่านและการเขียน
- ออร์เคสตรา
- วิดีโอ: การไหลเวียนของอากาศจาก Data Engineering LATAM
- วิดีโอ: การทำให้แนวคิดเป็นแบบอัตโนมัติด้วย Apache Airflow - Yesi Díaz จาก Software Guru
- วิดีโอ: Pentaho Spoon โดย LEARNING-BI
- วิดีโอ: Luigi มีคำบรรยายโดย Seattle Data Guy
- การอ่าน: Azure Data Factory ของ Microsoft
- สถาปัตยกรรม
- การประมวลผลข้อมูลเป็นชุด
- การประมวลผลหรือการสตรีมแบบเรียลไทม์
- สถาปัตยกรรมแลมบ์ดาและคัปปา
- การอ่าน: ความแตกต่างที่สำคัญระหว่าง AWS OLAP และ OLTP
- วิดีโอ: สร้าง ETL เป็นกลุ่มและสตรีมด้วย Databits Spark
- การอ่าน: การเปรียบเทียบเครื่องเสมือน Atlassian และคอนเทนเนอร์
- วิดีโอ: Peeling Nerd's Docker
- วิดีโอ: Kubernetes โดย Pelado Nerd
- การอ่าน: ระบบแบบกระจายคืออะไร? โดย Atlassian
- วิดีโอ: Spark จาก Data Engineering LATAM
- วิดีโอ: โครงสร้างพื้นฐานเป็นโค้ดสำหรับวิศวกรรมข้อมูล Spark Mexico
- วิดีโอ: Apache Spark โดย NullSafe Architect
- วิดีโอ: Apache Kafka โดย NullSafe Architect
- การทดสอบ
- วิดีโอ: ความคาดหวังที่ยอดเยี่ยม: ตรวจสอบ Data Pipelines อย่างมืออาชีพโดย CodingEric ที่ PyConAr 2020
- วิดีโอ: การทดสอบ ETL และระบบอัตโนมัติด้วย Python โดย Patricio Miner ที่ #QSConf 2023
คลาวด์
การมีความรู้เกี่ยวกับคลาวด์คอมพิวติ้งจะมีประโยชน์ ณ จุดนี้ ผมขอแนะนำให้พิจารณาเตรียมการรับรองอย่างเป็นทางการ แม้ว่าการสอบเหล่านี้มักจะมีค่าใช้จ่าย แต่คุณสามารถค้นหาแหล่งข้อมูลการเตรียมตัวอย่างเป็นทางการได้ฟรีจากผู้ให้บริการที่มีชื่อเสียงที่สุดในอุตสาหกรรม
☁️ พื้นฐานคลาวด์
- วิดีโอ: พื้นฐานการประมวลผลบนคลาวด์ของ Datahack
- การอ่าน: ค้นพบข้อดีและข้อเสียของระบบคลาวด์ Platzi
- การอ่าน: สถาปัตยกรรมสำหรับข้อมูลขนาดใหญ่ในระบบคลาวด์ โดย Platzi
การรับรองอย่างเป็นทางการ
- วิศวกรรมข้อมูล Google Cloud
- วิดีโอ: Google Cloud (GCP) จากการเรียนรู้ข้อมูลขนาดใหญ่
- วิศวกรรมข้อมูล Microsoft Azure
- วิดีโอ: Azure โดย Data Engineering LATAM
- วิดีโอ: การรับรอง Azure จากการเรียนรู้ข้อมูลขนาดใหญ่
- วิศวกรรมข้อมูลด้วย Microsoft Azure Fabric
- วิศวกรรมข้อมูล AWS
- วิดีโอ: AWS จาก Data Engineering LATAM
ค้นหางาน
สุดท้ายนี้ ฉันจะฝากการอ่านและวิดีโอที่ให้คำแนะนำและประสบการณ์เกี่ยวกับการหางานในสาขาระบบไว้ให้คุณ หลังจากนั้น ความท้าทายด้านเทคนิคและทรัพยากรอื่นๆ ที่เกี่ยวข้องกับหัวข้อนี้จะถูกเพิ่มเข้ามา
- เคล็ดลับ
- วิดีโอ: คุณจะได้งานแรกในด้านวิศวกรรมข้อมูลได้อย่างไร จากสปาร์ค เม็กซิโก
- วิดีโอ: เคล็ดลับการทำงานสำหรับโลกไอทีของ TodoCode
- วิดีโอ: จำเป็นสำหรับการเริ่มต้นในโลกของระบบ Maxi Program
- หัวข้อ: เคล็ดลับในการกรอกโปรไฟล์ LinkedIn ของ @natayadev
- Thread: คำแนะนำในการรับงานระยะไกลด้านไอทีจาก @natayadev
- Thread: วิธีสร้าง CV ที่เรียบร้อยและอ่านง่ายโดย @iamdoomling
- หัวข้อ: ฉันฝากเคล็ดลับเหล่านี้ไว้ให้คุณเพื่อความอยู่รอดเมื่อถูกสัมภาษณ์กับฝ่ายทรัพยากรบุคคลจาก @iamdoomling
- วิดีโอ: การเขียนโปรแกรมในบริษัท สตาร์ทอัพ หรือฟรีแลนซ์ อะไรดีกว่ากัน โดย @iamdoomling
- วิดีโอ: ฉันเขียนโปรแกรม Bootcamp เสร็จแล้ว แล้วไงต่อ? โดย @iamdoomling
- วิดีโอ: ทำงานเป็นผู้รับเหมาจากอาร์เจนตินาโดย @iamdoomling
- พอดคาสต์: DevRock โดย Jonatan Ariste
ความท้าทายทางเทคนิค
- (2023) พื้นที่เก็บข้อมูล: ความท้าทายด้านรหัสชุมชน MoureDev
- (2024) พื้นที่เก็บข้อมูล: แผนงานความท้าทายในการเขียนโปรแกรมชุมชน MoureDev
อยู่ระหว่างดำเนินการ ?
หากคุณพบว่าพื้นที่เก็บข้อมูลนี้มีประโยชน์ ให้ดาวฉันด้วย