学习
我正在学习的事情的运行日志,以建立强大的核心软件工程技能,同时每天也扩展我对相邻技术的知识。
更新:每月一次 |当前焦点:生成人工智能
核心技能
Python编程
资源 | 进步 |
---|
Datacamp:编写高效的 Python 代码 | ✅ |
Datacamp:用 Python 编写函数 | ✅ |
Datacamp:Python 中的面向对象编程 | ✅ |
Datacamp:Python 中级面向对象编程 | ✅ |
Datacamp:在 Python 中导入数据(第 1 部分) | ✅ |
Datacamp:在 Python 中导入数据(第 2 部分) | ✅ |
Datacamp:数据科学中级 Python | ✅ |
Datacamp:Python 数据科学工具箱(第 1 部分) | ✅ |
Datacamp:Python 数据科学工具箱(第 2 部分) | ✅ |
Datacamp:开发 Python 包 | ✅ |
数据营:Conda Essentials | ✅ |
YouTube:教程:Sebastian Witowski - 现代 Python 开发人员工具包 | ✅ |
Datacamp:在 Python 中使用日期和时间 | ✅ |
Datacamp:Python 命令行自动化 | ⬜ |
Datacamp:Python 中的数据科学单元测试 | ✅ |
书籍:Python 201 | ⬜ |
书籍:编写惯用的 Python 3 | ⬜ |
书籍:使用 Python 进行测试驱动开发 | ⬜ |
文章:Python 的许多命令行实用程序 | ⬜ |
文章:程序员的 Unicode 简介 | ⬜ |
文章:Python 内存分析简介 | ✅ |
文章:使用 memory_profiler 分析 Python 代码 | ✅ |
文章:如何使用“memory_profiler”来分析 Python 代码的内存使用情况? | ✅ |
数据结构和算法
资源 | 进步 |
---|
书:摸索算法 | ✅ |
书:《技术简历由内而外》 | ✅ |
Neetcode:适合初学者的算法和数据结构 | ✅ |
Udacity:数据结构和算法简介 | ✅ |
Linux 与命令行
资源 | 进步 |
---|
Datacamp:数据科学 Shell 简介 | ✅ |
Datacamp:Bash 脚本简介 | ✅ |
Datacamp:Shell 中的数据处理 | ✅ |
麻省理工学院:失踪的学期 | ✅ |
Udacity:Linux 命令行基础知识 | ✅ |
Udacity:Shell 研讨会 | ✅ |
Udacity:配置 Linux Web 服务器 | ✅ |
版本控制
资源 | 进步 |
---|
Udacity:使用 Git 进行版本控制 | ✅ |
Datacamp:Git 数据科学简介 | ✅ |
Udacity:GitHub 与协作 | ✅ |
Udacity:如何使用 Git 和 GitHub | ✅ |
数据库
资源 | 进步 |
---|
Udacity:关系数据库简介 | ✅ |
Udacity:数据库系统概念与设计 | ⬜ |
Datacamp:数据库设计 | ⬜ |
Datacamp:Python 数据库简介 | ⬜ |
Datacamp:数据科学 SQL 简介 | ✅ |
Datacamp:中级 SQL | ⬜ |
Datacamp:在 PostgreSQL 中连接数据 | ⬜ |
Udacity:用于数据分析的 SQL | ⬜ |
Datacamp:SQL 中的探索性数据分析 | ⬜ |
Datacamp:将 SQL 应用于实际问题 | ⬜ |
Datacamp:使用 SQL 分析业务数据 | ⬜ |
Datacamp:使用 SQL 进行报告 | ⬜ |
Datacamp:SQL 中的数据驱动决策 | ⬜ |
Datacamp:NoSQL 概念 | ⬜ |
Datacamp:Python 中的 MongoDB 简介 | ⬜ |
后端工程
资源 | 进步 |
---|
Udacity:身份验证和授权:OAuth | ⬜ |
Udacity:HTTP 和 Web 服务器 | ⬜ |
Udacity:客户端-服务器通信 | ⬜ |
Udacity:设计 RESTful API | ⬜ |
Datacamp:Python API 简介 | ⬜ |
Udacity:Web 开发人员网络 | ⬜ |
生产系统设计
资源 | 进步 |
---|
书籍:设计机器学习系统 | ✅ |
Neetcode:初学者系统设计 | ✅ |
Neetcode:系统设计面试 | ✅ |
Datacamp:Python 中的客户分析和 A/B 测试 | ✅ |
Datacamp:Python 中的 A/B 测试 | ⬜ |
Udacity:A/B 测试 | ⬜ |
Datacamp:MLOps 概念 | ✅ |
Datacamp:机器学习监控概念 | ✅ |
数学
资源 | 进步 |
---|
Datacamp:Python 概率基础 | ✅ |
Datacamp:统计学简介 | ✅ |
Datacamp:Python 统计简介 | ✅ |
Datacamp:Python 中的假设检验 | ✅ |
Datacamp:Python 中的统计思维(第 1 部分) | ✅ |
Datacamp:Python 中的统计思维(第 2 部分) | ✅ |
Datacamp:Python 实验设计 | ✅ |
Datacamp:用 Python 练习统计面试问题 | ⬜ |
edX:使用 Excel 进行数据分析的基本统计 | ✅ |
Udacity:推论统计简介 | ✅ |
麻省理工学院 18.06 线性代数,2005 年春季 | ✅ |
Udacity:特征向量和特征值 | ✅ |
Udacity:线性代数复习 | ⬜ |
YouTube:线性代数的本质 | ⬜ |
前端基础知识
超文本标记语言
资源 | 进步 |
---|
Codecademy:学习 HTML | ✅ |
Codecademy:制作一个网站 | ✅ |
文章:替代文本 | ⬜ |
CSS
资源 | 进步 |
---|
Pluralsight:CSS 定位 | ✅ |
Pluralsight:CSS 简介 | ✅ |
Pluralsight:CSS:特异性、盒子模型和最佳实践 | ✅ |
Pluralsight:CSS:使用 Flexbox 进行布局 | ✅ |
代码学校:用 Bootstrap 进行爆炸 | ✅ |
Pluralsight:用户体验基础知识 | ✅ |
Codecademy:学习 SASS | ✅ |
面向 Javascript 开发人员的 CSS | ✅ |
文章:在 Figma 设计中创建插图 | ✅ |
书籍:重构 UI | ⬜ |
Youtube:如何让你的网站不难看:程序员的基本用户体验 | ⬜ |
JavaScript
资源 | 进步 |
---|
Udacity:ES6 - JavaScript 改进 | ✅ |
Udacity:Javascript 简介 | ✅ |
Udacity:面向对象 JS 1 | ✅ |
Udacity:面向对象 JS 2 | ✅ |
Udemy:理解 Typescript | ✅ |
Codecademy:学习 JavaScript | ✅ |
Codecademy:Jquery 轨道 | ✅ |
Pluralsight:使用 Chrome 开发者工具 | ✅ |
专业主题
机器学习
资源 | 进步 |
---|
文章:梯度下降优化算法概述 | ✅ |
书籍:使用 Scikit-Learn、Keras 和 TensorFlow 进行机器学习实践,第二版 | ⬜ |
书籍:机器学习入门 | ✅ |
书籍:制作你自己的神经网络 | ✅ |
书:Grokking 机器学习 | ✅ |
书:《StatQuest 机器学习图解指南》 | ✅ |
Fast.ai:编码器实用深度学习(第 1 部分) | ✅ |
Fast.ai:编码器实用深度学习(第 2 部分) | ⬜ |
Datacamp:Python 中的集成方法 | ✅ |
Datacamp:使用 XGBoost 进行极端梯度提升 | ⬜ |
Datacamp:使用 SciPy 进行聚类方法 | ✅ |
Datacamp:Python 中的无监督学习 | ✅ |
Udacity:细分和聚类 | ✅ |
Datacamp:用于数据科学的 Python 简介 | ✅ |
edX:在 Azure HDInsight 中使用 Spark 实施预测分析 | ✅ |
Datacamp:使用 scikit-learn 进行监督学习 | ✅ |
Datacamp:Python 中基于树的模型的机器学习 | ✅ |
Datacamp:Python 中的线性分类器 | ✅ |
Datacamp:用于图像处理的卷积神经网络 | ✅ |
Datacamp:Python 中的模型验证 | ✅ |
Datacamp:Python 中的超参数调优 | ✅ |
Datacamp:Python 中的人力资源分析:预测员工流失 | ✅ |
Datacamp:用 Python 预测客户流失 | ✅ |
Datacamp:Python 降维 | ✅ |
Datacamp:Python 机器学习的预处理 | ✅ |
Datacamp:数据科学的数据类型 | ✅ |
Datacamp:用 Python 清理数据 | ✅ |
Datacamp:Python 机器学习的特征工程 | ✅ |
Datacamp:使用 Python 中的机器学习预测点击率 | ✅ |
Datacamp:使用 Python 介绍金融概念 | ✅ |
Datacamp:Python 中的欺诈检测 | ✅ |
Karpathy:神经网络:从零到英雄 | ✅ |
文章:神经网络中的权重初始化:从基础到凯明的旅程 | ⬜ |
自然语言处理
资源 | 进步 |
---|
书籍:使用 Transformers 进行自然语言处理 | ✅ |
斯坦福 CS224U:自然语言理解 | 2019年春季 | ✅ |
斯坦福 CS224N:斯坦福 CS224N:NLP 与深度学习 | 2019年冬季 | ✅ |
CMU:2020 年低资源 NLP 训练营 | ✅ |
CMU 多语言 NLP 2020 | ✅ |
Datacamp:Python 中的 NLP 特征工程 | ✅ |
Datacamp:Python 自然语言处理基础知识 | ✅ |
Datacamp:Python 中的正则表达式 | ✅ |
Datacamp:用于语言建模的 RNN | ✅ |
Datacamp:Python 自然语言生成 | ✅ |
Datacamp:用 Python 构建聊天机器人 | ✅ |
Datacamp:Python 中的情感分析 | ✅ |
Datacamp:Python 机器翻译 | ✅ |
文章:搭配的不合理效果 | ⬜ |
文章:FuzzyWuzzy:Python 中的模糊字符串匹配 | ✅ |
文章:曼巴解释 | ⬜ |
文章:Mamba 和状态空间模型的视觉指南 | ⬜ |
文章:拥抱面的量化基础知识 | ✅ |
生成式人工智能
法学硕士理论
资源 | 进步 |
---|
文章:SolidGoldMagikarp(加,提示生成) | ⬜ |
DeepLearning.AI:法学硕士预训练 | ✅ |
DeepLearning.AI:扩散模型如何工作 | ⬜ |
Karpathy:大型语言模型简介 [ 1hr ] | ✅ |
Karpathy:让我们构建 GPT Tokenizer [ 2hr13m ] | ✅ |
Karpathy:让我们重现 GPT-2 (124M) [ 4hr1m ] | ⬜ |
Youtube:语言模型黑客指南 [ 1hr30m ] | ✅ |
YouTube:与 Finbarr Timbers 合作 5 年 GPT | ⬜ |
文章:文本生成采样 | ⬜ |
DeepLearning.AI:根据人类反馈进行强化学习 | ✅ |
Youtube:LLaMA 解释:KV-Cache、旋转位置嵌入、RMS Norm、分组查询注意力、SwiGLU [ 1h10m ] | ⬜ |
信息检索/RAG
资源 | 进步 |
---|
用于搜索的预训练 Transformer 语言模型 - 第 1 部分 | ⬜ |
用于搜索的预训练 Transformer 语言模型 - 第 2 部分 | ⬜ |
用于搜索的预训练 Transformer 语言模型 - 第 3 部分 | ⬜ |
用于搜索的预训练 Transformer 语言模型 - 第 4 部分 | ⬜ |
了解LanceDB的IVF-PQ索引 | ⬜ |
一点池化对于多向量表示有很大帮助 | ✅ |
全栈检索课程 | |
文章:复杂程度:RAG 应用程序 | ✅ |
文章:系统地改进您的 RAG | ⬜ |
文章:停止使用 LGTM@Few 作为指标(更好的 RAG) | ⬜ |
文章:RAG 搜索的唾手可得的成果 | ⬜ |
文章:人工智能工程师应该了解哪些关于搜索的知识 | ✅ |
文章:评估检索分块策略 | ⬜ |
文章:句子嵌入。句子嵌入简介 | ⬜ |
DeepLearning.AI:构建和评估高级 RAG 应用程序 | ✅ |
DeepLearning.AI:矢量数据库:从嵌入到应用程序 | ✅ |
DeepLearning.AI:使用 Chroma 进行 AI 高级检索 | ✅ |
DeepLearning.AI:快速压缩和查询优化 | ✅ |
DeepLearning.AI:具有语义搜索的大型语言模型 [ 1hr ] | ✅ |
DeepLearning.AI:使用矢量数据库构建应用程序 | ✅ |
DeepLearning.AI:构建多模态搜索和 RAG | ⬜ |
DeepLearning.AI:RAG 的知识图 | ⬜ |
DeepLearning.AI:LangChain 的功能、工具和代理 | ⬜ |
DeepLearning.AI:使用 LlamaIndex 构建代理 RAG | ⬜ |
DeepLearning.AI:带有crewAI的多人工智能代理系统 | ⬜ |
DeepLearning.AI:使用 AutoGen 的 AI 代理设计模式 | ⬜ |
DeepLearning.AI:LangGraph 中的 AI 代理 | ⬜ |
DeepLearning.AI:构建您自己的数据库代理 | ⬜ |
DeepLearning.AI:为 LLM 应用程序预处理非结构化数据 | ⬜ |
DeepLearning.AI:嵌入模型:从架构到实现 | ✅ |
Pinecone:为忙碌的工程师提供生产中的矢量数据库 | ⬜ |
松果:检索增强生成 | ⬜ |
松果:浪链AI手册 | ⬜ |
Pinecone:图像搜索的嵌入方法 | ⬜ |
松果:费斯:失踪的手册 | ⬜ |
松果:野外矢量搜索 | ⬜ |
Pinecone:用于语义搜索的自然语言处理 | ⬜ |
Youtube:系统地改进 RAG 应用程序 | ✅ |
Youtube:RAG 与 Jo Bergum 回归基础 | ✅ |
Youtube:超越检索基础以增强一代(与 Ben Clavié 合作) | ✅ |
YouTube:RAG 从头开始 | 0/14 |
文章:LambdaMART 深入研究 | ⬜ |
文章:带轮廓的引导生成 | ✅ |
及时工程
资源 | 进步 |
---|
文章:OpenAI 提示工程 | ⬜ |
文章:提示基础知识以及如何有效应用它们 | ✅ |
人择课程 | ⬜ |
文章:即时工程(翁丽亮) | ✅ |
文章:Prompt Engineering 201:先进方法和工具包 | ✅ |
文章:优化法学硕士的准确性 | ✅ |
文章:入门知识 • 快速工程 | ⬜ |
文章:Anyscale 端点:JSON 模式和函数调用功能 | ⬜ |
文章:使用大型语言模型引导文本生成 | ⬜ |
文章:GPT-4 视觉替代方案 | ⬜ |
DeepLearning.AI:ChatGPT 为开发人员提供提示工程 | ⬜ |
DeepLearning.AI:视觉模型的快速工程 | ⬜ |
DeepLearning.AI:使用 Llama 2 和 3 进行快速工程 | ⬜ |
Wandb:法学硕士工程:结构化输出 | ⬜ |
DeepLearning.AI:使用法学硕士进行函数调用和数据提取 | ⬜ |
系列: 即时注射 | ⬜ |
Youtube:快速工程概述 [ 1hr4m ] | ✅ |
Youtube:法学硕士的结构化生成 | ⬜ |
LLMOps
资源 | 进步 |
---|
文章:构建基于法学硕士的系统和产品的模式 | ✅ |
文章:LLM 应用程序的新兴架构 | ✅ |
文章:如何让法学硕士取得快速进展 | ⬜ |
文章:在快车道上!推测性解码 - 模型大 10 倍,无需额外成本 | ⬜ |
文章:协调多 GPU:LLM 推理的高效扩展 | ⬜ |
文章:多查询注意力就是你所需要的 | ⬜ |
文章:Transformers 推理优化工具集 | ⬜ |
DeepLearning.AI:高效服务法学硕士 | ✅ |
DeepLearning.AI:LLMOps 的自动化测试 | ✅ |
DeepLearning.AI:红队法学硕士申请 | ✅ |
DeepLearning.AI:使用权重和偏差评估和调试生成式 AI 模型 | ⬜ |
DeepLearning.AI:法学硕士申请的质量和安全 | ⬜ |
深度学习.AI:LLMOps | ⬜ |
DeepLearning.AI:使用 Amazon Bedrock 的无服务器 LLM 应用程序 | ⬜ |
DeepLearning.AI:深度量化 | ⬜ |
DeepLearning.AI:设备端人工智能简介 | ⬜ |
文章:量化可视化指南 | ⬜ |
文章:QLoRA 和 4 位量化 | ⬜ |
文章:通过交互式可视化了解 AI/LLM 量化 | ⬜ |
文章:LLM 推理系列:3. KV 缓存解释 | ⬜ |
文章:LLM 推理系列:4. KV 缓存,更深入的了解 | ⬜ |
文章:LLM 推理系列:5. 剖析模型性能 | ⬜ |
Youtube:SBTB 2023:Charles Frye,并行处理器:法学硕士与操作系统内核之间过去和未来的联系 | ⬜ |
文章:Transformer 推理算法 | ⬜ |
构建基于法学硕士的系统
资源 | 进步 |
---|
文章:我们从法学硕士一年的建设中学到了什么 | ⬜ |
文章:如何生成和使用合成数据进行微调 | ✅ |
文章:您的人工智能产品需要评估 | ✅ |
文章:特定任务的法学硕士评估有效和无效 | ✅ |
文章:LLM 应用程序的数据飞轮 | ⬜ |
文章:来自战壕的法学硕士:GoDaddy 运营模式的 10 个经验教训 | ✅ |
文章:抽象摘要的评估和幻觉检测 | ✅ |
文章:生成式 AI 应用程序和副驾驶的新兴 UX 模式 | ✅ |
文章:新手 LLM 培训指南 | ⬜ |
文章:将 ChatGPT 的结构化数据支持推向极限 | ✅ |
文章:GPTed:使用 GPT-3 进行语义散文检查 | ✅ |
文章:不用担心法学硕士 | ⬜ |
DeepLearning.AI:微调大型语言模型 | ✅ |
DeepLearning.AI:使用 ChatGPT API 构建系统 | ⬜ |
DeepLearning.AI:用于LLM应用程序开发的LangChain | ⬜ |
DeepLearning.AI:LangChain:与您的数据对话 | ⬜ |
DeepLearning.AI:使用 Gradio 构建生成式 AI 应用程序 | ✅ |
DeepLearning.AI:拥抱脸部的开源模型 | ⬜ |
DeepLearning.AI:米斯特拉尔入门 | ⬜ |
Datacamp:使用LangChain开发LLM应用程序 | ⬜ |
LLMOps:与 LLM 一起构建 | ⬜ |
法学硕士训练营 - 2023 年春季 | ✅ |
Youtube:最大化 LLM 成绩的技术调查 | ✅ |
Youtube:法学硕士系统和产品的构建模块:Eugene Yan | ✅ |
Youtube:微调 OpenAI 模型 - 最佳实践 | ✅ |
Youtube:课程:法学硕士微调与蝾螈 | 0/4 |
Youtube:微调法学硕士 | 1/5 |
YouTube:法学硕士评估 | 0/5 |
YouTube:构建 LLM 申请 | 0/8 |
技术技能(库/框架/工具)
AWS
资源 | 进步 |
---|
Udemy:2018 年 AWS 认证开发人员 - 助理 | ✅ |
姜戈
资源 | 进步 |
---|
文章:Django、HTMX 和 Alpine.js:现代网站,JavaScript 可选 | ✅ |
Matplotlib
资源 | 进步 |
---|
Datacamp:Seaborn 简介 | ✅ |
Datacamp:Matplotlib 简介 | ✅ |
ML流
下一个JS
熊猫
资源 | 进步 |
---|
数据营:Pandas 基金会 | ✅ |
Datacamp:Pandas 加入电子表格用户 | ✅ |
Datacamp:使用 pandas 操作 DataFrame | ✅ |
Datacamp:将 DataFrame 与 pandas 合并 | ✅ |
Datacamp:使用 pandas 进行数据操作 | ✅ |
Datacamp:使用 pandas 优化 Python 代码 | ✅ |
Datacamp:使用 pandas 简化数据摄取 | ✅ |
Datacamp:使用 pandas 分析营销活动 | ✅ |
Datacamp:用 pandas 分析警察活动 | ✅ |
火炬
资源 | 进步 |
---|
文章:PyTorch 内部结构 | ⬜ |
文章:将 PyTorch 视为理所当然 | ⬜ |
Datacamp:PyTorch 深度学习简介 | ✅ |
Datacamp:使用 PyTorch 进行中级深度学习 | ⬜ |
Datacamp:使用 PyTorch 进行文本深度学习 | ⬜ |
Datacamp:使用 PyTorch 进行图像深度学习 | ⬜ |
Deeplizard:神经网络编程 - 使用 PyTorch 进行深度学习 | ✅ |
ReactJS
资源 | 进步 |
---|
Codecademy:学习 ReactJS:第一部分 | ✅ |
Codecademy:学习 ReactJS:第二部分 | ✅ |
NexxtJS:React 基础 | ⬜ |
斯帕西
资源 | 进步 |
---|
Datacamp:使用 spaCy 进行高级 NLP | ✅ |
张量流和 Keras
资源 | 进步 |
---|
Datacamp:Python 中的 TensorFlow 简介 | ✅ |
Datacamp:Python 深度学习 | ✅ |
Datacamp:Keras 深度学习简介 | ✅ |
Datacamp:使用 Keras 进行高级深度学习 | ✅ |
Deeplizard:Keras - Python 深度学习神经网络 API | ✅ |
Udacity:用于深度学习的 TensorFlow 简介 | ✅ |