以下是这些部分:
本节包含面试中会被问到的数据科学基本概念的备忘单:
本部分包含我读过的有关数据科学和机器学习的书籍:
本节包含实际数据科学面试中提出的示例问题:
本节包含有关设计机器学习系统以解决实际问题的案例研究问题。
本节包含我出于学术、自学和业余爱好目的完成的数据科学项目组合。
如需浏览作品集时获得更视觉上愉悦的体验,请访问 jameskle.com/data-portfolio
Transfer Rec:我正在进行的研究工作涉及深度学习和推荐系统。
电影推荐:设计了 4 个不同的模型来推荐 MovieLens 数据集上的项目。
工具:PyTorch、TensorBoard、Keras、Pandas、NumPy、SciPy、Matplotlib、Seaborn、Scikit-Learn、Surprise、Wordcloud
行程优化器:使用 XGBoost 和进化算法来优化纽约市出租车的行程时间。
Instacart 市场购物篮分析:解决了 Instacart 市场购物篮分析挑战,以预测用户的下一个订单中将包含哪些产品。
工具:Pandas、NumPy、Matplotlib、XGBoost、Geopy、Scikit-Learn
时尚推荐:构建了基于ResNet的模型,根据语义相似度对DeepFashion数据库中的时尚图像进行分类和推荐。
时尚分类:开发了 4 种不同的卷积神经网络,对时尚 MNIST 数据集中的图像进行分类。
狗品种分类:设计了一个识别狗品种的卷积神经网络。
道路分割:在 Kitty Road 数据集中实现了用于语义分割任务的全卷积网络。
工具:TensorFlow、Keras、Pandas、NumPy、Matplotlib、Scikit-Learn、TensorBoard
2018 年世界杯球队分析:对 FIFA 18 数据集进行分析和可视化,以预测 2018 年俄罗斯世界杯 10 支球队的最佳国际阵容。
Spotify 艺术家分析:对 Spotify 上 50 位不同流派的不同艺术家的音乐风格进行分析和可视化。
工具:Pandas、NumPy、Matplotlib、Rspotify、httr、dplyr、tidyr、雷达图、ggplot2
本节包含我为自由职业客户和自学目的完成的数据新闻文章组合。
要获得更视觉上愉悦的浏览作品集的体验,请访问 jameskle.com/data-journalism
数据科学家需要掌握的 10 项统计技术
逻辑回归教程
决策树教程
支持向量机教程
为商业领袖简单介绍数据驱动营销
机器学习工程师需要了解的 10 种算法
关于机器学习需要了解的 12 件事
机器学习新手十大算法一览
数据科学家工具箱所需的 10 种数据挖掘技术
电子商务中的聚类与分类
学习排名的基本知识
调试机器学习模型的 6 种方法
当今值得追求的 8 条机器学习职业道路
AI从业者需要应用的10种深度学习方法
机器学习研究人员需要学习的 8 种神经网络架构
每个认真的机器学习者都应该熟悉的 5 个深度学习框架
改变你看待世界方式的 5 种计算机视觉技术
卷积神经网络:生物学启发模型
递归神经网络:语言建模的动力源泉
将改变你未来沟通方式的 7 种 NLP 技术
2018 年主导计算机视觉的 5 个趋势
为您的设备提供支持的 3 个端到端语音识别深度学习框架
在小型设备上进行高效深度学习推理的 5 种算法
更有效地训练深度神经网络模型的 4 种研究技术
用于深度网络高效训练和推理的两种硬件架构
2020 年需要牢记的 10 个深度学习最佳实践
这些 PDF 备忘单来自 BecomingHuman.AI。