pip install numpy
)pip install pandas
)pip install scikit-learn
)pip install scipy
)pip install statsmodels
)pip install matplotlib
)pip install seaborn
)pip install sympy
)pip install flask
)pip install wtforms
)pip install tensorflow>=1.15
)pip install keras
)pip install pdpipe
)你可以从我在Heartbeat杂志(Medium平台)上写的这篇文章开始:
Jupyter 笔记本涵盖了 NumPy、Pandans、Seaborn、Matplotlib 等主题的广泛功能和操作。
Python中执行线性回归的多种方法及其速度比较(查看我在freeCodeCamp上写的文章)
正则化多元回归
使用scikit-learn 管道功能的多项式回归(查看我在走向数据科学上写的文章)
决策树和随机森林回归(展示随机森林如何作为鲁棒/正则化元估计器来拒绝过度拟合)
针对线性回归问题的详细视觉分析和拟合优度诊断测试
使用 Scikit-learn 中的HuberRegressor
进行稳健线性回归
k - 最近邻分类(这是笔记本)
决策树和随机森林分类(这是笔记本)
支持向量机分类(这里是Notebook)(查看我在Towards Data Science中写的关于SVM和排序算法的文章)
K均值聚类(这是笔记本)
亲和力传播(显示其时间复杂度和阻尼因子的影响)(这是笔记本)
均值漂移技术(显示其时间复杂度和噪声对集群发现的影响)(这是笔记本)
DBSCAN(展示了它如何一般性地检测高密度区域,而不管簇形状如何,而 k 均值无法做到这一点)(这是笔记本)
使用树状图进行分层聚类,显示如何选择最佳聚类数量(这是笔记本)
如何使用 Sympy 包使用符号数学表达式生成随机数据集。
这是我在 Medium 上关于此主题的文章:带有符号表达式的随机回归和分类问题生成
通过简单的 HTTP 服务器接口提供线性回归模型。用户需要通过执行Python脚本来请求预测。使用Flask
和Gunicorn
。
通过 HTTP 网页为循环神经网络 (RNN) 提供服务,并配有 Web 表单,用户可以在其中输入参数并单击按钮以根据预训练的 RNN 模型生成文本。使用Flask
、 Jinja
、 Keras
/ TensorFlow
、 WTForms
。
通过构建您自己的类似 Scikit-learn 的估计器并使其变得更好,在机器学习环境中实现一些核心 OOP 原则。
请参阅我在 Medium 上关于此主题的文章。
检查 Pytest 目录中的文件和详细说明,了解如何为机器学习模型编写单元测试代码/模块
分析数据科学代码和机器学习模型的内存占用和计算时间是一个关键但经常被忽视的领域。这里有几个笔记本展示了这些想法,