LightGBM 是一个使用基于树的学习算法的梯度增强框架。它被设计为分布式且高效的,具有以下优点:
欲了解更多详情,请参阅功能。
受益于这些优势,LightGBM正在被广泛应用于许多机器学习竞赛的获奖解决方案中。
在公共数据集上的对比实验表明,LightGBM 在效率和准确性方面都优于现有的 boosting 框架,并且内存消耗显着降低。更重要的是,分布式学习实验表明,LightGBM可以通过使用多台机器在特定设置下进行训练来实现线性加速。
我们的主要文档位于 https://lightgbm.readthedocs.io/ 并从此存储库生成。如果您是 LightGBM 的新手,请按照该站点上的安装说明进行操作。
接下来您可能想阅读:
贡献者文档:
请参阅 GitHub 发布页面上的变更日志。
此处列出的项目提供了使用 LightGBM 的替代方法。它们不受LightGBM
开发团队维护或正式认可。
JPMML(Java PMML 转换器):https://github.com/jpmml/jpmml-lightgbm
Nyoka(Python PMML 转换器):https://github.com/SoftwareAG/nyoka
Treelite(用于高效部署的模型编译器):https://github.com/dmlc/treelite
lleaves(基于 LLVM 的模型编译器,用于高效推理):https://github.com/siboehm/llaves
Hummingbird(张量计算的模型编译器):https://github.com/microsoft/hummingbird
cuML 森林推理库(GPU 加速推理):https://github.com/rapidsai/cuml
daal4py(Intel CPU 加速推理):https://github.com/intel/scikit-learn-intelex/tree/master/daal4py
m2cgen(各种语言的模型应用程序):https://github.com/BayesWitnesses/m2cgen
leaves(Go 模型应用程序):https://github.com/dmitryikh/leaves
ONNXMLTools(ONNX 转换器):https://github.com/onnx/onnxmltools
SHAP(模型输出解释器):https://github.com/slundberg/shap
Shapash(模型可视化和解释):https://github.com/MAIF/shapash
dtreeviz(决策树可视化和模型解释):https://github.com/parrt/dtreeviz
supertree(决策树的交互式可视化):https://github.com/mljar/supertree
SynapseML(Spark 上的 LightGBM):https://github.com/microsoft/SynapseML
Kubeflow Fairing(Kubernetes 上的 LightGBM):https://github.com/kubeflow/fairing
Kubeflow Operator(Kubernetes 上的 LightGBM):https://github.com/kubeflow/xgboost-operator
lightgbm_ray(Ray 上的 LightGBM):https://github.com/ray-project/lightgbm_ray
火星(火星上的 LightGBM):https://github.com/mars-project/mars
ML.NET(.NET/C# 包):https://github.com/dotnet/machinelearning
LightGBM.NET(.NET/C# 包):https://github.com/rca22/LightGBM.Net
LightGBM Ruby(Ruby gem):https://github.com/ankane/lightgbm-ruby
LightGBM4j(Java高级绑定):https://github.com/metarank/lightgbm4j
LightGBM4J(用 Scala 编写的 LightGBM 的 JVM 接口):https://github.com/seek-oss/lightgbm4j
Julia 包:https://github.com/IQVIA-ML/LightGBM.jl
lightgbm3(Rust 绑定):https://github.com/Mottl/lightgbm3-rs
MLServer(LightGBM 推理服务器):https://github.com/SeldonIO/MLServer
MLflow(实验跟踪、模型监控框架):https://github.com/mlflow/mlflow
FLAML(用于超参数优化的 AutoML 库):https://github.com/microsoft/FLAML
MLJAR AutoML(表格数据上的 AutoML):https://github.com/mljar/mljar-supervised
Optuna(超参数优化框架):https://github.com/optuna/optuna
LightGBMLSS(使用 LightGBM 进行概率建模):https://github.com/StatMixedML/LightGBMLSS
mlforecast(使用 LightGBM 进行时间序列预测):https://github.com/Nixtla/mlforecast
skforecast(使用 LightGBM 进行时间序列预测):https://github.com/JoaquinAmatRodrigo/skforecast
{bonsai}
(R {parsnip}
兼容接口):https://github.com/tidymodels/bonsai
{mlr3extralearners}
(R {mlr3}
兼容接口):https://github.com/mlr-org/mlr3extralearners
lightgbm-transform(特征转换绑定):https://github.com/microsoft/lightgbm-transform
postgresml
(SQL 中的 LightGBM 训练和预测,通过 Postgres 扩展):https://github.com/postgresml/postgresml
pyodide
(在网络浏览器中运行lightgbm
Python 包):https://github.com/pyodide/pyodide
vaex-ml
(Python DataFrame 库,具有自己的 LightGBM 接口):https://github.com/vaexio/vaex
lightgbm
标签在 Stack Overflow 上提问,我们会监控新问题。检查贡献页面。
该项目采用了微软开源行为准则。有关详细信息,请参阅行为准则常见问题解答或联系 [email protected] 提出任何其他问题或意见。
于石,柯国林,陈卓明,郑树新,刘铁燕。 “梯度提升决策树的量化训练”(链接)。神经信息处理系统的进展 35 (NeurIPS 2022),第 18822-18833 页。
柯国林、孟奇、Thomas Finley、王泰峰、陈伟、马卫东、叶其伟、刘铁岩。 “LightGBM:一种高效的梯度提升决策树”。神经信息处理系统进展 30 (NIPS 2017),第 3149-3157 页。
孟奇,柯国林,王泰丰,陈伟,叶其伟,马志明,刘铁岩。 “决策树的通信高效并行算法”。神经信息处理系统的进展 29 (NIPS 2016),第 1279-1287 页。
张焕、思思和谢卓瑞。 “大规模树提升的 GPU 加速”。 SysML 会议,2018 年。
该项目根据 MIT 许可条款获得许可。有关更多详细信息,请参阅许可证。