LightGBM 是一個使用基於樹的學習演算法的梯度增強框架。它被設計為分散式且高效的,具有以下優點:
欲了解更多詳情,請參閱功能。
受益於這些優勢,LightGBM正在被廣泛應用於許多機器學習競賽的獲獎解決方案中。
在公共資料集上的對比實驗表明,LightGBM 在效率和準確性方面都優於現有的 boosting 框架,且記憶體消耗顯著降低。更重要的是,分散式學習實驗表明,LightGBM可以透過使用多台機器在特定設定下進行訓練來實現線性加速。
我們的主要文件位於 https://lightgbm.readthedocs.io/ 並從此儲存庫產生。如果您是 LightGBM 的新手,請按照該網站上的安裝說明進行操作。
接下來您可能想閱讀:
貢獻者文檔:
請參閱 GitHub 發布頁面上的變更日誌。
此處列出的項目提供了使用 LightGBM 的替代方法。它們不受LightGBM
開發團隊維護或正式認可。
JPMML(Java PMML 轉換器):https://github.com/jpmml/jpmml-lightgbm
Nyoka(Python PMML 轉換器):https://github.com/SoftwareAG/nyoka
Treelite(用於高效部署的模型編譯器):https://github.com/dmlc/treelite
lleaves(基於 LLVM 的模型編譯器,用於高效推理):https://github.com/siboehm/llaves
Hummingbird(張量計算的模型編譯器):https://github.com/microsoft/hummingbird
cuML 森林推理庫(GPU 加速推理):https://github.com/rapidsai/cuml
daal4py(Intel CPU 加速推理):https://github.com/intel/scikit-learn-intelex/tree/master/daal4py
m2cgen(各種語言的模型應用程式):https://github.com/BayesWitnesses/m2cgen
leaves(Go 模型應用程式):https://github.com/dmitryikh/leaves
ONNXMLTools(ONNX 轉換器):https://github.com/onnx/onnxmltools
SHAP(模型輸出解釋器):https://github.com/slundberg/shap
Shapash(模型視覺化與解釋):https://github.com/MAIF/shapash
dtreeviz(決策樹視覺化與模型解釋):https://github.com/parrt/dtreeviz
supertree(決策樹的互動式視覺化):https://github.com/mljar/supertree
SynapseML(Spark 上的 LightGBM):https://github.com/microsoft/SynapseML
Kubeflow Fairing(Kubernetes 上的 LightGBM):https://github.com/kubeflow/fairing
Kubeflow Operator(Kubernetes 上的 LightGBM):https://github.com/kubeflow/xgboost-operator
lightgbm_ray(Ray 上的 LightGBM):https://github.com/ray-project/lightgbm_ray
火星(火星上的 LightGBM):https://github.com/mars-project/mars
ML.NET(.NET/C# 套件):https://github.com/dotnet/machinelearning
LightGBM.NET(.NET/C# 套件):https://github.com/rca22/LightGBM.Net
LightGBM Ruby(Ruby gem):https://github.com/ankane/lightgbm-ruby
LightGBM4j(Java進階綁定):https://github.com/metarank/lightgbm4j
LightGBM4J(用 Scala 寫的 LightGBM 的 JVM 介面):https://github.com/seek-oss/lightgbm4j
Julia 套件:https://github.com/IQVIA-ML/LightGBM.jl
lightgbm3(Rust 綁定):https://github.com/Mottl/lightgbm3-rs
MLServer(LightGBM 推理伺服器):https://github.com/SeldonIO/MLServer
MLflow(實驗追蹤、模型監控框架):https://github.com/mlflow/mlflow
FLAML(用於超參數最佳化的 AutoML 函式庫):https://github.com/microsoft/FLAML
MLJAR AutoML(表格資料上的 AutoML):https://github.com/mljar/mljar-supervised
Optuna(超參數最佳化架構):https://github.com/optuna/optuna
LightGBMLSS(使用 LightGBM 進行機率建模):https://github.com/StatMixedML/LightGBMLSS
mlforecast(使用 LightGBM 進行時間序列預測):https://github.com/Nixtla/mlforecast
skforecast(使用 LightGBM 進行時間序列預測):https://github.com/JoaquinAmatRodrigo/skforecast
{bonsai}
(R {parsnip}
相容介面):https://github.com/tidymodels/bonsai
{mlr3extralearners}
(R {mlr3}
相容介面):https://github.com/mlr-org/mlr3extralearners
lightgbm-transform(特徵轉換綁定):https://github.com/microsoft/lightgbm-transform
postgresml
(SQL 中的 LightGBM 訓練和預測,透過 Postgres 擴充):https://github.com/postgresml/postgresml
pyodide
(在網頁瀏覽器中執行lightgbm
Python 套件):https://github.com/pyodide/pyodide
vaex-ml
(Python DataFrame 函式庫,具有自己的 LightGBM 介面):https://github.com/vaexio/vaex
lightgbm
標籤在 Stack Overflow 上提問,我們會監控新問題。檢查貢獻頁面。
該專案採用了微軟開源行為準則。有關詳細信息,請參閱行為準則常見問題解答或聯繫 [email protected] 提出任何其他問題或意見。
於石,柯國林,陳卓明,鄭樹新,劉鐵燕。 「梯度提升決策樹的量化訓練」(連結)。神經資訊處理系統的進展 35 (NeurIPS 2022),第 18822-18833 頁。
柯國林、孟奇、Thomas Finley、王泰峰、陳偉、馬衛東、葉其偉、劉鐵岩。 「LightGBM:一種高效率的梯度提升決策樹」。神經資訊處理系統進展 30 (NIPS 2017),第 3149-3157 頁。
孟奇,柯國林,王泰豐,陳偉,葉其偉,馬志明,劉鐵岩。 「決策樹的通訊高效並行演算法」。神經資訊處理系統的進展 29 (NIPS 2016),第 1279-1287 頁。
張煥、思思和謝卓瑞。 「大規模樹提升的 GPU 加速」。 SysML 會議,2018 年。
該項目根據 MIT 許可條款獲得許可。有關更多詳細信息,請參閱許可證。