Site Web | Documents | Tutoriels | Installation | Notes de version
CatBoost est une méthode d'apprentissage automatique basée sur l'augmentation du gradient sur les arbres de décision.
Principaux avantages de CatBoost :
- Qualité supérieure par rapport aux autres bibliothèques GBDT sur de nombreux ensembles de données.
- Meilleure vitesse de prédiction de sa catégorie.
- Prise en charge des fonctionnalités numériques et catégorielles.
- Prise en charge rapide des GPU et multi-GPU pour une formation prête à l'emploi.
- Outils de visualisation inclus.
- Formation distribuée rapide et reproductible avec Apache Spark et CLI.
Prise en main et documentation
Toute la documentation CatBoost est disponible ici.
Installez CatBoost en suivant le guide du
- Paquet Python
- Forfait R
- Ligne de commande
- Paquet pour Apache Spark
Ensuite, vous souhaiterez peut-être enquêter :
- Tutoriels
- Modes de formation et métriques
- Validation croisée
- Réglage des paramètres
- Calcul de l'importance des fonctionnalités
- Prédictions régulières et échelonnées
- Vidéos CatBoost pour Apache Spark : introduction et architecture
Si vous ne parvenez pas à ouvrir la documentation dans votre navigateur, essayez d'ajouter yastatic.net et yastat.net à la liste des domaines autorisés dans votre Privacy Badger.
Modèles Catboost en production
Si vous souhaitez évaluer le modèle Catboost dans votre application, lisez la documentation de l'API du modèle.
Questions et rapports de bogues
- Pour signaler des bogues, veuillez utiliser la page catboost/bugreport.
- Posez une question sur Stack Overflow avec la balise catboost, nous surveillons cela pour de nouvelles questions.
- Demandez conseil rapidement au groupe Telegram ou au chat Telegram russophone
Aide à améliorer CatBoost
- Consultez les problèmes ouverts et aidez les problèmes recherchés pour voir ce qui peut être amélioré, ou ouvrez un problème si vous voulez quelque chose.
- Ajoutez vos histoires et votre expérience à Awesome CatBoost.
- Pour contribuer à CatBoost, vous devez d'abord lire le texte du CLA et ajouter à votre demande d'extraction que vous acceptez les termes du CLA. Plus d’informations peuvent être trouvées dans CONTRIBUTING.md
- Les instructions pour les contributeurs peuvent être trouvées ici.
Nouvelles
Les dernières nouvelles sont publiées sur Twitter.
Document de référence
Anna Veronika Dorogush, Andrey Gulin, Gleb Gusev, Nikita Kazeev, Liudmila Ostroumova Prokhorenkova, Aleksandr Vorobev "Combattre les préjugés avec un boost dynamique". arXiv : 1706.09516, 2017.
Anna Veronika Dorogush, Vasily Ershov, Andrey Gulin "CatBoost : amélioration du dégradé avec prise en charge des fonctionnalités catégorielles". Atelier sur les systèmes ML au NIPS 2017.
Licence
© YANDEX SARL, 2017-2024. Sous licence Apache, version 2.0. Voir le fichier LICENSE pour plus de détails.