Веб-сайт | Документация | Учебники | Установка | Примечания к выпуску
CatBoost — это метод машинного обучения, основанный на повышении градиента деревьев решений.
Основные преимущества CatBoost:
- Превосходное качество по сравнению с другими библиотеками GBDT для многих наборов данных.
- Лучшая в своем классе скорость прогнозирования.
- Поддержка как числовых, так и категориальных функций.
- Поддержка быстрого графического процессора и нескольких графических процессоров для обучения прямо из коробки.
- Включены инструменты визуализации.
- Быстрое и воспроизводимое распределенное обучение с помощью Apache Spark и CLI.
Начало работы и документация
Вся документация CatBoost доступна здесь.
Установите CatBoost, следуя руководству по
- Пакет Python
- R-пакет
- Командная строка
- Пакет для Apache Spark
Далее вы можете изучить:
- Учебники
- Режимы обучения и показатели
- Перекрестная проверка
- Настройка параметров
- Расчет важности функции
- Регулярные и поэтапные прогнозы
- Видео CatBoost для Apache Spark: введение и архитектура
Если вы не можете открыть документацию в своем браузере, попробуйте добавить yastatic.net и yastat.net в список разрешенных доменов в вашем индикаторе конфиденциальности.
Модели Catboost в производстве
Если вы хотите оценить модель Catboost в своем приложении, прочтите документацию по API модели.
Вопросы и отчеты об ошибках
- Чтобы сообщить об ошибках, используйте страницу catboost/bugreport.
- Задайте вопрос о переполнении стека с помощью тега catboost, мы отслеживаем появление новых вопросов.
- Обращайтесь за оперативной консультацией в группу Telegram или русскоязычный чат Telegram.
Помогите сделать CatBoost лучше
- Просмотрите открытые проблемы и помогите решить нужные проблемы, чтобы узнать, что можно улучшить, или откройте проблему, если вам что-то нужно.
- Добавьте свои истории и опыт в Awesome CatBoost.
- Чтобы внести свой вклад в CatBoost, вам необходимо сначала прочитать текст CLA и добавить в свой запрос на включение, что вы согласны с условиями CLA. Более подробную информацию можно найти на сайте CONTRIBUTING.md.
- Инструкции для участников можно найти здесь.
Новости
Последние новости публикуются в твиттере.
Справочный документ
Анна Вероника Дорогуш, Андрей Гулин, Глеб Гусев, Никита Казеев, Людмила Остроумова Прохоренкова, Александр Воробьев «Борьба с предубеждениями с помощью динамического бустинга». arXiv:1706.09516, 2017.
Анна Вероника Дорогуш, Василий Ершов, Андрей Гулин «CatBoost: градиентный бустинг с поддержкой категориальных функций». Семинар по системам машинного обучения на выставке NIPS 2017.
Лицензия
© ООО «ЯНДЕКС», 2017-2024. Лицензия Apache, версия 2.0. Дополнительную информацию см. в файле ЛИЦЕНЗИИ.