«Яндекс» представил метод машинного обучения — CatBoost — для более качественного прогнозирования моделей, сообщает пресс-служба компании.
Основное отличие CatBoost — умение работать с данными из разных источников, переводить категориальные данные в числа, а также снижать количество ошибок при прогнозировании не в процессе последовательных доработок модели, а сразу.
В «Яндексе» рассчитывают, что в тех сервисах, где CatBoost будет показывать лучшие результаты, технология будет внедрена вместо предыдущего метода машинного обучения компании «Матрикснет». В частности, компания планирует перевести на CatBoost сервис «Яндекс.Такси», а также внедрить CatBoost — наравне с «Матрикснет» — в поиск.
«Яндекс» выложил библиотеку машинного обучения CatBoost в открытый доступ. В компании считают, что технология перспективна для использования в финансовом секторе, медицине, промышленности, рекомендательных сервисах и др.
Библиотека поддерживает операционные системы Linux, Windows и macOS и доступна на языках программирования Python и R. «Яндекс» разработал также программу визуализации CatBoost Viewer, которая позволяет следить за процессом обучения на графиках.