Zero-inflated boosted ensemble for small count problem

В статье описан новый подход к обучению модели данных, описывающих редкие события, когда целевая переменная (число событий) может быть описана распре­делением с добавленными нулями (ZIP-распределением), Предложена ZIP-модель, основанная на ансамбле деревьев, построенном с помощью бустинга. Эта модель основана на комбинации идей ZIP-дерева и GBT-ансамбля, Наш алгоритм, назван­ный ZIP-GBT, сначала выводится теоретически в рамках подхода градиентного бу­стинга, предложенного Дж,Фридманом, Затем наш метод сравнивается эмпирически на двух реальных наборах данных и на двух синтезированных. Показано, что ZIP- GBT в большинстве случаев превосходит ZIP-дерево в терминах подсчитанного с помощью кросс-валидации ZIP-правдоподобия и ошибки предсказания параметров ZIP-распределения.
Журнал: 
УДК: 
519.23