Rivalry2

HTML Diff

0 added 0 removed

Original 2026-01-01

Modified 2026-03-10

1 Теги: прямой отбор, обратный отбор, p-значения

2 Прямой отборв машинном обучении представляет собой технику, которая заключается в использованиипошаговой регрессии. При этом построение модели в данном случае начинается с полного нуля, то есть речь идет о пустой модели, к которой каждая последующая итерация добавляет переменную, вносящую улучшение в создаваемую модель. То, как именно переменная добавляется в модель, определяют ее значимостью.

3 На практике все вышеописанное может рассчитываться посредством разнообразных метрик. Наиболее распространенный способ - применениеp-значений, которые получены в изначальной статистической модели с применением всех переменных. В некоторых случаях прямой отбор приводит кпереобучениюмодели, так как в модели иногда оказываются сильно коррелированные переменные, причем даже в том случае, если они предоставляют ту же самую информацию модели, однако модель при всем при этом показывает улучшение.

4 <h2>Обратный отбор</h2>

5 Скажем несколько слов и прообратный отбор. Он тоже заключается в поэтапном исключении признаков, но это происходит впротивоположном направлении, если сравнивать с прямым отбором. То есть в данной ситуации начальная модель включает все независимые переменные. Далее переменные исключаются (по одной переменной за каждую итерацию), что происходит в том случае, если эти переменные не несут никакой ценности для новой регрессионной модели. При этом в основе исключения признаков находятся показателиp-значенийизначальной модели.

6 Остается добавить, что в этом методе тоже существует неопределенность при удалении слишком сильно коррелированных переменных.

7 По материалам: https://pub.towardsai.net/feature-selection-in-machine-learning-3b2902852933.