HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-03-10
1 <p>Теги: прямой отбор, обратный отбор, p-значения</p>
1 <p>Теги: прямой отбор, обратный отбор, p-значения</p>
2 <p><strong>Прямой отбор</strong>в машинном обучении представляет собой технику, которая заключается в использовании<strong>пошаговой регрессии</strong>. При этом построение модели в данном случае начинается с полного нуля, то есть речь идет о пустой модели, к которой каждая последующая итерация добавляет переменную, вносящую улучшение в создаваемую модель. То, как именно переменная добавляется в модель, определяют ее значимостью.</p>
2 <p><strong>Прямой отбор</strong>в машинном обучении представляет собой технику, которая заключается в использовании<strong>пошаговой регрессии</strong>. При этом построение модели в данном случае начинается с полного нуля, то есть речь идет о пустой модели, к которой каждая последующая итерация добавляет переменную, вносящую улучшение в создаваемую модель. То, как именно переменная добавляется в модель, определяют ее значимостью.</p>
3 <p>На практике все вышеописанное может рассчитываться посредством разнообразных метрик. Наиболее распространенный способ - применение<strong>p-значений</strong>, которые получены в изначальной статистической модели с применением всех переменных. В некоторых случаях прямой отбор приводит к<strong>переобучению</strong>модели, так как в модели иногда оказываются сильно коррелированные переменные, причем даже в том случае, если они предоставляют ту же самую информацию модели, однако модель при всем при этом показывает улучшение.</p>
3 <p>На практике все вышеописанное может рассчитываться посредством разнообразных метрик. Наиболее распространенный способ - применение<strong>p-значений</strong>, которые получены в изначальной статистической модели с применением всех переменных. В некоторых случаях прямой отбор приводит к<strong>переобучению</strong>модели, так как в модели иногда оказываются сильно коррелированные переменные, причем даже в том случае, если они предоставляют ту же самую информацию модели, однако модель при всем при этом показывает улучшение.</p>
4 <h2>Обратный отбор</h2>
4 <h2>Обратный отбор</h2>
5 <p>Скажем несколько слов и про<strong>обратный отбор</strong>. Он тоже заключается в поэтапном исключении признаков, но это происходит в<strong>противоположном направлении</strong>, если сравнивать с прямым отбором. То есть в данной ситуации начальная модель включает все независимые переменные. Далее переменные исключаются (по одной переменной за каждую итерацию), что происходит в том случае, если эти переменные не несут никакой ценности для новой регрессионной модели. При этом в основе исключения признаков находятся показатели<strong>p-значений</strong>изначальной модели.</p>
5 <p>Скажем несколько слов и про<strong>обратный отбор</strong>. Он тоже заключается в поэтапном исключении признаков, но это происходит в<strong>противоположном направлении</strong>, если сравнивать с прямым отбором. То есть в данной ситуации начальная модель включает все независимые переменные. Далее переменные исключаются (по одной переменной за каждую итерацию), что происходит в том случае, если эти переменные не несут никакой ценности для новой регрессионной модели. При этом в основе исключения признаков находятся показатели<strong>p-значений</strong>изначальной модели.</p>
6 <p>Остается добавить, что в этом методе тоже существует неопределенность при удалении слишком сильно коррелированных переменных.</p>
6 <p>Остается добавить, что в этом методе тоже существует неопределенность при удалении слишком сильно коррелированных переменных.</p>
7 <p><em>По материалам: https://pub.towardsai.net/feature-selection-in-machine-learning-3b2902852933.</em></p>
7 <p><em>По материалам: https://pub.towardsai.net/feature-selection-in-machine-learning-3b2902852933.</em></p>
8  
8