0 added
0 removed
Original
2026-01-01
Modified
2026-03-10
1
<p>Теги: прямой отбор, обратный отбор, p-значения</p>
1
<p>Теги: прямой отбор, обратный отбор, p-значения</p>
2
<p><strong>Прямой отбор</strong>в машинном обучении представляет собой технику, которая заключается в использовании<strong>пошаговой регрессии</strong>. При этом построение модели в данном случае начинается с полного нуля, то есть речь идет о пустой модели, к которой каждая последующая итерация добавляет переменную, вносящую улучшение в создаваемую модель. То, как именно переменная добавляется в модель, определяют ее значимостью.</p>
2
<p><strong>Прямой отбор</strong>в машинном обучении представляет собой технику, которая заключается в использовании<strong>пошаговой регрессии</strong>. При этом построение модели в данном случае начинается с полного нуля, то есть речь идет о пустой модели, к которой каждая последующая итерация добавляет переменную, вносящую улучшение в создаваемую модель. То, как именно переменная добавляется в модель, определяют ее значимостью.</p>
3
<p>На практике все вышеописанное может рассчитываться посредством разнообразных метрик. Наиболее распространенный способ - применение<strong>p-значений</strong>, которые получены в изначальной статистической модели с применением всех переменных. В некоторых случаях прямой отбор приводит к<strong>переобучению</strong>модели, так как в модели иногда оказываются сильно коррелированные переменные, причем даже в том случае, если они предоставляют ту же самую информацию модели, однако модель при всем при этом показывает улучшение.</p>
3
<p>На практике все вышеописанное может рассчитываться посредством разнообразных метрик. Наиболее распространенный способ - применение<strong>p-значений</strong>, которые получены в изначальной статистической модели с применением всех переменных. В некоторых случаях прямой отбор приводит к<strong>переобучению</strong>модели, так как в модели иногда оказываются сильно коррелированные переменные, причем даже в том случае, если они предоставляют ту же самую информацию модели, однако модель при всем при этом показывает улучшение.</p>
4
<h2>Обратный отбор</h2>
4
<h2>Обратный отбор</h2>
5
<p>Скажем несколько слов и про<strong>обратный отбор</strong>. Он тоже заключается в поэтапном исключении признаков, но это происходит в<strong>противоположном направлении</strong>, если сравнивать с прямым отбором. То есть в данной ситуации начальная модель включает все независимые переменные. Далее переменные исключаются (по одной переменной за каждую итерацию), что происходит в том случае, если эти переменные не несут никакой ценности для новой регрессионной модели. При этом в основе исключения признаков находятся показатели<strong>p-значений</strong>изначальной модели.</p>
5
<p>Скажем несколько слов и про<strong>обратный отбор</strong>. Он тоже заключается в поэтапном исключении признаков, но это происходит в<strong>противоположном направлении</strong>, если сравнивать с прямым отбором. То есть в данной ситуации начальная модель включает все независимые переменные. Далее переменные исключаются (по одной переменной за каждую итерацию), что происходит в том случае, если эти переменные не несут никакой ценности для новой регрессионной модели. При этом в основе исключения признаков находятся показатели<strong>p-значений</strong>изначальной модели.</p>
6
<p>Остается добавить, что в этом методе тоже существует неопределенность при удалении слишком сильно коррелированных переменных.</p>
6
<p>Остается добавить, что в этом методе тоже существует неопределенность при удалении слишком сильно коррелированных переменных.</p>
7
<p><em>По материалам: https://pub.towardsai.net/feature-selection-in-machine-learning-3b2902852933.</em></p>
7
<p><em>По материалам: https://pub.towardsai.net/feature-selection-in-machine-learning-3b2902852933.</em></p>
8
8