0 added
0 removed
Original
2026-01-01
Modified
2026-03-10
1
<p>Теги: анализ временных рядов, алгоритм, математика для data science, метод box-counting, энтропия, вероятностное распределение, кросс-энтропия</p>
1
<p>Теги: анализ временных рядов, алгоритм, математика для data science, метод box-counting, энтропия, вероятностное распределение, кросс-энтропия</p>
2
<p>Это известный<strong>алгоритм</strong>, который позволяет оценить эффект входной информации на наблюдаемый выходной параметр. Пространство переменных X и Y разбивается на ячейки. Количество заполненных ячеек будет использоваться для оценки<strong>вероятностного распределения входных параметров</strong>. Согласно теории информационных технологий и систем, для оценки степени предсказуемости случайной величины используется её<strong>энтропия</strong>. Энтропия рассчитывается как среднее значение логарифмов. В алгоритме Box-counting энтропия приближенно оценивается по набору чисел заполнения ячеек, на которые разбивается интервал её возможных значений:</p>
2
<p>Это известный<strong>алгоритм</strong>, который позволяет оценить эффект входной информации на наблюдаемый выходной параметр. Пространство переменных X и Y разбивается на ячейки. Количество заполненных ячеек будет использоваться для оценки<strong>вероятностного распределения входных параметров</strong>. Согласно теории информационных технологий и систем, для оценки степени предсказуемости случайной величины используется её<strong>энтропия</strong>. Энтропия рассчитывается как среднее значение логарифмов. В алгоритме Box-counting энтропия приближенно оценивается по набору чисел заполнения ячеек, на которые разбивается интервал её возможных значений:</p>
3
<p><strong>Чем больше энтропия переменной, тем менее предсказуемо её значение</strong>. Если значения примеров находятся в одной ячейке, то их энтропия равна 0.</p>
3
<p><strong>Чем больше энтропия переменной, тем менее предсказуемо её значение</strong>. Если значения примеров находятся в одной ячейке, то их энтропия равна 0.</p>
4
<p>Предсказуемость случайного вектора У, обеспечиваемое знанием другой случайной величины Х, характеризуется кросс-энтропией:</p>
4
<p>Предсказуемость случайного вектора У, обеспечиваемое знанием другой случайной величины Х, характеризуется кросс-энтропией:</p>
5
<p>Кросс-энтропия равна логарифму отношения типичного разброса значений переменной к типичному разбросу этой переменной, но при известном значении переменной Х.</p>
5
<p>Кросс-энтропия равна логарифму отношения типичного разброса значений переменной к типичному разбросу этой переменной, но при известном значении переменной Х.</p>
6
<p>Чем больше кросс-энтропия, тем больше определённости вносит знание значения Х в предсказание значения переменной. Описанный выше энтропийный анализ не использует никаких предположений о характере зависимости между входными и выходными переменными.</p>
6
<p>Чем больше кросс-энтропия, тем больше определённости вносит знание значения Х в предсказание значения переменной. Описанный выше энтропийный анализ не использует никаких предположений о характере зависимости между входными и выходными переменными.</p>
7
<p>Таким образом, данная методика даёт наиболее общий метод определения значимости входов, позволяя также оценивать<strong>степень предсказуемости выходов</strong>.</p>
7
<p>Таким образом, данная методика даёт наиболее общий метод определения значимости входов, позволяя также оценивать<strong>степень предсказуемости выходов</strong>.</p>
8
<p><strong>Метод Box-counting</strong>, как уже было описано выше, определяет, сколько ячеек размером ε содержат точки корреляционной размерности ряда, т. е. может быть записана формула:</p>
8
<p><strong>Метод Box-counting</strong>, как уже было описано выше, определяет, сколько ячеек размером ε содержат точки корреляционной размерности ряда, т. е. может быть записана формула:</p>
9
<p>В данной формуле D - корреляционная размерность.</p>
9
<p>В данной формуле D - корреляционная размерность.</p>
10
<p>Данный метод относительно прост для его применения на практике. Однако данный метод практически<strong>не применим для анализа финансовых временных рядов</strong>. Для того, чтобы достичь хотя бы минимальной надёжности выполнения<strong>алгоритма Box-Counting</strong>, требуется проводить анализ по нескольким сотням тысяч наблюдениям в ряду. Такое ограничение на длине ряда и невозможность рассчитывать локальную корреляционную размерность является крайне сильным<strong>недостатком данного метода</strong>.</p>
10
<p>Данный метод относительно прост для его применения на практике. Однако данный метод практически<strong>не применим для анализа финансовых временных рядов</strong>. Для того, чтобы достичь хотя бы минимальной надёжности выполнения<strong>алгоритма Box-Counting</strong>, требуется проводить анализ по нескольким сотням тысяч наблюдениям в ряду. Такое ограничение на длине ряда и невозможность рассчитывать локальную корреляционную размерность является крайне сильным<strong>недостатком данного метода</strong>.</p>
11
<p><em>Хотите знать больше? Добро пожаловать на мой<a>Телеграм-канал</a>!</em></p>
11
<p><em>Хотите знать больше? Добро пожаловать на мой<a>Телеграм-канал</a>!</em></p>
12
12