0 added
0 removed
Original
2026-01-01
Modified
2026-02-21
1
<p><a>#статьи</a></p>
1
<p><a>#статьи</a></p>
2
<ul><li>27 фев 2024</li>
2
<ul><li>27 фев 2024</li>
3
<li>0</li>
3
<li>0</li>
4
</ul><p>Рассказываем об основах популярной технологии бизнес-аналитики.</p>
4
</ul><p>Рассказываем об основах популярной технологии бизнес-аналитики.</p>
5
<p>Иллюстрация: Оля Ежак для Skillbox Media</p>
5
<p>Иллюстрация: Оля Ежак для Skillbox Media</p>
6
<p>Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.</p>
6
<p>Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.</p>
7
<p>Хранилища данных можно разделить на три основных типа: SQL (реляционные), NoSQL (нереляционные) и OLAP. Они различаются между собой структурой хранения информации и областью применения.</p>
7
<p>Хранилища данных можно разделить на три основных типа: SQL (реляционные), NoSQL (нереляционные) и OLAP. Они различаются между собой структурой хранения информации и областью применения.</p>
8
<p>OLAP-системы используются реже всего. Но без них не обойтись, если компания планирует работать с аналитическими системами, постоянно обрабатывающими огромные объёмы данных - терабайты и петабайты информации.</p>
8
<p>OLAP-системы используются реже всего. Но без них не обойтись, если компания планирует работать с аналитическими системами, постоянно обрабатывающими огромные объёмы данных - терабайты и петабайты информации.</p>
9
<p><strong>Содержание</strong></p>
9
<p><strong>Содержание</strong></p>
10
<ul><li><a>Что такое OLAP-технология</a></li>
10
<ul><li><a>Что такое OLAP-технология</a></li>
11
<li><a>Как выглядят OLAP-кубы</a></li>
11
<li><a>Как выглядят OLAP-кубы</a></li>
12
<li><a>Какие подходы к хранению данных существуют</a></li>
12
<li><a>Какие подходы к хранению данных существуют</a></li>
13
<li><a>Из чего состоит OLAP-система</a></li>
13
<li><a>Из чего состоит OLAP-система</a></li>
14
<li><a>Какие преимущества есть у этого подхода</a></li>
14
<li><a>Какие преимущества есть у этого подхода</a></li>
15
<li><a>Где используется OLAP</a></li>
15
<li><a>Где используется OLAP</a></li>
16
</ul><p><strong>Оперативная аналитическая обработка данных (OLAP)</strong> - это технология, позволяющая в режиме реального времени получить определённый срез данных для их последующего анализа.</p>
16
</ul><p><strong>Оперативная аналитическая обработка данных (OLAP)</strong> - это технология, позволяющая в режиме реального времени получить определённый срез данных для их последующего анализа.</p>
17
<p>Звучит сложно, но давайте посмотрим на работу OLAP в жизни. Представим, что в агентстве недвижимости аналитикам необходимо оценить количество продаж и их доходность, чтобы выявить самые выгодные сделки за последний год. Благодаря этому они смогут понять, какие факторы влияют на стоимость недвижимости, а значит, и на прибыль компании, чтобы их оптимизировать.</p>
17
<p>Звучит сложно, но давайте посмотрим на работу OLAP в жизни. Представим, что в агентстве недвижимости аналитикам необходимо оценить количество продаж и их доходность, чтобы выявить самые выгодные сделки за последний год. Благодаря этому они смогут понять, какие факторы влияют на стоимость недвижимости, а значит, и на прибыль компании, чтобы их оптимизировать.</p>
18
<p>Выгружать данные вручную долго, так как информация о сделках и финансовые показатели компании хранятся в разных хранилищах. Аналитику придётся вручную доставать нужные данные и пытаться найти между ними взаимосвязи.</p>
18
<p>Выгружать данные вручную долго, так как информация о сделках и финансовые показатели компании хранятся в разных хранилищах. Аналитику придётся вручную доставать нужные данные и пытаться найти между ними взаимосвязи.</p>
19
<p>OLAP-системы автоматизируют этот процесс и могут работать с разными хранилищами, содержащими разные типы данных, формируя общую выгрузку с учётом заданных критериев. И это не всё. После выгрузки информацию можно визуализировать для отчёта или поиска взаимосвязей между показателями.</p>
19
<p>OLAP-системы автоматизируют этот процесс и могут работать с разными хранилищами, содержащими разные типы данных, формируя общую выгрузку с учётом заданных критериев. И это не всё. После выгрузки информацию можно визуализировать для отчёта или поиска взаимосвязей между показателями.</p>
20
<p>Всё это возможно благодаря способности OLAP преобразовывать данные в OLAP-кубы и работать с ними.</p>
20
<p>Всё это возможно благодаря способности OLAP преобразовывать данные в OLAP-кубы и работать с ними.</p>
21
<p>В OLAP-системах информация хранится либо в реляционных базах, либо в виде специальных многомерных OLAP-кубов. Причём исходные данные для построения последних могут браться из обычных БД.</p>
21
<p>В OLAP-системах информация хранится либо в реляционных базах, либо в виде специальных многомерных OLAP-кубов. Причём исходные данные для построения последних могут браться из обычных БД.</p>
22
<p><strong>OLAP-куб</strong> - это многомерный массив данных. Каждая его грань содержит информацию только по одному признаку.</p>
22
<p><strong>OLAP-куб</strong> - это многомерный массив данных. Каждая его грань содержит информацию только по одному признаку.</p>
23
<p>Разберём эту структуру на примере агентства недвижимости. Компания может хранить информацию о сделках в виде обычной таблицы с фамилиями риелторов и числом заключённых ими договоров. На выходе получаются привычные строки и столбцы:</p>
23
<p>Разберём эту структуру на примере агентства недвижимости. Компания может хранить информацию о сделках в виде обычной таблицы с фамилиями риелторов и числом заключённых ими договоров. На выходе получаются привычные строки и столбцы:</p>
24
Таблица с информацией о риелторах и числе их сделок.<em>Иллюстрация: Skillbox Media</em><p>Но представим, что мы хотим посмотреть на то, как сделки каждого риелтора разбиты по месяцам года. Добавим в схему третье измерение:</p>
24
Таблица с информацией о риелторах и числе их сделок.<em>Иллюстрация: Skillbox Media</em><p>Но представим, что мы хотим посмотреть на то, как сделки каждого риелтора разбиты по месяцам года. Добавим в схему третье измерение:</p>
25
OLAP-куб, объединяющий три показателя.<em>Иллюстрация: Skillbox Media</em><p>Это уже простой OLAP-куб с тремя показателями. Его можно усложнять и дальше, добавляя новые метрики. Например, информацию о месторасположении недвижимости по районам города.</p>
25
OLAP-куб, объединяющий три показателя.<em>Иллюстрация: Skillbox Media</em><p>Это уже простой OLAP-куб с тремя показателями. Его можно усложнять и дальше, добавляя новые метрики. Например, информацию о месторасположении недвижимости по районам города.</p>
26
<p><strong>Важно!</strong></p>
26
<p><strong>Важно!</strong></p>
27
<p>OLAP-кубы бывают разные. Некоторые из них хранят в себе и первичные данные, и результаты их предварительной обработки. А некоторые - только полученные после предварительного анализа агрегаты данных. При этом исходная информация хранится в связанных с кубом таблицах.</p>
27
<p>OLAP-кубы бывают разные. Некоторые из них хранят в себе и первичные данные, и результаты их предварительной обработки. А некоторые - только полученные после предварительного анализа агрегаты данных. При этом исходная информация хранится в связанных с кубом таблицах.</p>
28
<p>OLAP-куб используется для получения срезов данных по своим измерениям. Благодаря этому аналитик получает возможность не собирать информацию вручную из разрозненных таблиц, а обращаться только к одному источнику.</p>
28
<p>OLAP-куб используется для получения срезов данных по своим измерениям. Благодаря этому аналитик получает возможность не собирать информацию вручную из разрозненных таблиц, а обращаться только к одному источнику.</p>
29
<p>При этом такие срезы по разным показателям формируются автоматически при предварительной обработке данных. Это ускоряет выполнение запросов к хранилищу.</p>
29
<p>При этом такие срезы по разным показателям формируются автоматически при предварительной обработке данных. Это ускоряет выполнение запросов к хранилищу.</p>
30
<p>В OLAP-системах используют один из трёх вариантов хранения данных: MOLAP, ROLAP или HOLAP. Рассмотрим каждый из них.</p>
30
<p>В OLAP-системах используют один из трёх вариантов хранения данных: MOLAP, ROLAP или HOLAP. Рассмотрим каждый из них.</p>
31
<p><strong>MOLAP (multidimensional OLAP).</strong>Первичные данные и результат их обработки хранятся в виде классических OLAP-кубов, описанных в предыдущем разделе. Это самый быстрый метод из всех трёх - пользователь сразу извлекает по запросу любой срез хранящейся информации.</p>
31
<p><strong>MOLAP (multidimensional OLAP).</strong>Первичные данные и результат их обработки хранятся в виде классических OLAP-кубов, описанных в предыдущем разделе. Это самый быстрый метод из всех трёх - пользователь сразу извлекает по запросу любой срез хранящейся информации.</p>
32
<p>Но у подхода есть ограничение. Результат предварительной обработки данных - это таблицы, которые занимают большой объём памяти на сервере. Поэтому если первичной информации много, то MOLAP может не подойти.</p>
32
<p>Но у подхода есть ограничение. Результат предварительной обработки данных - это таблицы, которые занимают большой объём памяти на сервере. Поэтому если первичной информации много, то MOLAP может не подойти.</p>
33
<p><strong>ROLAP (relational OLAP)</strong> - исходные данные и результат их обработки хранятся в реляционных базах данных, а не в OLAP-кубе. Система проще по структуре, так как информация находится в обычных SQL-таблицах, но медленнее, чем MOLAP. Для получения каждого среза приходится отправлять несколько запросов к разным таблицам.</p>
33
<p><strong>ROLAP (relational OLAP)</strong> - исходные данные и результат их обработки хранятся в реляционных базах данных, а не в OLAP-кубе. Система проще по структуре, так как информация находится в обычных SQL-таблицах, но медленнее, чем MOLAP. Для получения каждого среза приходится отправлять несколько запросов к разным таблицам.</p>
34
<p><strong>HOLAP (hybrid OLAP)</strong> - гибридная схема, объединяющая MOLAP и ROLAP. Первичная информация хранится в реляционной БД, а результат её анализа - в многомерном кубе. Этот вариант применяется чаще всего, так как использует сильные стороны обоих подходов.</p>
34
<p><strong>HOLAP (hybrid OLAP)</strong> - гибридная схема, объединяющая MOLAP и ROLAP. Первичная информация хранится в реляционной БД, а результат её анализа - в многомерном кубе. Этот вариант применяется чаще всего, так как использует сильные стороны обоих подходов.</p>
35
<p>В любой OLAP-системе есть несколько компонентов: хранилище, ETL-инструменты, сервер и аналитические инструменты.</p>
35
<p>В любой OLAP-системе есть несколько компонентов: хранилище, ETL-инструменты, сервер и аналитические инструменты.</p>
36
<p><strong>Хранилище</strong>- место сбора и хранения данных, которые используются в анализе. В зависимости от принятой в компании системы - MOLAP, ROLAP или HOLAP - информация хранится в виде многомерных кубов, реляционных баз данных или в смешанном варианте.</p>
36
<p><strong>Хранилище</strong>- место сбора и хранения данных, которые используются в анализе. В зависимости от принятой в компании системы - MOLAP, ROLAP или HOLAP - информация хранится в виде многомерных кубов, реляционных баз данных или в смешанном варианте.</p>
37
<p><strong>ETL-инструменты (extract, transform, load)</strong>- набор средств извлечения, преобразования и загрузки данных в хранилище. Благодаря им информация собирается, предварительно обрабатывается и сохраняется в MOLAP, ROLAP или HOLAP для последующего анализа.</p>
37
<p><strong>ETL-инструменты (extract, transform, load)</strong>- набор средств извлечения, преобразования и загрузки данных в хранилище. Благодаря им информация собирается, предварительно обрабатывается и сохраняется в MOLAP, ROLAP или HOLAP для последующего анализа.</p>
38
<p><strong>Сервер</strong>управляет всей системой OLAP, а также извлекает с помощью ETL-методов информацию и обрабатывает её, формируя агрегаты данных.</p>
38
<p><strong>Сервер</strong>управляет всей системой OLAP, а также извлекает с помощью ETL-методов информацию и обрабатывает её, формируя агрегаты данных.</p>
39
<p><strong>Аналитические инструменты</strong>нужны для взаимодействия между пользователями и хранилищем. Например, они обрабатывают запрос аналитика и передают его в хранилище, получая ответ в нужном виде. К ним относят<a>Oracle Essbase</a>,<a>Microsoft SQL Server Analysis Services</a>,<a>ClickHouse от "Яндекса"</a>и другие системы.</p>
39
<p><strong>Аналитические инструменты</strong>нужны для взаимодействия между пользователями и хранилищем. Например, они обрабатывают запрос аналитика и передают его в хранилище, получая ответ в нужном виде. К ним относят<a>Oracle Essbase</a>,<a>Microsoft SQL Server Analysis Services</a>,<a>ClickHouse от "Яндекса"</a>и другие системы.</p>
40
<p>Популярность технологии оперативной обработки данных связана с её особенностями:</p>
40
<p>Популярность технологии оперативной обработки данных связана с её особенностями:</p>
41
<p><strong>Пользователь имеет неограниченный доступ к данным.</strong>Он может получить любую информацию в полном объёме в любой момент.</p>
41
<p><strong>Пользователь имеет неограниченный доступ к данным.</strong>Он может получить любую информацию в полном объёме в любой момент.</p>
42
<p><strong>Данные хранятся в одном месте</strong>, поэтому нет необходимости учитывать особенности работы с каждым отдельным хранилищем, настраивать их взаимодействие и вручную искать конкретную информацию.</p>
42
<p><strong>Данные хранятся в одном месте</strong>, поэтому нет необходимости учитывать особенности работы с каждым отдельным хранилищем, настраивать их взаимодействие и вручную искать конкретную информацию.</p>
43
<p><strong>Высокая скорость предоставления данных</strong>, так как они хранятся в предобработанном виде. Другие системы, где информация собирается из разных БД, требуют больше времени для формирования ответа на запрос.</p>
43
<p><strong>Высокая скорость предоставления данных</strong>, так как они хранятся в предобработанном виде. Другие системы, где информация собирается из разных БД, требуют больше времени для формирования ответа на запрос.</p>
44
<p><strong>Уровень детализации точно настраивается.</strong>Пользователь OLAP-системы сам определяет точность и глубину выдаваемых данных. Например, можно сделать обобщённый запрос о том, сколько всего было проведено сделок в компании за год. А можно добавить в него информацию о каждой конкретной сделке: дате, сумме, с кем она была проведена и так далее.</p>
44
<p><strong>Уровень детализации точно настраивается.</strong>Пользователь OLAP-системы сам определяет точность и глубину выдаваемых данных. Например, можно сделать обобщённый запрос о том, сколько всего было проведено сделок в компании за год. А можно добавить в него информацию о каждой конкретной сделке: дате, сумме, с кем она была проведена и так далее.</p>
45
<p>OLAP - это инструмент, используемый в Business Intelligence. Такие системы собирают информацию из разных источников, обрабатывают её и представляют в виде удобных отчётов.</p>
45
<p>OLAP - это инструмент, используемый в Business Intelligence. Такие системы собирают информацию из разных источников, обрабатывают её и представляют в виде удобных отчётов.</p>
46
<p>Что можно сделать с помощью OLAP:</p>
46
<p>Что можно сделать с помощью OLAP:</p>
47
<ul><li>изучить потребности клиентов и оценить востребованность товаров в онлайн-магазине;</li>
47
<ul><li>изучить потребности клиентов и оценить востребованность товаров в онлайн-магазине;</li>
48
<li>оценить эффективность логистики и оптимизировать маршруты;</li>
48
<li>оценить эффективность логистики и оптимизировать маршруты;</li>
49
<li>управлять ресурсами компании, находя свободные и предупреждая их дефицит с помощью изменений в закупках;</li>
49
<li>управлять ресурсами компании, находя свободные и предупреждая их дефицит с помощью изменений в закупках;</li>
50
<li>подготовить финансовые, товарные и другие виды отчётов;</li>
50
<li>подготовить финансовые, товарные и другие виды отчётов;</li>
51
<li>найти причины снижения выручки и прибыли, определить механизмы их устранения и так далее.</li>
51
<li>найти причины снижения выручки и прибыли, определить механизмы их устранения и так далее.</li>
52
</ul><p>Поэтому технология оперативной аналитической обработки данных используется для решения различных задач в:</p>
52
</ul><p>Поэтому технология оперативной аналитической обработки данных используется для решения различных задач в:</p>
53
<ul><li>складском учёте товаров;</li>
53
<ul><li>складском учёте товаров;</li>
54
<li>онлайн- и офлайн-продажах;</li>
54
<li>онлайн- и офлайн-продажах;</li>
55
<li>организации логистики товаров;</li>
55
<li>организации логистики товаров;</li>
56
<li>маркетинговых исследованиях;</li>
56
<li>маркетинговых исследованиях;</li>
57
<li>учёте качества обслуживания клиентов и других.</li>
57
<li>учёте качества обслуживания клиентов и других.</li>
58
</ul><p>Подведём итоги того, что мы сегодня узнали:</p>
58
</ul><p>Подведём итоги того, что мы сегодня узнали:</p>
59
<ul><li>OLAP (оперативная аналитическая обработка данных) - это BI-технология, позволяющая в режиме реального времени анализировать данные, полученные из разных источников.</li>
59
<ul><li>OLAP (оперативная аналитическая обработка данных) - это BI-технология, позволяющая в режиме реального времени анализировать данные, полученные из разных источников.</li>
60
<li>В её основе лежат OLAP-кубы - многомерные массивы данных, объединяющие в себе информацию из большого числа таблиц с её предварительной обработкой.</li>
60
<li>В её основе лежат OLAP-кубы - многомерные массивы данных, объединяющие в себе информацию из большого числа таблиц с её предварительной обработкой.</li>
61
<li>OLAP-системы используются в логистике, онлайн- и офлайн-продажах, работе с клиентами и других сферах, где требуется собирать и анализировать большой объём данных для поиска лучших бизнес-решений.</li>
61
<li>OLAP-системы используются в логистике, онлайн- и офлайн-продажах, работе с клиентами и других сферах, где требуется собирать и анализировать большой объём данных для поиска лучших бизнес-решений.</li>
62
</ul><p>Data Science с нуля: пробуем профессии на практике за 5 дней</p>
62
</ul><p>Data Science с нуля: пробуем профессии на практике за 5 дней</p>
63
<p>Вы разберётесь в трёх главных направлениях data science: машинном обучении, разработке на Python и визуализации данных. Решите, какая сфера вам ближе, и выполните 4 реальные задачи с данными.</p>
63
<p>Вы разберётесь в трёх главных направлениях data science: машинном обучении, разработке на Python и визуализации данных. Решите, какая сфера вам ближе, и выполните 4 реальные задачи с данными.</p>
64
<p><a>Пройти бесплатно</a></p>
64
<p><a>Пройти бесплатно</a></p>
65
<a><b>Попробуйте data science на бесплатном курсе</b>Пройдите курс по data science и изучите 3 направления в работе с данными. Решите, в какой сфере хотите развиваться дальше, и получите ценные подарки. Пройти курс →</a>
65
<a><b>Попробуйте data science на бесплатном курсе</b>Пройдите курс по data science и изучите 3 направления в работе с данными. Решите, в какой сфере хотите развиваться дальше, и получите ценные подарки. Пройти курс →</a>