HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-21
1 <p><a>#статьи</a></p>
1 <p><a>#статьи</a></p>
2 <ul><li>27 фев 2024</li>
2 <ul><li>27 фев 2024</li>
3 <li>0</li>
3 <li>0</li>
4 </ul><p>Рассказываем об основах популярной технологии бизнес-аналитики.</p>
4 </ul><p>Рассказываем об основах популярной технологии бизнес-аналитики.</p>
5 <p>Иллюстрация: Оля Ежак для Skillbox Media</p>
5 <p>Иллюстрация: Оля Ежак для Skillbox Media</p>
6 <p>Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.</p>
6 <p>Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.</p>
7 <p>Хранилища данных можно разделить на три основных типа: SQL (реляционные), NoSQL (нереляционные) и OLAP. Они различаются между собой структурой хранения информации и областью применения.</p>
7 <p>Хранилища данных можно разделить на три основных типа: SQL (реляционные), NoSQL (нереляционные) и OLAP. Они различаются между собой структурой хранения информации и областью применения.</p>
8 <p>OLAP-системы используются реже всего. Но без них не обойтись, если компания планирует работать с аналитическими системами, постоянно обрабатывающими огромные объёмы данных - терабайты и петабайты информации.</p>
8 <p>OLAP-системы используются реже всего. Но без них не обойтись, если компания планирует работать с аналитическими системами, постоянно обрабатывающими огромные объёмы данных - терабайты и петабайты информации.</p>
9 <p><strong>Содержание</strong></p>
9 <p><strong>Содержание</strong></p>
10 <ul><li><a>Что такое OLAP-технология</a></li>
10 <ul><li><a>Что такое OLAP-технология</a></li>
11 <li><a>Как выглядят OLAP-кубы</a></li>
11 <li><a>Как выглядят OLAP-кубы</a></li>
12 <li><a>Какие подходы к хранению данных существуют</a></li>
12 <li><a>Какие подходы к хранению данных существуют</a></li>
13 <li><a>Из чего состоит OLAP-система</a></li>
13 <li><a>Из чего состоит OLAP-система</a></li>
14 <li><a>Какие преимущества есть у этого подхода</a></li>
14 <li><a>Какие преимущества есть у этого подхода</a></li>
15 <li><a>Где используется OLAP</a></li>
15 <li><a>Где используется OLAP</a></li>
16 </ul><p><strong>Оперативная аналитическая обработка данных (OLAP)</strong> - это технология, позволяющая в режиме реального времени получить определённый срез данных для их последующего анализа.</p>
16 </ul><p><strong>Оперативная аналитическая обработка данных (OLAP)</strong> - это технология, позволяющая в режиме реального времени получить определённый срез данных для их последующего анализа.</p>
17 <p>Звучит сложно, но давайте посмотрим на работу OLAP в жизни. Представим, что в агентстве недвижимости аналитикам необходимо оценить количество продаж и их доходность, чтобы выявить самые выгодные сделки за последний год. Благодаря этому они смогут понять, какие факторы влияют на стоимость недвижимости, а значит, и на прибыль компании, чтобы их оптимизировать.</p>
17 <p>Звучит сложно, но давайте посмотрим на работу OLAP в жизни. Представим, что в агентстве недвижимости аналитикам необходимо оценить количество продаж и их доходность, чтобы выявить самые выгодные сделки за последний год. Благодаря этому они смогут понять, какие факторы влияют на стоимость недвижимости, а значит, и на прибыль компании, чтобы их оптимизировать.</p>
18 <p>Выгружать данные вручную долго, так как информация о сделках и финансовые показатели компании хранятся в разных хранилищах. Аналитику придётся вручную доставать нужные данные и пытаться найти между ними взаимосвязи.</p>
18 <p>Выгружать данные вручную долго, так как информация о сделках и финансовые показатели компании хранятся в разных хранилищах. Аналитику придётся вручную доставать нужные данные и пытаться найти между ними взаимосвязи.</p>
19 <p>OLAP-системы автоматизируют этот процесс и могут работать с разными хранилищами, содержащими разные типы данных, формируя общую выгрузку с учётом заданных критериев. И это не всё. После выгрузки информацию можно визуализировать для отчёта или поиска взаимосвязей между показателями.</p>
19 <p>OLAP-системы автоматизируют этот процесс и могут работать с разными хранилищами, содержащими разные типы данных, формируя общую выгрузку с учётом заданных критериев. И это не всё. После выгрузки информацию можно визуализировать для отчёта или поиска взаимосвязей между показателями.</p>
20 <p>Всё это возможно благодаря способности OLAP преобразовывать данные в OLAP-кубы и работать с ними.</p>
20 <p>Всё это возможно благодаря способности OLAP преобразовывать данные в OLAP-кубы и работать с ними.</p>
21 <p>В OLAP-системах информация хранится либо в реляционных базах, либо в виде специальных многомерных OLAP-кубов. Причём исходные данные для построения последних могут браться из обычных БД.</p>
21 <p>В OLAP-системах информация хранится либо в реляционных базах, либо в виде специальных многомерных OLAP-кубов. Причём исходные данные для построения последних могут браться из обычных БД.</p>
22 <p><strong>OLAP-куб</strong> - это многомерный массив данных. Каждая его грань содержит информацию только по одному признаку.</p>
22 <p><strong>OLAP-куб</strong> - это многомерный массив данных. Каждая его грань содержит информацию только по одному признаку.</p>
23 <p>Разберём эту структуру на примере агентства недвижимости. Компания может хранить информацию о сделках в виде обычной таблицы с фамилиями риелторов и числом заключённых ими договоров. На выходе получаются привычные строки и столбцы:</p>
23 <p>Разберём эту структуру на примере агентства недвижимости. Компания может хранить информацию о сделках в виде обычной таблицы с фамилиями риелторов и числом заключённых ими договоров. На выходе получаются привычные строки и столбцы:</p>
24 Таблица с информацией о риелторах и числе их сделок.<em>Иллюстрация: Skillbox Media</em><p>Но представим, что мы хотим посмотреть на то, как сделки каждого риелтора разбиты по месяцам года. Добавим в схему третье измерение:</p>
24 Таблица с информацией о риелторах и числе их сделок.<em>Иллюстрация: Skillbox Media</em><p>Но представим, что мы хотим посмотреть на то, как сделки каждого риелтора разбиты по месяцам года. Добавим в схему третье измерение:</p>
25 OLAP-куб, объединяющий три показателя.<em>Иллюстрация: Skillbox Media</em><p>Это уже простой OLAP-куб с тремя показателями. Его можно усложнять и дальше, добавляя новые метрики. Например, информацию о месторасположении недвижимости по районам города.</p>
25 OLAP-куб, объединяющий три показателя.<em>Иллюстрация: Skillbox Media</em><p>Это уже простой OLAP-куб с тремя показателями. Его можно усложнять и дальше, добавляя новые метрики. Например, информацию о месторасположении недвижимости по районам города.</p>
26 <p><strong>Важно!</strong></p>
26 <p><strong>Важно!</strong></p>
27 <p>OLAP-кубы бывают разные. Некоторые из них хранят в себе и первичные данные, и результаты их предварительной обработки. А некоторые - только полученные после предварительного анализа агрегаты данных. При этом исходная информация хранится в связанных с кубом таблицах.</p>
27 <p>OLAP-кубы бывают разные. Некоторые из них хранят в себе и первичные данные, и результаты их предварительной обработки. А некоторые - только полученные после предварительного анализа агрегаты данных. При этом исходная информация хранится в связанных с кубом таблицах.</p>
28 <p>OLAP-куб используется для получения срезов данных по своим измерениям. Благодаря этому аналитик получает возможность не собирать информацию вручную из разрозненных таблиц, а обращаться только к одному источнику.</p>
28 <p>OLAP-куб используется для получения срезов данных по своим измерениям. Благодаря этому аналитик получает возможность не собирать информацию вручную из разрозненных таблиц, а обращаться только к одному источнику.</p>
29 <p>При этом такие срезы по разным показателям формируются автоматически при предварительной обработке данных. Это ускоряет выполнение запросов к хранилищу.</p>
29 <p>При этом такие срезы по разным показателям формируются автоматически при предварительной обработке данных. Это ускоряет выполнение запросов к хранилищу.</p>
30 <p>В OLAP-системах используют один из трёх вариантов хранения данных: MOLAP, ROLAP или HOLAP. Рассмотрим каждый из них.</p>
30 <p>В OLAP-системах используют один из трёх вариантов хранения данных: MOLAP, ROLAP или HOLAP. Рассмотрим каждый из них.</p>
31 <p><strong>MOLAP (multidimensional OLAP).</strong>Первичные данные и результат их обработки хранятся в виде классических OLAP-кубов, описанных в предыдущем разделе. Это самый быстрый метод из всех трёх - пользователь сразу извлекает по запросу любой срез хранящейся информации.</p>
31 <p><strong>MOLAP (multidimensional OLAP).</strong>Первичные данные и результат их обработки хранятся в виде классических OLAP-кубов, описанных в предыдущем разделе. Это самый быстрый метод из всех трёх - пользователь сразу извлекает по запросу любой срез хранящейся информации.</p>
32 <p>Но у подхода есть ограничение. Результат предварительной обработки данных - это таблицы, которые занимают большой объём памяти на сервере. Поэтому если первичной информации много, то MOLAP может не подойти.</p>
32 <p>Но у подхода есть ограничение. Результат предварительной обработки данных - это таблицы, которые занимают большой объём памяти на сервере. Поэтому если первичной информации много, то MOLAP может не подойти.</p>
33 <p><strong>ROLAP (relational OLAP)</strong> - исходные данные и результат их обработки хранятся в реляционных базах данных, а не в OLAP-кубе. Система проще по структуре, так как информация находится в обычных SQL-таблицах, но медленнее, чем MOLAP. Для получения каждого среза приходится отправлять несколько запросов к разным таблицам.</p>
33 <p><strong>ROLAP (relational OLAP)</strong> - исходные данные и результат их обработки хранятся в реляционных базах данных, а не в OLAP-кубе. Система проще по структуре, так как информация находится в обычных SQL-таблицах, но медленнее, чем MOLAP. Для получения каждого среза приходится отправлять несколько запросов к разным таблицам.</p>
34 <p><strong>HOLAP (hybrid OLAP)</strong> - гибридная схема, объединяющая MOLAP и ROLAP. Первичная информация хранится в реляционной БД, а результат её анализа - в многомерном кубе. Этот вариант применяется чаще всего, так как использует сильные стороны обоих подходов.</p>
34 <p><strong>HOLAP (hybrid OLAP)</strong> - гибридная схема, объединяющая MOLAP и ROLAP. Первичная информация хранится в реляционной БД, а результат её анализа - в многомерном кубе. Этот вариант применяется чаще всего, так как использует сильные стороны обоих подходов.</p>
35 <p>В любой OLAP-системе есть несколько компонентов: хранилище, ETL-инструменты, сервер и аналитические инструменты.</p>
35 <p>В любой OLAP-системе есть несколько компонентов: хранилище, ETL-инструменты, сервер и аналитические инструменты.</p>
36 <p><strong>Хранилище</strong>- место сбора и хранения данных, которые используются в анализе. В зависимости от принятой в компании системы - MOLAP, ROLAP или HOLAP - информация хранится в виде многомерных кубов, реляционных баз данных или в смешанном варианте.</p>
36 <p><strong>Хранилище</strong>- место сбора и хранения данных, которые используются в анализе. В зависимости от принятой в компании системы - MOLAP, ROLAP или HOLAP - информация хранится в виде многомерных кубов, реляционных баз данных или в смешанном варианте.</p>
37 <p><strong>ETL-инструменты (extract, transform, load)</strong>- набор средств извлечения, преобразования и загрузки данных в хранилище. Благодаря им информация собирается, предварительно обрабатывается и сохраняется в MOLAP, ROLAP или HOLAP для последующего анализа.</p>
37 <p><strong>ETL-инструменты (extract, transform, load)</strong>- набор средств извлечения, преобразования и загрузки данных в хранилище. Благодаря им информация собирается, предварительно обрабатывается и сохраняется в MOLAP, ROLAP или HOLAP для последующего анализа.</p>
38 <p><strong>Сервер</strong>управляет всей системой OLAP, а также извлекает с помощью ETL-методов информацию и обрабатывает её, формируя агрегаты данных.</p>
38 <p><strong>Сервер</strong>управляет всей системой OLAP, а также извлекает с помощью ETL-методов информацию и обрабатывает её, формируя агрегаты данных.</p>
39 <p><strong>Аналитические инструменты</strong>нужны для взаимодействия между пользователями и хранилищем. Например, они обрабатывают запрос аналитика и передают его в хранилище, получая ответ в нужном виде. К ним относят<a>Oracle Essbase</a>,<a>Microsoft SQL Server Analysis Services</a>,<a>ClickHouse от "Яндекса"</a>и другие системы.</p>
39 <p><strong>Аналитические инструменты</strong>нужны для взаимодействия между пользователями и хранилищем. Например, они обрабатывают запрос аналитика и передают его в хранилище, получая ответ в нужном виде. К ним относят<a>Oracle Essbase</a>,<a>Microsoft SQL Server Analysis Services</a>,<a>ClickHouse от "Яндекса"</a>и другие системы.</p>
40 <p>Популярность технологии оперативной обработки данных связана с её особенностями:</p>
40 <p>Популярность технологии оперативной обработки данных связана с её особенностями:</p>
41 <p><strong>Пользователь имеет неограниченный доступ к данным.</strong>Он может получить любую информацию в полном объёме в любой момент.</p>
41 <p><strong>Пользователь имеет неограниченный доступ к данным.</strong>Он может получить любую информацию в полном объёме в любой момент.</p>
42 <p><strong>Данные хранятся в одном месте</strong>, поэтому нет необходимости учитывать особенности работы с каждым отдельным хранилищем, настраивать их взаимодействие и вручную искать конкретную информацию.</p>
42 <p><strong>Данные хранятся в одном месте</strong>, поэтому нет необходимости учитывать особенности работы с каждым отдельным хранилищем, настраивать их взаимодействие и вручную искать конкретную информацию.</p>
43 <p><strong>Высокая скорость предоставления данных</strong>, так как они хранятся в предобработанном виде. Другие системы, где информация собирается из разных БД, требуют больше времени для формирования ответа на запрос.</p>
43 <p><strong>Высокая скорость предоставления данных</strong>, так как они хранятся в предобработанном виде. Другие системы, где информация собирается из разных БД, требуют больше времени для формирования ответа на запрос.</p>
44 <p><strong>Уровень детализации точно настраивается.</strong>Пользователь OLAP-системы сам определяет точность и глубину выдаваемых данных. Например, можно сделать обобщённый запрос о том, сколько всего было проведено сделок в компании за год. А можно добавить в него информацию о каждой конкретной сделке: дате, сумме, с кем она была проведена и так далее.</p>
44 <p><strong>Уровень детализации точно настраивается.</strong>Пользователь OLAP-системы сам определяет точность и глубину выдаваемых данных. Например, можно сделать обобщённый запрос о том, сколько всего было проведено сделок в компании за год. А можно добавить в него информацию о каждой конкретной сделке: дате, сумме, с кем она была проведена и так далее.</p>
45 <p>OLAP - это инструмент, используемый в Business Intelligence. Такие системы собирают информацию из разных источников, обрабатывают её и представляют в виде удобных отчётов.</p>
45 <p>OLAP - это инструмент, используемый в Business Intelligence. Такие системы собирают информацию из разных источников, обрабатывают её и представляют в виде удобных отчётов.</p>
46 <p>Что можно сделать с помощью OLAP:</p>
46 <p>Что можно сделать с помощью OLAP:</p>
47 <ul><li>изучить потребности клиентов и оценить востребованность товаров в онлайн-магазине;</li>
47 <ul><li>изучить потребности клиентов и оценить востребованность товаров в онлайн-магазине;</li>
48 <li>оценить эффективность логистики и оптимизировать маршруты;</li>
48 <li>оценить эффективность логистики и оптимизировать маршруты;</li>
49 <li>управлять ресурсами компании, находя свободные и предупреждая их дефицит с помощью изменений в закупках;</li>
49 <li>управлять ресурсами компании, находя свободные и предупреждая их дефицит с помощью изменений в закупках;</li>
50 <li>подготовить финансовые, товарные и другие виды отчётов;</li>
50 <li>подготовить финансовые, товарные и другие виды отчётов;</li>
51 <li>найти причины снижения выручки и прибыли, определить механизмы их устранения и так далее.</li>
51 <li>найти причины снижения выручки и прибыли, определить механизмы их устранения и так далее.</li>
52 </ul><p>Поэтому технология оперативной аналитической обработки данных используется для решения различных задач в:</p>
52 </ul><p>Поэтому технология оперативной аналитической обработки данных используется для решения различных задач в:</p>
53 <ul><li>складском учёте товаров;</li>
53 <ul><li>складском учёте товаров;</li>
54 <li>онлайн- и офлайн-продажах;</li>
54 <li>онлайн- и офлайн-продажах;</li>
55 <li>организации логистики товаров;</li>
55 <li>организации логистики товаров;</li>
56 <li>маркетинговых исследованиях;</li>
56 <li>маркетинговых исследованиях;</li>
57 <li>учёте качества обслуживания клиентов и других.</li>
57 <li>учёте качества обслуживания клиентов и других.</li>
58 </ul><p>Подведём итоги того, что мы сегодня узнали:</p>
58 </ul><p>Подведём итоги того, что мы сегодня узнали:</p>
59 <ul><li>OLAP (оперативная аналитическая обработка данных) - это BI-технология, позволяющая в режиме реального времени анализировать данные, полученные из разных источников.</li>
59 <ul><li>OLAP (оперативная аналитическая обработка данных) - это BI-технология, позволяющая в режиме реального времени анализировать данные, полученные из разных источников.</li>
60 <li>В её основе лежат OLAP-кубы - многомерные массивы данных, объединяющие в себе информацию из большого числа таблиц с её предварительной обработкой.</li>
60 <li>В её основе лежат OLAP-кубы - многомерные массивы данных, объединяющие в себе информацию из большого числа таблиц с её предварительной обработкой.</li>
61 <li>OLAP-системы используются в логистике, онлайн- и офлайн-продажах, работе с клиентами и других сферах, где требуется собирать и анализировать большой объём данных для поиска лучших бизнес-решений.</li>
61 <li>OLAP-системы используются в логистике, онлайн- и офлайн-продажах, работе с клиентами и других сферах, где требуется собирать и анализировать большой объём данных для поиска лучших бизнес-решений.</li>
62 </ul><p>Data Science с нуля: пробуем профессии на практике за 5 дней</p>
62 </ul><p>Data Science с нуля: пробуем профессии на практике за 5 дней</p>
63 <p>Вы разберётесь в трёх главных направлениях data science: машинном обучении, разработке на Python и визуализации данных. Решите, какая сфера вам ближе, и выполните 4 реальные задачи с данными.</p>
63 <p>Вы разберётесь в трёх главных направлениях data science: машинном обучении, разработке на Python и визуализации данных. Решите, какая сфера вам ближе, и выполните 4 реальные задачи с данными.</p>
64 <p><a>Пройти бесплатно</a></p>
64 <p><a>Пройти бесплатно</a></p>
65 <a><b>Попробуйте data science на бесплатном курсе</b>Пройдите курс по data science и изучите 3 направления в работе с данными. Решите, в какой сфере хотите развиваться дальше, и получите ценные подарки. Пройти курс →</a>
65 <a><b>Попробуйте data science на бесплатном курсе</b>Пройдите курс по data science и изучите 3 направления в работе с данными. Решите, в какой сфере хотите развиваться дальше, и получите ценные подарки. Пройти курс →</a>