HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-03-10
1 <ul><li><a>Определение</a></li>
1 <ul><li><a>Определение</a></li>
2 <li><a>Терминология</a></li>
2 <li><a>Терминология</a></li>
3 <li><a>Состав аналитики данных</a></li>
3 <li><a>Состав аналитики данных</a></li>
4 <li><a>Направления</a></li>
4 <li><a>Направления</a></li>
5 <li><a>Необходимые инструменты для работы</a><ul><li><a>Навыки и умения</a></li>
5 <li><a>Необходимые инструменты для работы</a><ul><li><a>Навыки и умения</a></li>
6 </ul></li>
6 </ul></li>
7 <li><a>Стажировка для аналитиков</a></li>
7 <li><a>Стажировка для аналитиков</a></li>
8 <li><a>Как освоить "науку"</a></li>
8 <li><a>Как освоить "науку"</a></li>
9 </ul><p>Данные - то, что нужно не только грамотно обрабатывать, но еще и собирать, а также хранить. С развитием информационных технологий люди стали задумываться над тем, каким образом справиться с поставленными задачами с максимальной эффективностью. Так появилось совершенно новое направление, которое называется Data Science.</p>
9 </ul><p>Данные - то, что нужно не только грамотно обрабатывать, но еще и собирать, а также хранить. С развитием информационных технологий люди стали задумываться над тем, каким образом справиться с поставленными задачами с максимальной эффективностью. Так появилось совершенно новое направление, которое называется Data Science.</p>
10 <p>Люди, решившие стать специалистами в соответствующей области сегодня высоко ценятся. Но не совсем понятно, кто это, а также чем занимаются подобные "ученые". В данной статье будет раскрыта тайна Дата Науки.</p>
10 <p>Люди, решившие стать специалистами в соответствующей области сегодня высоко ценятся. Но не совсем понятно, кто это, а также чем занимаются подобные "ученые". В данной статье будет раскрыта тайна Дата Науки.</p>
11 <h2>Определение</h2>
11 <h2>Определение</h2>
12 <p>Data Science - это анализ данных. Точнее, наука о реализации соответствующей задачи. Отвечает за охват сбора массивов информации структурированного и неструктурированного типа (Big Data), а также за их дальнейшее преобразование. Вследствие проводимых операций данные должны приобрести "человеческий" формат.</p>
12 <p>Data Science - это анализ данных. Точнее, наука о реализации соответствующей задачи. Отвечает за охват сбора массивов информации структурированного и неструктурированного типа (Big Data), а также за их дальнейшее преобразование. Вследствие проводимых операций данные должны приобрести "человеческий" формат.</p>
13 <p>Соответствующим термином описывают процесс работы с Биг Датами. Для работы используются машинные методы обучения, а также математическую статистику. Это - крайне важный момент для программирования, а также бизнеса и маркетинга.</p>
13 <p>Соответствующим термином описывают процесс работы с Биг Датами. Для работы используются машинные методы обучения, а также математическую статистику. Это - крайне важный момент для программирования, а также бизнеса и маркетинга.</p>
14 <h2>Терминология</h2>
14 <h2>Терминология</h2>
15 <p>Чтобы понять выбранное направление, требуется уточнить в первую очередь некоторые термины. Они крайне важны для будущего специалиста "по анализу больших данных". Вследствие работы будут встречаться повсеместно:</p>
15 <p>Чтобы понять выбранное направление, требуется уточнить в первую очередь некоторые термины. Они крайне важны для будущего специалиста "по анализу больших данных". Вследствие работы будут встречаться повсеместно:</p>
16 <ol><li>Искусственный интеллект - способ, при помощи которого машины учат "думать" и принимать те или иные решения. Применяется при персонализации, а также в двойниках и имитации человеческого мышления. Некий метод автоматизации принятия решений.</li>
16 <ol><li>Искусственный интеллект - способ, при помощи которого машины учат "думать" и принимать те или иные решения. Применяется при персонализации, а также в двойниках и имитации человеческого мышления. Некий метод автоматизации принятия решений.</li>
17 <li>Машинное обучение - процесс создания инструментов для того, чтобы из данных извлекать знания. Сюда относят: распознавание образов, рекомендательные системы, предиктивные алгоритмы, перевод графики в текст, синтез текстовых data.</li>
17 <li>Машинное обучение - процесс создания инструментов для того, чтобы из данных извлекать знания. Сюда относят: распознавание образов, рекомендательные системы, предиктивные алгоритмы, перевод графики в текст, синтез текстовых data.</li>
18 <li>Глубокое обучение - создание нейронных сетей многослойного типа в сферах, где требуется более быстрый и продвинутый анализ. В этом случае традиционное машинное обучение не справляется с поставленными задачами. Применяется в "масках" утилит, синтезе звука, голоса или картинок.</li>
18 <li>Глубокое обучение - создание нейронных сетей многослойного типа в сферах, где требуется более быстрый и продвинутый анализ. В этом случае традиционное машинное обучение не справляется с поставленными задачами. Применяется в "масках" утилит, синтезе звука, голоса или картинок.</li>
19 <li>BigData - большой объем информации разного вида. Совокупность подходов к невероятным по масштабам размеров неструктурированных материалов, которые поступают от источников постоянно и непредсказуемо.</li>
19 <li>BigData - большой объем информации разного вида. Совокупность подходов к невероятным по масштабам размеров неструктурированных материалов, которые поступают от источников постоянно и непредсказуемо.</li>
20 <li>Data Science - придание смысла и понимания электронным материалам, их обработка, способ найти полезное в общей неструктурированной массе. В процессе часто задействуются облачные вычисления, а также инструментарий для создания виртуальных сред разработки.</li>
20 <li>Data Science - придание смысла и понимания электронным материалам, их обработка, способ найти полезное в общей неструктурированной массе. В процессе часто задействуются облачные вычисления, а также инструментарий для создания виртуальных сред разработки.</li>
21 </ol><p>Стоит обратить внимание на то, что при рассмотрении выбранного направления могут пригодиться языки программирования, а также познания в сфере информационных технологий и IT. Специфика направления - системы и инструменты, которые могут выдерживать огромную (повышенную) нагрузку.</p>
21 </ol><p>Стоит обратить внимание на то, что при рассмотрении выбранного направления могут пригодиться языки программирования, а также познания в сфере информационных технологий и IT. Специфика направления - системы и инструменты, которые могут выдерживать огромную (повышенную) нагрузку.</p>
22 <h2>Состав аналитики данных</h2>
22 <h2>Состав аналитики данных</h2>
23 <p>Чтобы полноценно работать в "науке об информации", требуется выполнять определенные действий. Процесс аналитики включает в себя:</p>
23 <p>Чтобы полноценно работать в "науке об информации", требуется выполнять определенные действий. Процесс аналитики включает в себя:</p>
24 <ol><li>Сбор сведений. На этом этапе осуществляется поиск каналов, из которых будут получены материалы.</li>
24 <ol><li>Сбор сведений. На этом этапе осуществляется поиск каналов, из которых будут получены материалы.</li>
25 <li>Проверка.</li>
25 <li>Проверка.</li>
26 <li>Анализирование. Специалист должен изучить сведения, а также подтвердить имеющиеся гипотезы.</li>
26 <li>Анализирование. Специалист должен изучить сведения, а также подтвердить имеющиеся гипотезы.</li>
27 <li>Визуализация. Специалисту требуется изобразить полученные результаты так, чтобы они стали предельно простыми для человеческого понимания. Обычно для реализации поставленной задачи используют графики и диаграммы.</li>
27 <li>Визуализация. Специалисту требуется изобразить полученные результаты так, чтобы они стали предельно простыми для человеческого понимания. Обычно для реализации поставленной задачи используют графики и диаграммы.</li>
28 </ol><p>Завершающий этап - это действия. А именно - принятия решений, в основе которых лежат проанализированные материалы. Пример - корректировка маркетинговых стратегий при увеличении доходов.</p>
28 </ol><p>Завершающий этап - это действия. А именно - принятия решений, в основе которых лежат проанализированные материалы. Пример - корректировка маркетинговых стратегий при увеличении доходов.</p>
29 <h2>Направления</h2>
29 <h2>Направления</h2>
30 <p>Можно стать хорошим аналитиком лишь тогда, когда человек определится с областью, в которой работать. Сегодня знают несколько видов "ученых по данным". Их разделяют по уровню трансформации на:</p>
30 <p>Можно стать хорошим аналитиком лишь тогда, когда человек определится с областью, в которой работать. Сегодня знают несколько видов "ученых по данным". Их разделяют по уровню трансформации на:</p>
31 <ul><li>инженеров - работников, которые несут ответ за целостность и оптимизацию хранения;</li>
31 <ul><li>инженеров - работников, которые несут ответ за целостность и оптимизацию хранения;</li>
32 <li>разработчиков БД - отвечают за работоспособность и исправность баз информации;</li>
32 <li>разработчиков БД - отвечают за работоспособность и исправность баз информации;</li>
33 <li>архитекторов БД - занимаются проектировкой хранения баз.</li>
33 <li>архитекторов БД - занимаются проектировкой хранения баз.</li>
34 </ul><p>Также есть разделение по уровню обработки электронных сведений. Здесь имеет место следующее разделение на направления:</p>
34 </ul><p>Также есть разделение по уровню обработки электронных сведений. Здесь имеет место следующее разделение на направления:</p>
35 <ul><li>аналитик - проводит анализ метрик, реализовывает эксперименты, составляет те или иные прогнозы;</li>
35 <ul><li>аналитик - проводит анализ метрик, реализовывает эксперименты, составляет те или иные прогнозы;</li>
36 <li>дата-ученый - ведет разработку продукта, который основывается на полученные сведения;</li>
36 <li>дата-ученый - ведет разработку продукта, который основывается на полученные сведения;</li>
37 <li>BI-специалист - отвечает за визуализацию и интерактивные дашборды;</li>
37 <li>BI-специалист - отвечает за визуализацию и интерактивные дашборды;</li>
38 <li>ML-специалист - осуществляет разработку и несет ответственность за развитие data-driven продуктов.</li>
38 <li>ML-специалист - осуществляет разработку и несет ответственность за развитие data-driven продуктов.</li>
39 </ul><p>Последний "работник" - это своеобразный разработчик алгоритмов. Наиболее перспективное направление, но освоить его "с нуля" весьма проблематично. Стажер не сможет создать собственный качественный проект типа data драйвен без достаточного опыта.</p>
39 </ul><p>Последний "работник" - это своеобразный разработчик алгоритмов. Наиболее перспективное направление, но освоить его "с нуля" весьма проблематично. Стажер не сможет создать собственный качественный проект типа data драйвен без достаточного опыта.</p>
40 <h2>Необходимые инструменты для работы</h2>
40 <h2>Необходимые инструменты для работы</h2>
41 <p>Когда выбрана одна конкретная стезя в аналитике, стоит разобрать в том, какие инструменты могут пригодиться для дальнейшей работы. Мало обладать теоретическими знаниями. Без комп. программ и утилит обрабатывать сведения в электронном виде невозможно. Особенно тогда, когда речь идет о больших ее объемах.</p>
41 <p>Когда выбрана одна конкретная стезя в аналитике, стоит разобрать в том, какие инструменты могут пригодиться для дальнейшей работы. Мало обладать теоретическими знаниями. Без комп. программ и утилит обрабатывать сведения в электронном виде невозможно. Особенно тогда, когда речь идет о больших ее объемах.</p>
42 <p>Многое зависит от того, какой именно специалист приступает к работе. Ориентироваться можно на следующие советы:</p>
42 <p>Многое зависит от того, какой именно специалист приступает к работе. Ориентироваться можно на следующие советы:</p>
43 <ol><li>Все "ученые по обработке и аналитике материалов" должны разбираться в таблицах, СУБД, хранилищах, SQL и ETL.</li>
43 <ol><li>Все "ученые по обработке и аналитике материалов" должны разбираться в таблицах, СУБД, хранилищах, SQL и ETL.</li>
44 <li>BI-аналитик: инструментарий BI (Power BI, Tableau, OLAP, майнинг), SAS, R, Python, Knime, RapidMiner.</li>
44 <li>BI-аналитик: инструментарий BI (Power BI, Tableau, OLAP, майнинг), SAS, R, Python, Knime, RapidMiner.</li>
45 <li>Специалистам по данным и "ученым": библиотеки визуализации и проведения досконального анализа в R и Python, углубленное изучение майнинга, Docker, Airflow.</li>
45 <li>Специалистам по данным и "ученым": библиотеки визуализации и проведения досконального анализа в R и Python, углубленное изучение майнинга, Docker, Airflow.</li>
46 <li>Инженерам: углубленные познания в ETL-процессах, а также в процессах выстраивания пайплайна.</li>
46 <li>Инженерам: углубленные познания в ETL-процессах, а также в процессах выстраивания пайплайна.</li>
47 </ol><p>Также предстоит задуматься над тем, чтобы углубиться в программирование. Обязательно знать SQL, а также Python. В идеале дополнить соответствующий багаж Scala и Java.</p>
47 </ol><p>Также предстоит задуматься над тем, чтобы углубиться в программирование. Обязательно знать SQL, а также Python. В идеале дополнить соответствующий багаж Scala и Java.</p>
48 <p>В аналитике часто задействуются облачные платформы. Если потенциальный "ученый" хорошо в них разбирается, добиться успехов в карьере ему будет не слишком трудно. А еще рекомендуется изучить технологии обработки сведений в огромных объемах (Kafka, Hadoop, Spark).</p>
48 <p>В аналитике часто задействуются облачные платформы. Если потенциальный "ученый" хорошо в них разбирается, добиться успехов в карьере ему будет не слишком трудно. А еще рекомендуется изучить технологии обработки сведений в огромных объемах (Kafka, Hadoop, Spark).</p>
49 <h3>Навыки и умения</h3>
49 <h3>Навыки и умения</h3>
50 <p>Комп - не единственное, что должен освоить будущий "ученый по информации". Такой специалист обладает определенными навыками и умениями.</p>
50 <p>Комп - не единственное, что должен освоить будущий "ученый по информации". Такой специалист обладает определенными навыками и умениями.</p>
51 <p>Для более быстрого продвижения по карьерной лестнице, а также для того, чтобы стажировка не доставляла хлопот, человеку пригодятся следующие качества и навыки:</p>
51 <p>Для более быстрого продвижения по карьерной лестнице, а также для того, чтобы стажировка не доставляла хлопот, человеку пригодятся следующие качества и навыки:</p>
52 <ul><li>абстрактность мышления;</li>
52 <ul><li>абстрактность мышления;</li>
53 <li>наблюдательность;</li>
53 <li>наблюдательность;</li>
54 <li>наличие логики (чем больше она развита - тем лучше);</li>
54 <li>наличие логики (чем больше она развита - тем лучше);</li>
55 <li>высокий эмоциональный интеллект;</li>
55 <li>высокий эмоциональный интеллект;</li>
56 <li>умение работать в команде и конструктивно воспринимать критику;</li>
56 <li>умение работать в команде и конструктивно воспринимать критику;</li>
57 <li>усидчивость;</li>
57 <li>усидчивость;</li>
58 <li>навыки программирования;</li>
58 <li>навыки программирования;</li>
59 <li>способность быстро получать, преобразовывать, очищать и структурировать поступаемые сведения;</li>
59 <li>способность быстро получать, преобразовывать, очищать и структурировать поступаемые сведения;</li>
60 <li>умения создавать презентации, рисовать диаграммы;</li>
60 <li>умения создавать презентации, рисовать диаграммы;</li>
61 <li>проведение исследований и A/B-тестов;</li>
61 <li>проведение исследований и A/B-тестов;</li>
62 <li>спектр познаний в математических методах и основах статистики;</li>
62 <li>спектр познаний в математических методах и основах статистики;</li>
63 <li>способность создавать скетчи и разнообразные прототипы.</li>
63 <li>способность создавать скетчи и разнообразные прототипы.</li>
64 </ul><p>Также для работы потребуется мощный компьютер, но им обычно снабжает работодатель. В некоторых ситуациях Data Science предусматривает подключение суперкомпьютеров.</p>
64 </ul><p>Также для работы потребуется мощный компьютер, но им обычно снабжает работодатель. В некоторых ситуациях Data Science предусматривает подключение суперкомпьютеров.</p>
65 <h2>Стажировка для аналитиков</h2>
65 <h2>Стажировка для аналитиков</h2>
66 <p>У специалистов, заинтересованных в аналитике и машинном обучении есть возможность получить необходимы для карьерного роста знания. Для этого существует так называемая стажировка. Она носит названием SAS.</p>
66 <p>У специалистов, заинтересованных в аналитике и машинном обучении есть возможность получить необходимы для карьерного роста знания. Для этого существует так называемая стажировка. Она носит названием SAS.</p>
67 <p>Включает в себя:</p>
67 <p>Включает в себя:</p>
68 <ul><li>компьютерную лингвистику;</li>
68 <ul><li>компьютерную лингвистику;</li>
69 <li>майнинг;</li>
69 <li>майнинг;</li>
70 <li>разработку процессов интеграционного типа на SAS и Open Source;</li>
70 <li>разработку процессов интеграционного типа на SAS и Open Source;</li>
71 <li>потоковую обработку информации;</li>
71 <li>потоковую обработку информации;</li>
72 <li>кластеризацию;</li>
72 <li>кластеризацию;</li>
73 <li>визуализацию;</li>
73 <li>визуализацию;</li>
74 <li>составление прогнозов;</li>
74 <li>составление прогнозов;</li>
75 <li>исследование информации;</li>
75 <li>исследование информации;</li>
76 <li>участие в проектах майнинга;</li>
76 <li>участие в проектах майнинга;</li>
77 <li>back-end;</li>
77 <li>back-end;</li>
78 <li>front-end;</li>
78 <li>front-end;</li>
79 <li>создание предсказательных математических моделей.</li>
79 <li>создание предсказательных математических моделей.</li>
80 </ul><p>Для того, чтобы Data Science-специалист прошел соответствующую практику по аналитике данных, потребуется компьютер и доступ в интернет. Алгоритм действий будет следующим:</p>
80 </ul><p>Для того, чтобы Data Science-специалист прошел соответствующую практику по аналитике данных, потребуется компьютер и доступ в интернет. Алгоритм действий будет следующим:</p>
81 <ol><li>Подать заявку в электронном виде. Принимаются студенты бакалавриата (3-4 курс), а также магистратуры.</li>
81 <ol><li>Подать заявку в электронном виде. Принимаются студенты бакалавриата (3-4 курс), а также магистратуры.</li>
82 <li>Пройти тестирование. Это делается дистанционно.</li>
82 <li>Пройти тестирование. Это делается дистанционно.</li>
83 <li>Обучаться согласно установленной программе.</li>
83 <li>Обучаться согласно установленной программе.</li>
84 <li>Пройти собеседование и итоговое тестирование.</li>
84 <li>Пройти собеседование и итоговое тестирование.</li>
85 </ol><p>Пользователям, прошедшим обучение в Москве и других регионах, предоставляется помощь при трудоустройстве после успешного завершения стажировки SAS.</p>
85 </ol><p>Пользователям, прошедшим обучение в Москве и других регионах, предоставляется помощь при трудоустройстве после успешного завершения стажировки SAS.</p>
86 <h2>Как освоить "науку"</h2>
86 <h2>Как освоить "науку"</h2>
87 <p>Но предложенный вариант подходит уже для более-менее продвинутых кадров. Новичкам и тем, кто еще не пошел учиться в ВУЗ, подойдет другое решение поставленной задачи. Более быстрое и практичное.</p>
87 <p>Но предложенный вариант подходит уже для более-менее продвинутых кадров. Новичкам и тем, кто еще не пошел учиться в ВУЗ, подойдет другое решение поставленной задачи. Более быстрое и практичное.</p>
88 <p>Освоить Data Science в том или ином направлении можно дистанционно через компьютер, окончив соответствующие курсы. Они организовываются специальными образовательными центрами.</p>
88 <p>Освоить Data Science в том или ином направлении можно дистанционно через компьютер, окончив соответствующие курсы. Они организовываются специальными образовательными центрами.</p>
89 <p>Computer Centers предусматривают как дистанционные, так и очные. В конце обучения выдают сертификат, подтверждающий знания в соответствующей области по данным. Он оформляется бессрочно. Может пригодиться при дальнейшем обучении, а также при приеме на работу в выбранном направлении.</p>
89 <p>Computer Centers предусматривают как дистанционные, так и очные. В конце обучения выдают сертификат, подтверждающий знания в соответствующей области по данным. Он оформляется бессрочно. Может пригодиться при дальнейшем обучении, а также при приеме на работу в выбранном направлении.</p>
90 <p>Хотите стать профессионалом в области Data Science? Обратите внимание на специальную категорию курсов в Otus:<a>https://otus.ru/categories/data-science/</a>.</p>
90 <p>Хотите стать профессионалом в области Data Science? Обратите внимание на специальную категорию курсов в Otus:<a>https://otus.ru/categories/data-science/</a>.</p>
91  
91