0 added
0 removed
Original
2026-01-01
Modified
2026-02-21
1
<p><a>#статьи</a></p>
1
<p><a>#статьи</a></p>
2
<ul><li>5 апр 2021</li>
2
<ul><li>5 апр 2021</li>
3
<li>0</li>
3
<li>0</li>
4
</ul><p>Если наука о данных кажется вам несложной - у вас недостаточно данных.</p>
4
</ul><p>Если наука о данных кажется вам несложной - у вас недостаточно данных.</p>
5
<p>Кандидат философских наук, специалист по математическому моделированию. Пишет про Data Science, AI и программирование на Python.</p>
5
<p>Кандидат философских наук, специалист по математическому моделированию. Пишет про Data Science, AI и программирование на Python.</p>
6
<p>Путь в Data Science в изложении блогеров, популяризаторов и энтузиастов часто напоминает набор сравнительно несложных трюков и приёмов. Сначала немного Python’а, затем дюжина функций из библиотеки Pandas, потом обучаем модель линейной регрессии, и - вуаля! Вы дата-сайентист.</p>
6
<p>Путь в Data Science в изложении блогеров, популяризаторов и энтузиастов часто напоминает набор сравнительно несложных трюков и приёмов. Сначала немного Python’а, затем дюжина функций из библиотеки Pandas, потом обучаем модель линейной регрессии, и - вуаля! Вы дата-сайентист.</p>
7
<p>Но коллективный опыт индустрии и здравый смысл подсказывают, что между падаваном, который владеет несколькими трюками, и хорошим дата-сайентистом - весьма приличная дистанция.</p>
7
<p>Но коллективный опыт индустрии и здравый смысл подсказывают, что между падаваном, который владеет несколькими трюками, и хорошим дата-сайентистом - весьма приличная дистанция.</p>
8
<p>В терминах классической педагогики изучение Data Science - это<em>сложная образовательная задача</em>, а сам Data Science -<em>сложный навык</em>. То есть он не сводится исключительно к сумме простых навыков - для его освоения нужны ещё три условия:</p>
8
<p>В терминах классической педагогики изучение Data Science - это<em>сложная образовательная задача</em>, а сам Data Science -<em>сложный навык</em>. То есть он не сводится исключительно к сумме простых навыков - для его освоения нужны ещё три условия:</p>
9
<ul><li><strong>Вспомогательные знания</strong>. Когда и в каких ситуациях применять те или иные простые навыки. Эти знания можно представить в виде эвристических схем "если - то - иначе". Чтобы описать сложный навык, понадобятся целые леса из таких схем.</li>
9
<ul><li><strong>Вспомогательные знания</strong>. Когда и в каких ситуациях применять те или иные простые навыки. Эти знания можно представить в виде эвристических схем "если - то - иначе". Чтобы описать сложный навык, понадобятся целые леса из таких схем.</li>
10
<li><strong>Процедурные знания</strong>. Объясняют, как именно применять навыки. Чаще всего это инструкции, руководства или чек-листы.</li>
10
<li><strong>Процедурные знания</strong>. Объясняют, как именно применять навыки. Чаще всего это инструкции, руководства или чек-листы.</li>
11
<li><strong>Практика отработки задач по частям</strong>. Помогает закрепить простые навыки не по отдельности, а в правильных сочетаниях и последовательностях - от небольших цепочек приёмов до законченных циклов действий.</li>
11
<li><strong>Практика отработки задач по частям</strong>. Помогает закрепить простые навыки не по отдельности, а в правильных сочетаниях и последовательностях - от небольших цепочек приёмов до законченных циклов действий.</li>
12
</ul><p>Если не забывать про все четыре компонента - три перечисленных плюс набор приёмов, - изучение Data Science будет более эффективным. Списки необходимых навыков и приёмов можно найти, например, в нашей<a>недавней статье</a>о карьерном пути дата-сайентиста.</p>
12
</ul><p>Если не забывать про все четыре компонента - три перечисленных плюс набор приёмов, - изучение Data Science будет более эффективным. Списки необходимых навыков и приёмов можно найти, например, в нашей<a>недавней статье</a>о карьерном пути дата-сайентиста.</p>
13
<p>Успешная работа в Data Science требует сплава знаний из программирования, статистики и консалтинга. Вот примеры задач, которые решает дата-сайентист:</p>
13
<p>Успешная работа в Data Science требует сплава знаний из программирования, статистики и консалтинга. Вот примеры задач, которые решает дата-сайентист:</p>
14
<ul><li>оценка потребностей заказчика;</li>
14
<ul><li>оценка потребностей заказчика;</li>
15
<li>отбор данных для анализа;</li>
15
<li>отбор данных для анализа;</li>
16
<li>загрузка данных в среду разработки;</li>
16
<li>загрузка данных в среду разработки;</li>
17
<li>удаление выбросов и обогащение данных;</li>
17
<li>удаление выбросов и обогащение данных;</li>
18
<li>выбор и настройка модели;</li>
18
<li>выбор и настройка модели;</li>
19
<li>интерпретация результатов работы модели.</li>
19
<li>интерпретация результатов работы модели.</li>
20
</ul><p>Настоящий специалист решает задачи согласованно и с учётом их взаимного влияния, а не по отдельности - "сферически в вакууме".</p>
20
</ul><p>Настоящий специалист решает задачи согласованно и с учётом их взаимного влияния, а не по отдельности - "сферически в вакууме".</p>
21
<p>Эти сложные взаимосвязи рабочих задач дата-сайентиста порождают цепочки верхнеуровневых вопросов. Например:</p>
21
<p>Эти сложные взаимосвязи рабочих задач дата-сайентиста порождают цепочки верхнеуровневых вопросов. Например:</p>
22
<ul><li>Как заполнить пропущенные значения в данных, исходя из особенностей бизнеса и потребностей заказчика?</li>
22
<ul><li>Как заполнить пропущенные значения в данных, исходя из особенностей бизнеса и потребностей заказчика?</li>
23
<li>Какие параметры выбрать у моделей, если пропущенные значения заполнены тем или иным способом?</li>
23
<li>Какие параметры выбрать у моделей, если пропущенные значения заполнены тем или иным способом?</li>
24
<li>Почему модель выдаёт странные результаты: я выбрал не те параметры, не разобрался в отрасли или просто не понял заказчика?</li>
24
<li>Почему модель выдаёт странные результаты: я выбрал не те параметры, не разобрался в отрасли или просто не понял заказчика?</li>
25
</ul><p>Традиционный подход - последовательно осваивать простые навыки, а в конце объединить их в один сложный. Такой метод помогает понять каждый шаг решения, но обычно игнорирует взаимосвязи между ними. Альтернатива - решать задачу целиком, учитывая взаимные и обратные связи между этапами. Звучит хорошо, но как это сделать?</p>
25
</ul><p>Традиционный подход - последовательно осваивать простые навыки, а в конце объединить их в один сложный. Такой метод помогает понять каждый шаг решения, но обычно игнорирует взаимосвязи между ними. Альтернатива - решать задачу целиком, учитывая взаимные и обратные связи между этапами. Звучит хорошо, но как это сделать?</p>
26
<p>Пол Хиемстра, преподаватель и практик Data Science,<a>даёт три совета</a>тем, кто хочет эффективно изучать науку о данных.</p>
26
<p>Пол Хиемстра, преподаватель и практик Data Science,<a>даёт три совета</a>тем, кто хочет эффективно изучать науку о данных.</p>
27
<p><strong>Работайте над проектами целиком</strong>. У начинающих дата-сайентистов обычно скромная роль, они отвечают за небольшие кусочки проекта. Эту проблему решает pet-проект, который можно делать параллельно с основной работой. Он поможет помнить о масштабе и не работать над разными этапами по отдельности. Конечно, придётся осваивать и точечные навыки (например, какую-нибудь Python-библиотеку), но потом сразу возвращайтесь к целой задаче.</p>
27
<p><strong>Работайте над проектами целиком</strong>. У начинающих дата-сайентистов обычно скромная роль, они отвечают за небольшие кусочки проекта. Эту проблему решает pet-проект, который можно делать параллельно с основной работой. Он поможет помнить о масштабе и не работать над разными этапами по отдельности. Конечно, придётся осваивать и точечные навыки (например, какую-нибудь Python-библиотеку), но потом сразу возвращайтесь к целой задаче.</p>
28
<p>Как сделать pet-проект: найдите<a>датасет из интересующей вас области</a>и проанализируйте его, например, по методологии<a>CRISP-DM</a>. Описывайте каждое своё действие, а главное - соединяйте шаги между собой. Для этого подойдут сервисы типа<a>Google Colab</a>и Jupyter Notebooks. Подробный отчёт о pet-проекте украсит ваше портфолио.</p>
28
<p>Как сделать pet-проект: найдите<a>датасет из интересующей вас области</a>и проанализируйте его, например, по методологии<a>CRISP-DM</a>. Описывайте каждое своё действие, а главное - соединяйте шаги между собой. Для этого подойдут сервисы типа<a>Google Colab</a>и Jupyter Notebooks. Подробный отчёт о pet-проекте украсит ваше портфолио.</p>
29
<p><strong>Найдите хорошего наставника</strong>. Обсуждать свою работу с опытным дата-сайентистом - хорошая практика. Так вы прокачаете метакогнитивные навыки, которые необходимы для быстрого разбора сложных проблем. В общении с наставником старайтесь фокусироваться на том,<em>как</em>вы решаете проблему - то есть на подходе и идеях, а не на самом решении (коде, модели, библиотеке). Вопросы "а как…" позволяют максимально раскрыть и перенять опыт.</p>
29
<p><strong>Найдите хорошего наставника</strong>. Обсуждать свою работу с опытным дата-сайентистом - хорошая практика. Так вы прокачаете метакогнитивные навыки, которые необходимы для быстрого разбора сложных проблем. В общении с наставником старайтесь фокусироваться на том,<em>как</em>вы решаете проблему - то есть на подходе и идеях, а не на самом решении (коде, модели, библиотеке). Вопросы "а как…" позволяют максимально раскрыть и перенять опыт.</p>
30
<p><strong>Найдите единомышленников</strong>. Объяснение своих решений другим людям, ответы на их вопросы - прекрасный способ лучше понять собственную работу. Помните незадачливого "препода" из анекдота, который на третий раз уже и сам понял, что говорит, а студенты так и не смогли? Так вот - это не просто шутка. А слушая решения других, пытайтесь в первую очередь выяснить,<em>почему</em>ваш собеседник сделал что-либо (например, выбрал конкретную модель).</p>
30
<p><strong>Найдите единомышленников</strong>. Объяснение своих решений другим людям, ответы на их вопросы - прекрасный способ лучше понять собственную работу. Помните незадачливого "препода" из анекдота, который на третий раз уже и сам понял, что говорит, а студенты так и не смогли? Так вот - это не просто шутка. А слушая решения других, пытайтесь в первую очередь выяснить,<em>почему</em>ваш собеседник сделал что-либо (например, выбрал конкретную модель).</p>
31
<p>Если помнить про целостный подход и четыре компонента обучения сложному навыку, получится не только брать лучшее из статей и блогов по Data Science, но и грамотно составлять собственные планы изучения конкретного сложного навыка. Как это сделать:</p>
31
<p>Если помнить про целостный подход и четыре компонента обучения сложному навыку, получится не только брать лучшее из статей и блогов по Data Science, но и грамотно составлять собственные планы изучения конкретного сложного навыка. Как это сделать:</p>
32
<ul><li>Составьте список необходимых простых навыков. Их несложно нагуглить.</li>
32
<ul><li>Составьте список необходимых простых навыков. Их несложно нагуглить.</li>
33
<li>Пропишите сценарии применения этих простых навыков в рамках сложного. Скорее всего, надо будет обратиться к специализированным блогам, форумам, книгам, подкастам.</li>
33
<li>Пропишите сценарии применения этих простых навыков в рамках сложного. Скорее всего, надо будет обратиться к специализированным блогам, форумам, книгам, подкастам.</li>
34
<li>Научитесь применять каждый навык изолированно, опираясь на инструкции, руководства и документацию. Как правило, их можно найти на официальных сайтах или в блогах разработчиков.</li>
34
<li>Научитесь применять каждый навык изолированно, опираясь на инструкции, руководства и документацию. Как правило, их можно найти на официальных сайтах или в блогах разработчиков.</li>
35
<li>Составьте серии задач с увеличением сложности, для решения которых каждый раз будет требоваться всё больше простых навыков. Поиск в интернете по фразе "<название навыка> + задачи" даст вам начальные ориентиры.</li>
35
<li>Составьте серии задач с увеличением сложности, для решения которых каждый раз будет требоваться всё больше простых навыков. Поиск в интернете по фразе "<название навыка> + задачи" даст вам начальные ориентиры.</li>
36
</ul><p>Когда составите список, посоветуйтесь с наставником или единомышленниками, чтобы понять, какие задачи стоит убрать, а каких не хватает.</p>
36
</ul><p>Когда составите список, посоветуйтесь с наставником или единомышленниками, чтобы понять, какие задачи стоит убрать, а каких не хватает.</p>
37
<p>Далее следуйте плану. А собранные материалы станут отличной основой для поста в блог, Telegram-канала, подкаста или видео - так вы поможете другим людям и повысите свой статус.</p>
37
<p>Далее следуйте плану. А собранные материалы станут отличной основой для поста в блог, Telegram-канала, подкаста или видео - так вы поможете другим людям и повысите свой статус.</p>
38
<a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>
38
<a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>