Data Science: обучение, курс по аналитике данных на Python, учиться на платформе Слёрм
2026-02-19 21:00 Diff

Учим начинающих дата-сайентистов ориентироваться в ML для решения рабочих задач

введение в машинное обучение

Нетривиальной практики с реальными датасетами

Основные алгоритмы и задачи классического машинного обучения

Базовые подходы для построения нейронных сетей, фреймворк PyTorch для их написания

Основные библиотеки для анализа данных: numpy, scipy, pandas, matplotlib, scikit-learn

Применение машинного обучения в бизнес-задачах

Модель, прогнозирующая потребление электроэнергии

Модель кредитного скоринга, предсказывающая, вернёт ли клиент банка кредит

Свой проект, если спикеры подтвердят, что его можно реализовать в рамках курса

Разбираемся в математике, но не закапываемся в ней. Освоим уровень, нужный для понимания принципов решения ML-задач

Нетривиальная практика, основанная на бизнес-кейсах. Никаких надоевших задач про Титаник, только новые дата-сеты

Вопросы с собеседований. Даём такой материал, что после курса студент сможет претендовать на должность Junior Data Scientist

Нарастающая сложность. Делаем всё, чтобы процесс обучения был посильным для каждого

Короткие лекции с текстовыми расшифровками. Чтобы можно было с пользой проводить время за завтраком или в транспорте

Тем, кто хочет применять Data Science в текущих рабочих задачах

Тем, кто хочет получить профессию Data-сайентиста

Тем, кто работает в ML-команде, но не понимает на каком языке общаются коллеги

Владение Python или другим высокоуровневым языком: настройка рабочего окружения, базовый синтаксис, циклы, условия, основные структуры данных

Оценивать качество моделей с использованием метрик для задач регрессии и классификации, а также выбирать подходящие методы оценки для конкретных задач

Преобразовывать бизнес-задачи в задачи машинного обучения и выбирать алгоритмы для их решения

Работать с пропущенными данными и данными различных типов, применяя соответствующие методы обработки

Обучать и оптимизировать ML-модели с использованием Scikit-learn, XGBoost, LightGBM и CatBoost

Строить графики и визуальные представления данных для принятия решений

Применять алгоритмы kNN, Linear Regression, Logistic Regression, Clustering, Decision Trees, Gradient Boosting

Анализировать и визуализировать большие объёмы данных с помощью JupyterLab, NumPy, SciPy, Pandas, и Matplotlib

  • Суммарный опыт в области DS более 6 лет
  • Отвечал за разработку и запуск ML-проектов в Yandex, Sber, SberDevices, Лента
  • Опыт в индустрии: 6+ лет
  • Консультировал стартапы и крупные компании по разработке и использованию ML-based-сервисов
  • До этого разрабатывал рекомендательную систему VK Пульс
  • Сейчас руководит командой Поиска в Купер
  • Преподаватель курсов по ML и Python в МГУ, ВШЭ, VK Образование, OzonMasters, AI Masters

Реализовал IaC для AWX в enterprise

  • Суммарный опыт в области DS более 6 лет
  • Отвечал за разработку и запуск ML-проектов в Yandex, Sber, SberDevices, Лента
  • Консультировал стартапы и крупные компании по разработке и использованию ML-based-сервисов
  • Опыт в индустрии: 6+ лет
  • До этого разрабатывал рекомендательную систему VK Пульс
  • Сейчас руководит командой Поиска в СберМаркете
  • Преподаватель курсов по ML и Python в МГУ, ВШЭ, VK Образование, OzonMasters, AI Masters

1.1. Введение. Структура курса

1.2. Инструкции по работе с практическими заданиями

1.3. Цикл разработки модели и специалисты в сфере анализа данных

1.4. Настройка рабочего окружения

2.2. Качество данных и типы данных

2.3. Приемы анализа данных - сводные показатели

2.4. Приемы анализа данных - визуализация

Постановка задачи машинного обучения на примере KNN

3.2. Постановка задачи машинного обучения

3.3. Алгоритм k-ближайших соседей

3.4. Взвешенный алгоритм k-ближайших соседей

3.5. Виды расстояний и проблемы метода k-ближайших соседей

Валидация модели и подготовка данных

4.3. Подготовка данных. Пропущенные значения

4.4. Подготовка данных. Категориальные признаки

4.5. Подготовка данных. Численные признаки

Обучение с учителем — регрессия

5.3. Аналитическое решение

5.4. Алгоритм градиентного спуска

5.5. Регуляризация линейных моделей

5.6. Метрики качества регрессии

Обучение с учителем — классификация

6.1. Логистическая регрессия

6.2. Метрики качества классификации

6.3. Многоклассовая классификация

7.3. Ансамблирование алгоритмов. Bagging. Random Forest

8.1. Задача кластеризации

8.2. Задача понижения размерности

8.3. Быстрый поиск ближайших соседей

9.4. Оптимизация гиперпараметров

Введение в глубокое обучение (DL + CV)

11.2. Deep Learning. Математическая модель нейрона. Нейронная сеть

11.3. Обучение нейронных сетей. Оптимизаторы.

11.4. Нейронные сети на PyTorch

11.5. Computer vision. Машинное представление изображения. Операции с изображениями

11.6. Сверточная нейронная сеть (CNN)

11.7. Imagenet. Alexnet, VGG.

11.8. Глубокие сверточные сети, ResNet. Эффективные свертки, Inception

11.9. Сверточные нейронные сети в PyTorch. Transfer learning & fine-tuning

Введение в обработку текстов (NLP)

12.1. Примеры задач, решаемые NLP подходами

12.2. Классические методы NLP

12.3. Предобработка текстов

12.4. Word2Vec и FastText

12.7. Transfer Learning при работе с текстами

12.8. Классификация текстов

Введение в рекомендательные системы (RecSys)

13.2. Примеры рекомендательных систем

13.3. Постановка задач рекомендательных систем

13.4. Коллаборативная фильтрация. Memory based подход

13.5. Коллаборативная фильтрация. Матричные факторизации

13.6. Коллаборативная фильтрация. Линейные модели

13.7. Коллаборативная фильтрация. Нейросетевые модели

14.4. Пример дизайна - оптимизация маркетинга

14.5. Пример дизайна - прогноз спроса

Именной сертификат с индивидуальным номером получает студент, если:

  • прошёл 80% курса
  • принимал участие в решении практик, которые входят в курс
  • успешно сдал итоговый проект.

В случае, если студент изучил 80% курса, но не выполнил или не сдал финальное задание, вместо сертификата выдаётся свидетельство.

Видеоуроки, доступ 2 года

в рассрочку на 4 месяца или 35 000 ₽ единовременно

В 75% случаев обучение готова оплатить компания. Напишите нам, и мы поможем.

Курс за счёт работодателя

Предоставим все необходимые документы для получения вычета.

от 10 человек
специальные условия

Выгодно и быстро обучим целые команды. Единоразовое оформление и быстрый доступ к курсам.

Подарите своему сотруднику скидку или курс целиком. А мы упакуем ;)

Проверка домашних заданий

Поддержка от менторов и кураторов

Чат-группы в телеграм со спикерами

Онлайн-встречи со спикерами

Подарите своему сотруднику скидку или курс целиком. А мы упакуем ;)

Выгодно и быстро обучим целые команды. Единоразовое оформление и быстрый доступ к курсам.

Студентам видеокурсов доступна проверка от эксперта за дополнительную плату.

Для получения номерного сертификата достаточно успешно зачтённого финального проекта.

Стоимость:

  • проверка практического задания 3 000₽
  • проверка финального проекта 10 000₽
  • проверка финального проекта 10 000₽
  • проверка практического задания 3 000₽

только для физических лиц

Больше чем Pandas: библиотеки подготовки данных для ML-моделей

  • На что стоит обратить внимание для эффективной работы с данными
  • Форматы работы с данными и их особенности
  • Фреймворки: pandas, swifter, polars, dask и cudf

Data Scientist — это специалист в области ML, который умеет создавать модели машинного обучения. Публикуем записи с вебинара Слёрм, где даём подробное разъяснение по направлению

  • Кто такой Data Scientist?
  • Кто такой ML-инженер?