Rivalry2

HTML Diff

0 added 0 removed

Original 2026-01-01

Modified 2026-03-10

1 <ul><li><a>Pandas - это…</a><ul><li><a>Сферы применения</a></li>

2 <li><a>Установка</a></li>

3 </ul></li>

4 <li><a>Структуры данных</a><ul><li><a>Series</a></li>

5 <li><a>Panel</a></li>

6 </ul></li>

7 <li><a>DataFrame - основной компонент</a></li>

8 <li><a>Импорт информации</a></li>

9 <li><a>Методы для статистического анализа</a></li>

10 <li><a>Как создать DataFrame - обзор методов</a><ul><li><a>Пустой фрейм</a><ul><li><a>Добавление столбцов</a></li>

11 </ul></li>

12 <li><a>При помощи словаря</a></li>

13 <li><a>Из массива</a></li>

14 <li><a>Список словарей</a></li>

15 <li><a>Массив NumPy</a></li>

16 <li><a>Из CSV-документа</a></li>

17 <li><a>Из буфера обмена</a></li>

18 <li><a>HTML-документ или веб-страница</a></li>

19 <li><a>Из Excel</a></li>

20 <li><a>Из JSON</a></li>

21 <li><a>Из SQL-базы</a></li>

22 </ul></li>

23 </ul>Python часто используется для машинного обучения, а также анализа данных. Для этого к языку программирования подключаются различные библиотеки: NumPy, Matplotlib, TensorFlow и так далее. Каждому, кто планирует заниматься BigData и анализом информации, рекомендуется обратить внимание на Pandas. Это функциональный инструмент для Питона, который поможет работать с данными и обрабатывать их.

24 Далее предстоит получше изучить библиотеку Pandas, а также один из ее важнейших компонентов - DataFrame. Предложенные ниже сведения ориентированы в большей степени на разработчиков с опытом.

25 The Pandas - основная библиотека Питона, предназначенная для работы с информацией и ее большими объемами. Активно применяется в аналитике и BigData. The Pandas была создана в 2008 году. С тех пор она стремительно развивается и совершенствуется. Изначально библиотека распространялась компанией AQR Capital, но через код соответствующее "программное обеспечение" получило открытый исходный код.

26 <h3>Сферы применения</h3>

27 Перед изучением Pandas Dataframe, необходимо понять, где вообще применяется рассматриваемая библиотека. Ключевых областей использования несколько:

28 <ol><li>Аналитика информации: маркетинг, продуктовый анализ и другое. Рассматриваемый "пакет решений" для Python позволяет анализировать информацию и подготавливать ее. Некоторые процессы за счет встроенных инструментов могут быть автоматизированы.</li>

29 <li>BigData и Data Science. При помощи Пандас разработчики и аналитики смогут подготовить, а также организовать первичный анализ BigData для дальнейшего применения в глубоком/машинном обучении.</li>

30 <li>Статистика. В библиотеке поддерживаются ключевые статистические методы, которые позволяют оперировать информацией. Примеры - распределение значений по квинтилям, расчет средних параметров.</li>

31 </ol>Большинство разработчиков, если они не углубляются в обозначенные области, могут не изучать the Python and the DataFrame Pandas. Остальным соответствующая библиотека покажется полезной, особенно если знать, как ей управлять.

32 <h3>Установка</h3>

33 Перед изучением структур информации в изучаемой библиотеке, а также способов создания for dataframe in Python, необходимо сначала установить рассматриваемый "фреймворк" на устройство. Если разработчик пользуется the Jupyter Notebook и Colab, ничего дополнительно ставить не придется. Пандас является стандартной библиотекой. Она доступна сразу после запуска Colab или Jupyter Notebook. Все, что останется разработчику - это импортировать библиотеку в имеющийся исходный код будущей программы:

34 import pandas as pd

35 PD - сокращение, которое является общепринятым у разработчиков на Питоне. Оно используется для обозначения библиотеки Пандас. Вместе с таким обозначением не придется каждый раз писать длинное "pandas" в исходном коде.

36 <h2>Структуры данных</h2>

37 The Pandas Dataframe - это одна из самых значимых структурных единиц библиотеки. Для грамотного управления и создания соответствующего объекта, каждый разработчик должен понимать структуру информации и Пандас.

38 Всего "фреймворк" поддерживает три вида структур данных:

39 <ul><li>series - одномерный массив неизменного размера;</li>

40 <li>the data frame - двумерная табличная структура с изменяемыми размерами и неоднородно типизированными столбцами;</li>

41 <li>panel - трехмерный массив, поддерживающий изменение размерности.</li>

42 </ul>Далее каждая представленная единица будет рассмотрена более подробно. Особое внимание будет уделено the data frame (датафрейм) и принципам его создания.

43 <h3>Series</h3>

44 Series (или "серии") - объект рассматриваемом библиотеки, который создан для представления одномерных структурных единиц. Они напоминают массивы, но имеют дополнительные возможности.

45 Структура a Series отличается of the DataFrame и является более простой. Включает в себя два массива:

46 <ul><li>основной - тот, что содержит информацию (любого типа NumPy);</li>

47 <li>дополнительный (the index) - включает в себя метки.</li>

48 </ul>Проще всего the Series может быть представлен как столбец таблицы, включающий в себя некоторую последовательность значений. Каждый компонент имеет индекс - номер соответствующей строки.

49 Вот так создается простой Series:

50 После обработки соответствующего фрагмента на экране появится следующий результат:

51 The Series будет отображаться как таблица с индексами элементов в первом столбце и с присваиваемыми значениями - во втором.

52 <h3>Panel</h3>

53 Изучая the Pandas (pd) dataframe, не нужно забывать о других структурных единицах библиотеки - без них полноценно пользоваться продуктом Питона не получится. Не самым распространенным, но встречающимся в разработке компонентом является Panel.

54 The Panel - это второй тип структур данных. Он является более сложным компонентом, чем Series и Pandas (pd) dataframe. Panel представляет собой панель с трехмерной структурой. Она включает в себя три оси для выполнения различных функций:

55 <ol><li>Items - ось 0. Каждый его компонент будет соответствовать the Dataframe в нем.</li>

56 <li>Major_axis - ось 1. Здесь наблюдается соответствие строкам каждого the Data Frame.</li>

57 <li>Minor_axis - ось 2. Соответствует Dataframe-columns.</li>

58 </ol>Выше можно увидеть наглядный синтаксис, при помощи которого разработчик сможет создать Panel в Пандас.

59 <h2>DataFrame - основной компонент</h2>

60 Pandas Dataframe - наиболее распространенный элемент изучаемой библиотеки. Он используется для создания основного количества баз информации. Представляет собой двумерную структуру, которая напоминает массивы. Входные данные в датафрейм оформляются как строки и столбцы.

61 Размер структуры Pandas Dataframe разрешено менять. Соответствующий компонент служит стандартным способом хранения информации. Он формирует базу по типу таблицы-SQL или любой другой таблицы (a table).

62 The Data фрейм может быть с жестко закодированными данными. Информация поддерживает импорт в CSV или TSV, а также Excel-документ, SQL-таблицу и не только.

63 Dataframe Data имеет следующий синтаксис:

64 Здесь:

65 <ol><li>Input_data - ввод. Он может принимать списки, массивы, ряды и иные структурные дата единицы.</li>

66 <li>Index value - значения индекса. Они будут передаваться в dataframe.</li>

67 <li>Data type или dtype - функция, которая распознает тип используемой информации для dataframe-columns.</li>

68 <li>Copy - копирование. Значение по умолчанию для соответствующего параметра - false (ложь, неверно).</li>

69 </ol>Столбцы - это метки данных столбцов. Создавать дата фреймы можно несколькими способами. О них будет рассказано позже. Эта информация пригодится как новичкам, так и более опытным разработчикам.

70 <h2>Импорт информации</h2>

71 Изучая pandas dataframe, разработчику необходимо не только познакомиться с объектом (object) датафрейм, но и освоить принципы применения рассматриваемой библиотеки. Без соответствующих навыков программист не сможет оперировать информацией и правильно использовать ее на практике.

72 Изучаемый "фреймворк" поддерживает несколько способов импорта (importing) данных. Пример - считывание из словаря (a dictionary), списка или кортежа. Наиболее распространенный вариант - использование csv-документов. Они чаще всего применяются при анализе данных. Для импорта используется команда: pd.read_csv. Для оперирования импортирования the dataframe or series, поддерживаются два параметра:

73 <ol><li>Sep. С его помощью разработчик сможет явно указать разделитель, используемый в импортированном документе. По умолчанию соответствующее значение - это символ запятой. Он используется в качестве "стандартного" разделителя в csv-документах. Sep будет особо полезен тогда, когда в исходном файле изначально применяются нестандартные разделяющие символы. Примеры - точки с запятыми или табуляция.</li>

74 <li>Dtypes. Этот параметр дает возможность явно указать тип данный columns in csv-документ. Параметр поможет в ситуациях, когда в исходном файле автоматическое определение задействованного формата неверное. Пример - дата часто импортируется в качестве строковых переменных, несмотря на наличие отдельного типа для подобных сведений.</li>

75 </ol>Стоит обратить внимание на то, что при работе в Google Colab или Jupyter Notebook для вывода Dataframe data или Series на дисплей устройства не нужно использовать команду print. Пандас умеет отображать сведения без нее. При формировании a function print(df), табличная верстка будет утрачена.

76 <h2>Методы для статистического анализа</h2>

77 A dataframe from Pandas (pd) часто используется для того, чтобы анализировать различные массивы данных. Для нормализации работы с библиотекой разработчикам приходится применять встроенные методы. Они дают возможность быстро и качественно выполнять аналитические операции.

78 В Pandas очень много разнообразных методов для анализа data (дата). Далее представлены наиболее распространенные из них:

79 Что за метод (название)ОписаниеCountПодсчет всех непустых наблюдений. На выходе система передаст количество соответствующих компонентов.MeanВозврат среднего значения всех элементовSumСумма всех компонентов данныхMedianПолучение медианного параметраModeОтвечает за возврат режа всех информационных компонентовStdСтандартное отклонениеMinМинимальный компонент среди всех входных информационных единицMaxМаксимальный элемент среди всех входныхProdПроизведение имеющихся значений данныхAbsАбсолютное значениеCumprodСовокупное произведение значенийCumsumКумулятивная суммаDescribeОтображение статистической сводки всех записей за один снимок (сумма, количество, минимумы и максимумы, средние значения и так далее).Таблица, представленная выше, поможет быстрее анализировать in the dataframe data, а также управлять соответствующими сведениями. Это не все методы, которые используются библиотекой, но они встречаются в разработке и аналитике чаще остальных.

80 <h2>Как создать DataFrame - обзор методов</h2>

81 Структура the dataframe of PD - это rows and columns (строки и столбцы). Лучше всего представлять соответствующий компонент в виде "стандартной" таблицы, которая заполнена различными материалами. Существуют различные способы создания (creating) дата фреймов. Они могут быть сформированы на базе:

82 <ul><li>других дата frames;</li>

83 <li>структурные единиц типа Series;</li>

84 <li>структурированных ndarray;</li>

85 <li>двумерных ndarray;</li>

86 <li>словарей, в качестве элементов которого выступают списки, одномерные массивы (array), другие словари и Series.</li>

87 </ul>Далее предстоит познакомиться с (with the) различными методами формирования Pandas a Dataframe-columns и the rows. Предложенные ниже концепции являются универсальными. Они помогут разработчикам быстро ориентироваться в оптимальном решении для конкретного анализа и приложения.

88 <h3>Пустой фрейм</h3>

89 Программист может создать (creation) пустой frame. Это "стандартный" случай, для которого не потребуется никаких дополнительных знаний. Для формирования пустого информационного фрейма достаточно воспользоваться вызовом стандартного конструктора:

90 # Импортирование библиотеки

91 import pandas as pd

92 # Вызов конструктора

93 df = pd.DataFrame()

94 print(df)

95 Выше - наглядный пример кода, а также результата его обработки. Create a dataframe without data (создание пустого датафрейма) - операция, которая в практических задачах используется не слишком часто. Это элементарный случай. Есть и другие методы сделать (to create) dataframe data.

96 <h4>Добавление столбцов</h4>

97 Основная единица измерения датафрейма - это the column (столбцы). Доступ к ним всегда является более прямой, чем к строкам (rows). При помощи обычной скобочной нотации обращение к столбцам осуществляется раньше, чем к строкам. Это противоречит общей практике.

98 Добавить новый столбец в the DataFrame можно путем присваивания ему значений, которые должен иметь столбец. Операция производится подобно работе со словарями и скобочными нотациями.:

99 Выше - пример, где отсутствуют значения. Из-за этого в первой строке указывается None. Фактически это - пустой фрейм.

100 Еще один способ добавления столбцов (dataframe-columns) является применение функции assign. Она дает возможность добавлять колонки к уже созданным. В исходный датафрейм информация не вставляется. Вместо этого система добавляет новый the Dataframe, который включает не только старые столбцы, но и новые:

101 Стоит обратить внимание на то, что при назначении уже существующих dataframe-columns происходит перезапись их значений. В представленном примере из-за этого не случится ничего страшного, потому что изначально фрейм пустой.

102 <h3>При помощи словаря</h3>

103 Creates the dataframe через одномерный словарь - более распространенная ситуация. В этом случае компонентами the dict будут выступать списки и структуры Series. Сначала разработчику потребуется создать Series:

104 Далее потребуется построить аналогичный словарь, но базирующийся на компонентах ndarray:

105 Можно заметить, что результаты будут одинаковыми. Вместо ndarray допускается использование обычного списка из Питона.

106 <h3>Из массива</h3>

107 Еще один способ формирования the Pandas dataframe - выгрузка из массива. Чтобы лучше понять соответствующий принцип, рекомендуется изучать его на наглядном примере. В качестве массива с информацией будет использоваться data.

108 Для формирования DataFrame потребуется вызвать конструктор и передать его в качестве параметра список data. Для этого используется DataFrame(data). Соответствующая команда будет возвращать объект Датафрейм, созданный с заданными параметрами. Его можно использовать для дальнейших операций.

109 Вот - массив, который состоит из трех списков, в каждом из которых по 4 значения. Они образовывают следующую таблицу:

110 Из него формируется ДатаФрейм. Для этого рекомендуется воспользоваться следующим фрагментом кода:

111 При выводе результата на экран отобразится следующая ситуация:

112 Стоит обратить внимание на следующие особенности концепции создания the dataframes:

113 <ol><li>Каждая строка будет соответствовать каждой строке в исходном документе с массивом.</li>

114 <li>Если нужно, чтобы каждая строка (string) в заданном множестве значений отображалась как столбец в the Pandas Dataframe, потребуется поменять столбцы и строки местами при создании рассматриваемого компонента.</li>

115 <li>Для того, чтобы поменять столбцы и строки, используется функция transpose (df = pd.DataFrame(data).transpose().)</li>

116 <li>Если необходимо задать собственные имена столбцов (dataframe-name), допустимо добавить новый параметр. Он называется columns и пишется в вызов конструктора. В нем останется перечислить желаемые "названия".</li>

117 </ol>Запомнить все эти правила, еще один метод создания Датафреймов будет полностью понятен. Но рассмотренные приемы не являются исчерпывающими. Существуют иные методы, которые помогут create the dataframe.

118 <h3>Список словарей</h3>

119 Для создания Датафрейма из списка словарей необходимо предоставить список (list) конструктору класса через: DataFrame(list). Соответствующий вызов вернет объект ДатаФрейм, который включает в себя информацию из списка с ключами, которые выступают именами столбцов.

120 Вот - наглядный пример фрагмента кода с рассматриваемым решением:

121 И результат обработки:

122 Основная проблема рассматриваемого подхода к create DataFrame при помощи списка словарей заключается в том, что разработчик должен убедиться в ключах. В каждом предложенном dict они обязательно должны быть согласованными друг с другом, а также корректными.

123 Целевой дата фрейм получит столько столбцов, сколько в словарях размещается уникальных ключей. Пример - ключ, который связан с именем. В одном словаре он отображается как Name, во втором - name, в третьем - NAME. В конечном итоге разработчик получит три разных колонки (регистр принимается во внимание) для информации об имени. Такая ситуация часто доставляет определенные проблемы для анализа. Множество значений в результирующем фрейме окажется None.

124 <h3>Массив NumPy</h3>

125 Иногда требуется обработать pd-dataframe-columns, которые расположены внутри массива NumPy. Для такого случая программист должен вызвать конструктор через DataFrame(array). Чтобы задать имена столбцов, они должны быть прописаны в отдельном параметре функции - columns.

126 Каждая строка массива исходных данных будет полностью соответствовать DataFrame. Перед использованием соответствующего приема разработчик должен убедиться в наличии инициализированной библиотеки NumPy. При ее отсутствии - провести предварительную установку, иначе метод работать не будет.

127 <h3>Из CSV-документа</h3>

128 Работа с CSV-файлами при анализе информации и в BigData - явление, которое не удивляет разработчиков. Поэтому достаточно часто приходится формировать фреймы через заранее подготовленные документы.

129 CSV или Comma Separated Value представляет собой текстовый документ в виде таблицы. Его значения разделены специальными символами. По умолчанию - запятыми. Такие документы часто имеют первую строку, выступающей в виде заголовка с именами имеющихся столбцов.

130 Чтобы создать при помощи такого приема Pandas-dataframe-columns, можно пользоваться одной из нескольких функций:

131 <ul><li>read_table;</li>

132 <li>read_csv.</li>

133 </ul>В соответствующих командах потребуется указать имя файла, откуда осуществляется импорт данных, а также символ-разделитель.

134 Вот - исходный текстовый документ. Он будет называться как data.csv:

135 Из них при помощи обоих предложенных методов будет осуществляться create dataframe. Первый подход - это применение функции read_csv. Она разработана специально для упомянутого формата текстовых документов. Поддерживает большое количество функций, но для простых документов достаточно указать только название исходного документа, а также тип используемого в нем разделителя. В рассматриваемом примере ей служит символ запятой.

136 В этом же случае допускается применение read_table. Она будет работать точно также, как и read_csv.

137 Стоит обратить внимание на то, что иногда разработчику требуется отдельно задавать подписи для pandas-dataframe-columns. В этом случае предстоит пользоваться дополнительным параметром. Он называется name и имеет такую форму записи:

138 Если программисту в результирующем фрейме не требуются имена столбцов, параметры задаются как header=None.

139 <h3>Из буфера обмена</h3>

140 Иногда у аналитика или разработчика имеются данные в табличном формате, которые разделены запятыми или иными разделяющими символами. Они скопированы в буфер обмена и могут быть использованы для считывания изучаемой библиотекой.

141 Еще один способ формирования pandas-pd-dataframe - это копирование информации прямо из буфера обмена устройства. Отдельный документ с исходными данными формировать в этом случае не придется.

142 Создание фрейма из буфера позволяет динамически, а также достаточно быстро получать информационные фреймы из материалов различных источников.

143 Чтобы в Pandas create-dataframe из значений, которые разделены запятыми и скопированы в буфер обмена устройства, используется функция read_clipboard. Дополнительно предстоит указать разделяющий символ.

144 Вот - информация, которую предстоит скопировать в буфер устройства для дальнейшей обработки изучаемым методом:

145 Теперь остается записать в программном коде следующее:

146 Если разделитель строк dataframe не выступает в качестве одного или нескольких пробелов, желаемый символ или строка (the strings) должны быть обязательно указаны. Для этого разработчик передает параметр функции. В круглых скобках между кавычками-черточками указывается желаемый символ-разделитель. Если функция вызывается без параметров, по умолчанию в итоговом фрейме разделителем выступает пробел.

147 <h3>HTML-документ или веб-страница</h3>

148 В Pandas DataFrame может быть сформирован еще проще - при помощи веб-страниц и HTML-документов. Для этого предстоит использовать функцию read_html. В ней разработчик указывает исходный HTML-документ или URL, который предстоит считать. Указанная команда будет искать теги, а затем формировать информационный фрейм с каждой из таблиц в исходном документе.

149 Read_html ищет теги:

150 <ul><li>table;</li>

151 <li>tr (строки);</li>

152 <li>th (заголовки);</li>

153 <li>td (данные).</li>

154 </ul>из них для каждой таблицы будет генерироваться фрейм. Связано это с тем, что рассматриваемая функция всегда будет возвращать список со сгенерированными DataFrames.

155 Стоит обратить внимание на то, что для корректной реализации рассматриваемого приема требуется подключить библиотеку lxml. Она помогает не в непосредственном pandas-create-dataframe, а в обработке и разборе XML/HTML-документов в Питоне.

156 Выше - HTML-файл, с которым планируется дальнейшая работа в процессе изучения метода создания информационного фрейма. В нем поддерживаются две разные таблицы. Документ будет называться - data.html.

157 Представленный файл рекомендуется открыть в браузере, чтобы увидеть, что в нем хранится. В этом примере формируется pandas-dataframe-name с двумя объектами: по одному для каждой исходной таблицы в data.html. Далее соответствующий список должен быть выведен на дисплей:

158 Чтение при помощи библиотеки lxml может оказаться неудачным. В соответствующем случае будут использоваться html5lib, а также bs4. Для этого они должны быть заранее установлены на устройстве разработчика. Если необходимо выполнить чтение конкретной библиотекой, рекомендуется воспользоваться параметром flavor. В нем указывается lib, необходимая для непосредственного применения.

159 <h3>Из Excel</h3>

160 Рассматриваемый тип информационной структуры может быть охарактеризован как "таблица". Пользователи часто работают с Excel, поэтому the Pandas dataframe может быть сформирована из Excel-таблиц. Допускается работа с совместимыми электронными таблицами. Пример - созданные через пакет LibreOffice.

161 Для выполнения операции используется функция read_excel, в котором указывается файл, из которого необходимо считать исходные материалы. Формат предложенного далее примера - data.xlsx. Эта таблица была создана через GoogleDrive и сохранена.

162 Функция read_excel при считывании data for dataframe, будет использовать другую библиотеку. Она напрямую зависит от типа формата исходной таблицы. Для Excel - это openpyxl. Она должна быть установлена предварительно через pip. При работе с форматом Open Document Format, используется библиотека odf.

163 Когда все готово, можно формировать dataframe columns при помощи такого фрагмента кода:

164 А вот - результат обработки команды:

165 Может получиться так, что таблица, необходимая для чтения, расположена в определенной строке и столбце документа. Эта ситуация требует указания того, какие строки должны быть проигнорированы (через skiprows). Также предстоит указать, какие столбцы являются обязательными для чтения при помощи параметра usecols.

166 Иногда таблица, которую необходимо сформировать в виде фрейма, располагается на первом листе документа. Чтобы указать его, используется параметр sheet_name. Можно прописывать "лист поиска" как цифрой, так и непосредственным названием. Первый такой "элемент" указывается как 0.

167 <h3>Из JSON</h3>

168 Хранение информации в формате JSON является достаточно популярным методом организации данных. Его тоже допустимо использовать, чтобы сформировать pandas-dataframe-name. За операцию отвечает функция read_json. Ей передается имя исходного документа. После обработки "запроса" система создаст новый дата фрейм с желаемым спектром информации.

169 Вот - исходный текст документа, сохраненного в формате JSON:

170 Теперь остается воспользоваться упомянутой функцией:

171 Результат тут будет точно таким же, как и в предыдущих примерах.

172 <h3>Из SQL-базы</h3>

173 Более сложный пример формирования dataframe-data - из SQL-таблиц. Для этого могут использоваться:

174 <ul><li>read_sql;</li>

175 <li>запрос на создание и соединение с БД.</li>

176 </ul>Для примера рекомендуется рассмотреть ситуацию, при которой поддерживаются две таблицы в БД. Они будут разными: для сотрудников и для отделов. В первом случае будут столбцы:

177 <ul><li>код;</li>

178 <li>имя;</li>

179 <li>возраст;</li>

180 <li>код отдела.</li>

181 </ul>В таблице отдела отображаются столбцы: код отдела, название, местоположение. Задача - создать информационный фрейм, в котором содержатся столбцы обеих таблиц. В качестве параметра объединения служит "код отдела".

182 После создания БД остается сформировать несколько Pandas Dataframe. Первый вариант - прямой. Он заключается в загрузке фреймов с каждой таблицы. Для этого используется команда read_sql. В ней указываются два параметра: имя считываемой таблицы, а также строка подключения к базе данных:

183 Если действовать через SQL-запрос, предстоит выполнить следующее:

184 Read_sql дает возможность задавать запросы для получения нужных данных и их дальнейшего применения. Достаточно указать SQL-команду вместе табличного имени.

185 <a>Здесь</a>и<a>тут</a>можно увидеть больше наглядных примеров работы с ДатаФреймами в Пандас. А лучше изучить их с нуля помогут дистанционные компьютерные курсы.

186 Хотите освоить современную IT-специальность? Огромный выбор курсов по востребованным IT-направлениям есть в <a>Otus</a>!

187 Также, возможно, вам будут интересны следующие курсы:

188 <ul><li><a>Промышленный ML на больших данных</a></li>

189 <li><a>Data Warehouse Analyst</a></li>

190 <li><a>Data Engineer</a></li>

191 <li><a>Product Manager</a></li>

192 <li><a>Системный аналитик</a></li>

193 </ul>