Информация для бизнеса и его продвижения – один из самых ценных ресурсов. Это привело к тому, что владельцы различных компаний стали интересоваться изобретением и приобретением специализированных инструментов для сбора и анализа данных.
Одним из подобных продуктов выступает так называемый парсер. Далее предстоит познакомиться с ними получше. Необходимо разобраться в особенностях и областях применения парсеров, их преимуществах и недостатках. Также предстоит изучить алгоритм написания первого такого инструмента на Python. В работе будет использована библиотека Beautiful Soup. Предложенная информация пригодится как программистам-новичкам, так и их более опытным коллегам.
Определение
Google характеризует парсер как программу, с помощью которой осуществляется сбор данных с различных веб-сайтов, их анализ и объединение в информационные базы в различных форматах. Подобный сервис избавляет клиентов от необходимости выполнения огромного объема однотипных задач, а также экономит время и силы.
Парсер – приложение для сбора и анализа данных. Парсинг – это сам процесс сбора информации. Он может осуществляться как вручную, так и через специальные программы.
Области применения
Парсинг, согласно Google – операция, которая применяется в любых областях, где требуется анализ и систематизация крупных информационных объемов.
Чаще всего парсинг встречается в:
- Разработке программного обеспечения. Компьютеры способны воспринимать только машинный код – набор нулей и единиц. Чтобы устройство выполняло различные операции, нужно пользоваться языками программирования. Они понятны разработчикам, но не компьютерам. Из-за этого специальные программы сначала проводят парсинг написанного приложения, затем – переводят их в бинарный машинный код для дальнейшей обработки.
- Создании сайтов. HTML и другие языки разметки по умолчанию компьютерам не понятны. Для отображения HTML-разметки в виде понятного и структурированного интерфейса сайта используются парсеры. Они встроены в браузеры. Данные приложения, согласно Google, переводят HTML-код в машинный формат. Парсинг также дает возможность обнаруживать ошибки в получившемся сайте.
- Веб-краулинге. Так называется частный случай парсинга. Google указывает, что при краулинге робот-парсер поисковой системы в ответ на пользовательский запрос будет просматривать релевантные ему страницы, а затем – выбирать наиболее подходящую по содержанию страницу. Краулеры не занимаются извлечением информации с сайтов. Они только ищут совпадения с пользовательским запросом.
- Агрегации новостей. Рассматриваемые программы используются для упорядоченной подачи новостей.
- Интернет-маркетинге. В SEO и SMM при помощи парсеров, согласно Google, осуществляется сбор и анализ данных пользователей, товарных позиций в Интернет-магазинах, метатегов, ключевых слов и иной информации. Соответствующие сведения будут использоваться для оптимизации сайтов, их продвижения в социальных сетях, а также для настройки таргетированной и контекстной рекламы.
- Мониторинге цен. Google подчеркивает, что при помощи программ-парсеров можно извлекать расценки товаров на сайтах-конкурентах для дальнейшего анализа ситуации на рынке. Эти данные также помогают формировать ценовую политику.
Google подчеркивает, что парсинг (parsing) – это очень полезная операция для бизнеса и SEO/SMM.
Принцип работы
Слово «парсинг» произошло от английского «to parse» – «по частям». Google описывает рассматриваемый процесс как синтаксический анализ любого представленного набора связанных друг с другом данных.
В общих чертах можно представить работу парсеров так:
- Сначала сканируется исходный информационный массив (HTML-коды, базы данных, текст и так далее).
- После – осуществляется поиск и выявление семантически значимых единиц по заданным параметрам. Примерами могут послужить заголовки, ссылки, абзацы с жирным выделением, пункты меню.
- Завершается процесс конвертацией полученной информации в формат, удобный для изучения человеком, а также ее систематизация в виде таблиц или отчетов.
Google отмечает – объектом парсинга может стать любая грамматически структурированная система: информация, закодированная естественным языком, математическими выражениями, языками программирования и так далее.
Используемые алгоритмы
Примером использования парсинга может послужить SEO-оптимизация сайта. В процессе работы соответствующие приложения действуют по двум алгоритмам:
- Нисходящий парсинг. Google описывает его как анализ, который осуществляется от общего к частному. Синтаксическое дерево разрастается вниз.
- Восходящий парсинг. Согласно Google, это анализ и построение синтаксического дерева, которые осуществляются снизу-вверх.
Выбор метода реализации рассматриваемой процедуры зависит от итоговой цели. Программа-парсер в случае чего должна уметь вычленять из общего массива только необходимую пользователю информацию и преобразовывать ее в удобный для решения той или иной задачи формат.
Преимущества и недостатки
Программы-парсеры, согласно Google, имеют следующие преимущества:
- возможность автоматизации процесса анализа информации;
- снижение нагрузки на сотрудников при работе с большими информационными объемами;
- экономия времени сотрудников компании на решение тех или иных задач;
- ускорение анализа большого объема данных;
- выявление ошибок на сайтах или в любых других информационных продуктах, если в приложении заданы соответствующие настройки.
Рассматриваемый инструмент – это функциональное и полезное программное обеспечение, но оно имеет некоторые недостатки. К ним можно отнести не всегда релевантный анализ данных. Этот момент напрямую зависит от возможностей выбранного для парсинга программного обеспечения. Большинство таких продуктов позволяют осуществлять детализированную настройку для обработки информации.
Написание парсера
Задумываясь над тем, как создать парсер, необходимо сначала определиться с языком программирования. Далее будет представлен код соответствующего инструмента на Python. Этот язык разработки является достаточно простым для понимания. Он поддерживает множество библиотек и фреймворков, значительно упрощающих написание программного обеспечения.
Библиотеки Python для парсинга
Google отмечает, что у Python предусматриваются разнообразные библиотеки, помогающие в создании парсеров. Их несколько, но упор будет сделан всего на одну – Beautiful Soup.
Requests
Библиотека, позволяющая выполнять HTTP-запросы при помощи Python. С ее помощью можно значительно облегчить отправку HTTP-запросов, особенно по сравнению со стандартной Python-библиотекой HTTP. Requests имеет огромную роль для скрапинга и парсинга. Это связано с тем, что для сбора информации со страницы сначала необходимо получить ее через HTTP-запрос GET.
Beautiful Soup
Beautiful Soup (далее – просто Soup) – библиотека, которая значительно упрощает сбор информации со страниц. Она поддерживает работу с любым HTML- или XML-парсером, а также предоставляет все необходимое для поиска, итерации, модификации абстрактного синтаксического дерева.
Beautiful Soup разрешено использовать вместе с html.parser. Это парсер, который, согласно Google, включен в стандартную библиотеку Python. Он позволяет парсить текстовые HTML-документы. Beautiful Soup поможет обойти DOM и извлечь из него необходимую информацию.
Selenium
Google называет Selenium современной системой автоматизированного тестирования с открытым исходным кодом. С ее помощью получится выполнять различные операции на страницах в веб-браузерах.
Selenium даст возможность поручить браузеру выполнение некоторых задач. Страницы, посещаемые данной «библиотекой», отображаются в реальном браузере. у Selenium есть все необходимое для создания собственного парсера без привлечения дополнительных инструментов.
Установка библиотек
Перед началом разработки рассматриваемого приложения необходимо сначала установить ряд Python-библиотек. К ним относятся: lxml, Beautiful Soup и Requests. Сделать это лучше всего через pip:
pip install lxml
pip install requests
pip install beautifulsoup4
Теперь все готово к полноценной разработке. Она будет вестись в несколько этапов. Такой подход, согласно Google, позволяет лучше разобраться в процедуре написания рассматриваемого приложения.
Поиск сайта для работы
Знакомство с рассматриваемой операцией рекомендуется проводить при помощи этого сайта: https://quotes.toscrape.com/. Он был создан для скрапинга и парсинга.
С помощью соответствующего сервиса можно сделать хранилище имен авторов, тегов или имеющихся цитат. Для этого достаточно изучить исходный код страницы. Это те самые данные, что будут возвращаться на посылаемый запрос. В современных браузерах посмотреть код сайта получится, если кликнуть правой кнопкой мыши на странице и выбрать пункт «Просмотр кода страницы».
На экране появится HTML-разметка. Вот ее наглядный пример:
Здесь можно заметить, что разметка включает в себя массу перемешанных данных. Задачей веб-скраппинга, согласно Google, является получение доступа к тем частям страницы, которые действительно нужны для дальнейшей работы пользователя. Соответствующая операция возможна при помощи регулярных выражений, но лучше всего пользоваться библиотекой Beautiful Soup.
Создание скрипта
Теперь можно начать написание программного кода для будущего приложения-парсера. В любой IDE (пример – PyCharm) нужно добавить новый файл. Этот документ будет отвечать непосредственно за парсинг.
Выше можно увидеть начало будущего приложения. Google указывает, что данный фрагмент работает так:
- В верхней части файла осуществляет импорт библиотек: Requests и Beautiful Soup.
- Далее в переменной url происходит сохранение адреса страницы, с которой поступает информация.
- Url (переменная) передает функции requests.get().
- Результат передается переменной response.
- Далее используется конструктор BeautifulSoup(). Он необходим для размещения текста ответа в переменную soup.
- В качестве используемого формата выбран lxml.
- В самом конце нужно вывести переменную soup на экран.
Google описывает работу предложенного фрагмента так:
- Приложение заходит на обозначенный сайт.
- Осуществляется считывание данных.
- Программа-парсер получает исходный код.
Все это – аналогия ручного подхода, но с помощью предложенного фрагмента запуск процесса осуществляется буквально в один клик.
HTML-структура
HTML – это язык гипертекста. Он включает в себя множество разнообразных тегов. Стандартными (и основными) выступают всего три элемента:
Эти теги отвечают за организацию всего HTML-документа. В случае с парсингом и скрапингом, согласно Google, значимость имеет только body.
Ранее представленный фрагмент кода с Beautiful Soup уже получает информацию о разметке с указанного веб-адреса. Теперь необходимо сконцентрироваться только на интересующих пользователя сведениях.
Если в браузере активировать инструмент «Inspect» (сочетанием CTRL+SHIFT+I), можно увидеть, какая из частей разметки отвечает за те или иные компоненты на веб-странице. Достаточно навести курсор на определенный тег span, чтобы он подсветил соответствующую информацию. Google отмечает, что каждая цитата относится к тегу span с классом text.
Так осуществляется дешифровка данных, которые необходимо получить. Сначала требуется найти некий шаблон на заданной странице, а затем – создать код, который будет для него работать. Скрапинг позволяет извлекать все похожие разделы HTML-документа.
HTML-разметка и ее парсинг
HTML-документы включают в себя множество информации, но за счет библиотеки Beautiful Soup становится намного проще искать нужные данные. Обычно для этого достаточно написать всего одну строку кода.
Необходимо найти все теги span с классом text. Если нужно отыскать несколько одинаковых тегов, предстоит пользоваться функцией find_all():
В результате работы данного фрагмента переменная quotes получит список элементов span с классом text из имеющегося HTML-файла.
Beautiful Soup и свойство text
Возвращаемая разметка – это не то, что нужно специалистам в процессе парсинга. Для получения только информации (в предложенном примере – цитат) требуется использовать свойство .text библиотеки Beautiful Soup.
Выше представлен код, который перебивает все полученные данные и выводит только нужное человеку содержимое.
Для поиска и вывода всех авторов используется следующий код:
Здесь:
- Сначала осуществляется ручное изучение страницы. Можно обратить внимание на то, что каждый автор заключен в тег <small> с классом author.
- Использовать функцию find_all().
- Сохранить результат в переменную authors.
Рекомендуется также поменять цикл. Это поможет сразу при помощи Soup перебирать цитаты и авторов.
Завершающим этапом процесса Google называет получение всех тегов для каждой имеющейся цитаты. Здесь сначала придется получить каждый внешний блок каждой теговой коллекции. Если этого не сделать, при помощи Soup получится извлечь теги, а ассоциировать их с конкретной цитатой – нет.
После получения блока можно опуститься ниже, используя функцию find_all для соответствующего подмножества. Заключительным этапом работы с Soup станет добавление внутреннего цикла для прекращения процесса.
Выше можно увидеть наглядный пример того, как написать парсер при помощи Beautiful Soup. Это всего лишь один из множества вариантов. Лучше разобраться с рассматриваемой операцией, Python и Beautiful Soup помогут дистанционные компьютерные курсы.
Хотите освоить современную IT-специальность? Огромный выбор курсов по востребованным IT-направлениям есть в Otus!
<!DOCTYPE html>
<html dir="ltr" lang="ru-RU">
<head>
<meta charset="UTF-8" />
<meta http-equiv="x-ua-compatible" content="ie=edge" />
<meta name="viewport" content="width=device-width, initial-scale=1" />
<link rel="profile" href="http://gmpg.org/xfn/11" />
<title>Парсер: описание и пример кода OTUS</title>
<!-- All in One SEO 4.5.2.1 - aioseo.com -->
<meta name="description" content="Информация для бизнеса и его продвижения – один из самых ценных ресурсов. Это привело к тому, что владельцы различных компаний стали интересоваться изобретением и приобретением специализированных инструментов для сбора и анализа данных. Одним из подобных продуктов выступает так называемый парсер. Далее предстоит познакомиться с ними получше. Необходимо разобраться в особенностях и областях применения парсеров, их" />
<meta name="robots" content="max-image-preview:large" />
<link rel="canonical" href="https://otus.ru/journal/parser-opisanie-i-primer-koda/" />
<meta name="generator" content="All in One SEO (AIOSEO) 4.5.2.1" />
<script type="application/ld+json" class="aioseo-schema">
{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#article","name":"\u041f\u0430\u0440\u0441\u0435\u0440: \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u0438 \u043f\u0440\u0438\u043c\u0435\u0440 \u043a\u043e\u0434\u0430 OTUS","headline":"\u041f\u0430\u0440\u0441\u0435\u0440: \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u0438 \u043f\u0440\u0438\u043c\u0435\u0440 \u043a\u043e\u0434\u0430","author":{"@id":"https:\/\/otus.ru\/journal\/author\/a-pavlenko\/#author"},"publisher":{"@id":"https:\/\/otus.ru\/journal\/#organization"},"image":{"@type":"ImageObject","url":"https:\/\/otus.ru\/journal\/wp-content\/uploads\/2024\/05\/oj-1080x720-93-1.jpg","width":2245,"height":1587},"datePublished":"2024-05-13T10:58:33+00:00","dateModified":"2024-05-13T11:03:19+00:00","inLanguage":"ru-RU","mainEntityOfPage":{"@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#webpage"},"isPartOf":{"@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#webpage"},"articleSection":"\u041f\u043e\u043b\u0435\u0437\u043d\u043e\u0435, Beautiful Soup"},{"@type":"BreadcrumbList","@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#breadcrumblist","itemListElement":[{"@type":"ListItem","@id":"https:\/\/otus.ru\/journal\/#listItem","position":1,"name":"\u0413\u043b\u0430\u0432\u043d\u0430\u044f \u0441\u0442\u0440\u0430\u043d\u0438\u0446\u0430","item":"https:\/\/otus.ru\/journal\/","nextItem":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#listItem"},{"@type":"ListItem","@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#listItem","position":2,"name":"\u041f\u0430\u0440\u0441\u0435\u0440: \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u0438 \u043f\u0440\u0438\u043c\u0435\u0440 \u043a\u043e\u0434\u0430","previousItem":"https:\/\/otus.ru\/journal\/#listItem"}]},{"@type":"Organization","@id":"https:\/\/otus.ru\/journal\/#organization","name":"\u041e\u0442\u0443\u0441 \u043e\u043d\u043b\u0430\u0439\u043d-\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u0435","url":"https:\/\/otus.ru\/journal\/","sameAs":["https:\/\/www.youtube.com\/channel\/UCetgtvy93o3i3CvyGXKFU3g"],"contactPoint":{"@type":"ContactPoint","telephone":"+74999389202","contactType":"Customer Support"}},{"@type":"Person","@id":"https:\/\/otus.ru\/journal\/author\/a-pavlenko\/#author","url":"https:\/\/otus.ru\/journal\/author\/a-pavlenko\/","name":"A. Pavlenko","image":{"@type":"ImageObject","@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#authorImage","url":"https:\/\/secure.gravatar.com\/avatar\/d4c499a104d7c2522fa41f89e6819499?s=96&d=mm&r=g","width":96,"height":96,"caption":"A. Pavlenko"}},{"@type":"WebPage","@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#webpage","url":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/","name":"\u041f\u0430\u0440\u0441\u0435\u0440: \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u0438 \u043f\u0440\u0438\u043c\u0435\u0440 \u043a\u043e\u0434\u0430 OTUS","description":"\u0418\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044f \u0434\u043b\u044f \u0431\u0438\u0437\u043d\u0435\u0441\u0430 \u0438 \u0435\u0433\u043e \u043f\u0440\u043e\u0434\u0432\u0438\u0436\u0435\u043d\u0438\u044f \u2013 \u043e\u0434\u0438\u043d \u0438\u0437 \u0441\u0430\u043c\u044b\u0445 \u0446\u0435\u043d\u043d\u044b\u0445 \u0440\u0435\u0441\u0443\u0440\u0441\u043e\u0432. \u042d\u0442\u043e \u043f\u0440\u0438\u0432\u0435\u043b\u043e \u043a \u0442\u043e\u043c\u0443, \u0447\u0442\u043e \u0432\u043b\u0430\u0434\u0435\u043b\u044c\u0446\u044b \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0439 \u0441\u0442\u0430\u043b\u0438 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043e\u0432\u0430\u0442\u044c\u0441\u044f \u0438\u0437\u043e\u0431\u0440\u0435\u0442\u0435\u043d\u0438\u0435\u043c \u0438 \u043f\u0440\u0438\u043e\u0431\u0440\u0435\u0442\u0435\u043d\u0438\u0435\u043c \u0441\u043f\u0435\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0445 \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442\u043e\u0432 \u0434\u043b\u044f \u0441\u0431\u043e\u0440\u0430 \u0438 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0434\u0430\u043d\u043d\u044b\u0445. \u041e\u0434\u043d\u0438\u043c \u0438\u0437 \u043f\u043e\u0434\u043e\u0431\u043d\u044b\u0445 \u043f\u0440\u043e\u0434\u0443\u043a\u0442\u043e\u0432 \u0432\u044b\u0441\u0442\u0443\u043f\u0430\u0435\u0442 \u0442\u0430\u043a \u043d\u0430\u0437\u044b\u0432\u0430\u0435\u043c\u044b\u0439 \u043f\u0430\u0440\u0441\u0435\u0440. \u0414\u0430\u043b\u0435\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u043e\u0438\u0442 \u043f\u043e\u0437\u043d\u0430\u043a\u043e\u043c\u0438\u0442\u044c\u0441\u044f \u0441 \u043d\u0438\u043c\u0438 \u043f\u043e\u043b\u0443\u0447\u0448\u0435. \u041d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u0440\u0430\u0437\u043e\u0431\u0440\u0430\u0442\u044c\u0441\u044f \u0432 \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u044f\u0445 \u0438 \u043e\u0431\u043b\u0430\u0441\u0442\u044f\u0445 \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u043f\u0430\u0440\u0441\u0435\u0440\u043e\u0432, \u0438\u0445","inLanguage":"ru-RU","isPartOf":{"@id":"https:\/\/otus.ru\/journal\/#website"},"breadcrumb":{"@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#breadcrumblist"},"author":{"@id":"https:\/\/otus.ru\/journal\/author\/a-pavlenko\/#author"},"creator":{"@id":"https:\/\/otus.ru\/journal\/author\/a-pavlenko\/#author"},"image":{"@type":"ImageObject","url":"https:\/\/otus.ru\/journal\/wp-content\/uploads\/2024\/05\/oj-1080x720-93-1.jpg","@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#mainImage","width":2245,"height":1587},"primaryImageOfPage":{"@id":"https:\/\/otus.ru\/journal\/parser-opisanie-i-primer-koda\/#mainImage"},"datePublished":"2024-05-13T10:58:33+00:00","dateModified":"2024-05-13T11:03:19+00:00"},{"@type":"WebSite","@id":"https:\/\/otus.ru\/journal\/#website","url":"https:\/\/otus.ru\/journal\/","name":"OTUS JOURNAL","description":"Blog about IT","inLanguage":"ru-RU","publisher":{"@id":"https:\/\/otus.ru\/journal\/#organization"}}]}
</script>
<!-- All in One SEO -->
<link rel='dns-prefetch' href='//otus.ru' />
<link rel='dns-prefetch' href='//fonts.googleapis.com' />
<link rel='stylesheet' id='wp-block-library-css' href='https://otus.ru/journal/wp-includes/css/dist/block-library/style.min.css?ver=6.4.7' type='text/css' media='all' />
<style id='classic-theme-styles-inline-css' type='text/css'>
/*! This file is auto-generated */
.wp-block-button__link{color:#fff;background-color:#32373c;border-radius:9999px;box-shadow:none;text-decoration:none;padding:calc(.667em + 2px) calc(1.333em + 2px);font-size:1.125em}.wp-block-file__button{background:#32373c;color:#fff;text-decoration:none}
</style>
<style id='global-styles-inline-css' type='text/css'>
body{--wp--preset--color--black: #000000;--wp--preset--color--cyan-bluish-gray: #abb8c3;--wp--preset--color--white: #ffffff;--wp--preset--color--pale-pink: #f78da7;--wp--preset--color--vivid-red: #cf2e2e;--wp--preset--color--luminous-vivid-orange: #ff6900;--wp--preset--color--luminous-vivid-amber: #fcb900;--wp--preset--color--light-green-cyan: #7bdcb5;--wp--preset--color--vivid-green-cyan: #00d084;--wp--preset--color--pale-cyan-blue: #8ed1fc;--wp--preset--color--vivid-cyan-blue: #0693e3;--wp--preset--color--vivid-purple: #9b51e0;--wp--preset--gradient--vivid-cyan-blue-to-vivid-purple: linear-gradient(135deg,rgba(6,147,227,1) 0%,rgb(155,81,224) 100%);--wp--preset--gradient--light-green-cyan-to-vivid-green-cyan: linear-gradient(135deg,rgb(122,220,180) 0%,rgb(0,208,130) 100%);--wp--preset--gradient--luminous-vivid-amber-to-luminous-vivid-orange: linear-gradient(135deg,rgba(252,185,0,1) 0%,rgba(255,105,0,1) 100%);--wp--preset--gradient--luminous-vivid-orange-to-vivid-red: linear-gradient(135deg,rgba(255,105,0,1) 0%,rgb(207,46,46) 100%);--wp--preset--gradient--very-light-gray-to-cyan-bluish-gray: linear-gradient(135deg,rgb(238,238,238) 0%,rgb(169,184,195) 100%);--wp--preset--gradient--cool-to-warm-spectrum: linear-gradient(135deg,rgb(74,234,220) 0%,rgb(151,120,209) 20%,rgb(207,42,186) 40%,rgb(238,44,130) 60%,rgb(251,105,98) 80%,rgb(254,248,76) 100%);--wp--preset--gradient--blush-light-purple: linear-gradient(135deg,rgb(255,206,236) 0%,rgb(152,150,240) 100%);--wp--preset--gradient--blush-bordeaux: linear-gradient(135deg,rgb(254,205,165) 0%,rgb(254,45,45) 50%,rgb(107,0,62) 100%);--wp--preset--gradient--luminous-dusk: linear-gradient(135deg,rgb(255,203,112) 0%,rgb(199,81,192) 50%,rgb(65,88,208) 100%);--wp--preset--gradient--pale-ocean: linear-gradient(135deg,rgb(255,245,203) 0%,rgb(182,227,212) 50%,rgb(51,167,181) 100%);--wp--preset--gradient--electric-grass: linear-gradient(135deg,rgb(202,248,128) 0%,rgb(113,206,126) 100%);--wp--preset--gradient--midnight: linear-gradient(135deg,rgb(2,3,129) 0%,rgb(40,116,252) 100%);--wp--preset--font-size--small: 13px;--wp--preset--font-size--medium: 20px;--wp--preset--font-size--large: 36px;--wp--preset--font-size--x-large: 42px;--wp--preset--spacing--20: 0.44rem;--wp--preset--spacing--30: 0.67rem;--wp--preset--spacing--40: 1rem;--wp--preset--spacing--50: 1.5rem;--wp--preset--spacing--60: 2.25rem;--wp--preset--spacing--70: 3.38rem;--wp--preset--spacing--80: 5.06rem;--wp--preset--shadow--natural: 6px 6px 9px rgba(0, 0, 0, 0.2);--wp--preset--shadow--deep: 12px 12px 50px rgba(0, 0, 0, 0.4);--wp--preset--shadow--sharp: 6px 6px 0px rgba(0, 0, 0, 0.2);--wp--preset--shadow--outlined: 6px 6px 0px -3px rgba(255, 255, 255, 1), 6px 6px rgba(0, 0, 0, 1);--wp--preset--shadow--crisp: 6px 6px 0px rgba(0, 0, 0, 1);}:where(.is-layout-flex){gap: 0.5em;}:where(.is-layout-grid){gap: 0.5em;}body .is-layout-flow > .alignleft{float: left;margin-inline-start: 0;margin-inline-end: 2em;}body .is-layout-flow > .alignright{float: right;margin-inline-start: 2em;margin-inline-end: 0;}body .is-layout-flow > .aligncenter{margin-left: auto !important;margin-right: auto !important;}body .is-layout-constrained > .alignleft{float: left;margin-inline-start: 0;margin-inline-end: 2em;}body .is-layout-constrained > .alignright{float: right;margin-inline-start: 2em;margin-inline-end: 0;}body .is-layout-constrained > .aligncenter{margin-left: auto !important;margin-right: auto !important;}body .is-layout-constrained > :where(:not(.alignleft):not(.alignright):not(.alignfull)){max-width: var(--wp--style--global--content-size);margin-left: auto !important;margin-right: auto !important;}body .is-layout-constrained > .alignwide{max-width: var(--wp--style--global--wide-size);}body .is-layout-flex{display: flex;}body .is-layout-flex{flex-wrap: wrap;align-items: center;}body .is-layout-flex > *{margin: 0;}body .is-layout-grid{display: grid;}body .is-layout-grid > *{margin: 0;}:where(.wp-block-columns.is-layout-flex){gap: 2em;}:where(.wp-block-columns.is-layout-grid){gap: 2em;}:where(.wp-block-post-template.is-layout-flex){gap: 1.25em;}:where(.wp-block-post-template.is-layout-grid){gap: 1.25em;}.has-black-color{color: var(--wp--preset--color--black) !important;}.has-cyan-bluish-gray-color{color: var(--wp--preset--color--cyan-bluish-gray) !important;}.has-white-color{color: var(--wp--preset--color--white) !important;}.has-pale-pink-color{color: var(--wp--preset--color--pale-pink) !important;}.has-vivid-red-color{color: var(--wp--preset--color--vivid-red) !important;}.has-luminous-vivid-orange-color{color: var(--wp--preset--color--luminous-vivid-orange) !important;}.has-luminous-vivid-amber-color{color: var(--wp--preset--color--luminous-vivid-amber) !important;}.has-light-green-cyan-color{color: var(--wp--preset--color--light-green-cyan) !important;}.has-vivid-green-cyan-color{color: var(--wp--preset--color--vivid-green-cyan) !important;}.has-pale-cyan-blue-color{color: var(--wp--preset--color--pale-cyan-blue) !important;}.has-vivid-cyan-blue-color{color: var(--wp--preset--color--vivid-cyan-blue) !important;}.has-vivid-purple-color{color: var(--wp--preset--color--vivid-purple) !important;}.has-black-background-color{background-color: var(--wp--preset--color--black) !important;}.has-cyan-bluish-gray-background-color{background-color: var(--wp--preset--color--cyan-bluish-gray) !important;}.has-white-background-color{background-color: var(--wp--preset--color--white) !important;}.has-pale-pink-background-color{background-color: var(--wp--preset--color--pale-pink) !important;}.has-vivid-red-background-color{background-color: var(--wp--preset--color--vivid-red) !important;}.has-luminous-vivid-orange-background-color{background-color: var(--wp--preset--color--luminous-vivid-orange) !important;}.has-luminous-vivid-amber-background-color{background-color: var(--wp--preset--color--luminous-vivid-amber) !important;}.has-light-green-cyan-background-color{background-color: var(--wp--preset--color--light-green-cyan) !important;}.has-vivid-green-cyan-background-color{background-color: var(--wp--preset--color--vivid-green-cyan) !important;}.has-pale-cyan-blue-background-color{background-color: var(--wp--preset--color--pale-cyan-blue) !important;}.has-vivid-cyan-blue-background-color{background-color: var(--wp--preset--color--vivid-cyan-blue) !important;}.has-vivid-purple-background-color{background-color: var(--wp--preset--color--vivid-purple) !important;}.has-black-border-color{border-color: var(--wp--preset--color--black) !important;}.has-cyan-bluish-gray-border-color{border-color: var(--wp--preset--color--cyan-bluish-gray) !important;}.has-white-border-color{border-color: var(--wp--preset--color--white) !important;}.has-pale-pink-border-color{border-color: var(--wp--preset--color--pale-pink) !important;}.has-vivid-red-border-color{border-color: var(--wp--preset--color--vivid-red) !important;}.has-luminous-vivid-orange-border-color{border-color: var(--wp--preset--color--luminous-vivid-orange) !important;}.has-luminous-vivid-amber-border-color{border-color: var(--wp--preset--color--luminous-vivid-amber) !important;}.has-light-green-cyan-border-color{border-color: var(--wp--preset--color--light-green-cyan) !important;}.has-vivid-green-cyan-border-color{border-color: var(--wp--preset--color--vivid-green-cyan) !important;}.has-pale-cyan-blue-border-color{border-color: var(--wp--preset--color--pale-cyan-blue) !important;}.has-vivid-cyan-blue-border-color{border-color: var(--wp--preset--color--vivid-cyan-blue) !important;}.has-vivid-purple-border-color{border-color: var(--wp--preset--color--vivid-purple) !important;}.has-vivid-cyan-blue-to-vivid-purple-gradient-background{background: var(--wp--preset--gradient--vivid-cyan-blue-to-vivid-purple) !important;}.has-light-green-cyan-to-vivid-green-cyan-gradient-background{background: var(--wp--preset--gradient--light-green-cyan-to-vivid-green-cyan) !important;}.has-luminous-vivid-amber-to-luminous-vivid-orange-gradient-background{background: var(--wp--preset--gradient--luminous-vivid-amber-to-luminous-vivid-orange) !important;}.has-luminous-vivid-orange-to-vivid-red-gradient-background{background: var(--wp--preset--gradient--luminous-vivid-orange-to-vivid-red) !important;}.has-very-light-gray-to-cyan-bluish-gray-gradient-background{background: var(--wp--preset--gradient--very-light-gray-to-cyan-bluish-gray) !important;}.has-cool-to-warm-spectrum-gradient-background{background: var(--wp--preset--gradient--cool-to-warm-spectrum) !important;}.has-blush-light-purple-gradient-background{background: var(--wp--preset--gradient--blush-light-purple) !important;}.has-blush-bordeaux-gradient-background{background: var(--wp--preset--gradient--blush-bordeaux) !important;}.has-luminous-dusk-gradient-background{background: var(--wp--preset--gradient--luminous-dusk) !important;}.has-pale-ocean-gradient-background{background: var(--wp--preset--gradient--pale-ocean) !important;}.has-electric-grass-gradient-background{background: var(--wp--preset--gradient--electric-grass) !important;}.has-midnight-gradient-background{background: var(--wp--preset--gradient--midnight) !important;}.has-small-font-size{font-size: var(--wp--preset--font-size--small) !important;}.has-medium-font-size{font-size: var(--wp--preset--font-size--medium) !important;}.has-large-font-size{font-size: var(--wp--preset--font-size--large) !important;}.has-x-large-font-size{font-size: var(--wp--preset--font-size--x-large) !important;}
.wp-block-navigation a:where(:not(.wp-element-button)){color: inherit;}
:where(.wp-block-post-template.is-layout-flex){gap: 1.25em;}:where(.wp-block-post-template.is-layout-grid){gap: 1.25em;}
:where(.wp-block-columns.is-layout-flex){gap: 2em;}:where(.wp-block-columns.is-layout-grid){gap: 2em;}
.wp-block-pullquote{font-size: 1.5em;line-height: 1.6;}
</style>
<link rel='stylesheet' id='wbcr-comments-plus-url-span-css' href='https://otus.ru/journal/wp-content/plugins/clearfy/components/comments-plus/assets/css/url-span.css?ver=2.2.0' type='text/css' media='all' />
<link rel='stylesheet' id='wpel-style-css' href='https://otus.ru/journal/wp-content/plugins/wp-external-links/public/css/wpel.css?ver=2.59' type='text/css' media='all' />
<link rel='stylesheet' id='ez-toc-css' href='https://otus.ru/journal/wp-content/plugins/easy-table-of-contents/assets/css/screen.min.css?ver=2.0.61' type='text/css' media='all' />
<style id='ez-toc-inline-css' type='text/css'>
div#ez-toc-container .ez-toc-title {font-size: 120%;}div#ez-toc-container .ez-toc-title {font-weight: 500;}div#ez-toc-container ul li {font-size: 95%;}div#ez-toc-container nav ul ul li {font-size: 90%;}
.ez-toc-container-direction {direction: ltr;}.ez-toc-counter ul{counter-reset: item ;}.ez-toc-counter nav ul li a::before {content: counters(item, ".", decimal) ". ";display: inline-block;counter-increment: item;flex-grow: 0;flex-shrink: 0;margin-right: .2em; float: left; }.ez-toc-widget-direction {direction: ltr;}.ez-toc-widget-container ul{counter-reset: item ;}.ez-toc-widget-container nav ul li a::before {content: counters(item, ".", decimal) ". ";display: inline-block;counter-increment: item;flex-grow: 0;flex-shrink: 0;margin-right: .2em; float: left; }
</style>
<link rel='stylesheet' id='contentberg-fonts-css' href='https://fonts.googleapis.com/css?family=Roboto%3A400%2C500%2C700%7CPT+Serif%3A400%2C400i%2C600%7CIBM+Plex+Serif%3A500' type='text/css' media='all' />
<link rel='stylesheet' id='contentberg-core-css' href='https://otus.ru/journal/wp-content/themes/contentberg/style.css?ver=1.8.3' type='text/css' media='all' />
<link rel='stylesheet' id='contentberg-lightbox-css' href='https://otus.ru/journal/wp-content/themes/contentberg/css/lightbox.css?ver=1.8.3' type='text/css' media='all' />
<link rel='stylesheet' id='font-awesome-css' href='https://otus.ru/journal/wp-content/themes/contentberg/css/fontawesome/css/font-awesome.min.css?ver=1.8.3' type='text/css' media='all' />
<script type="text/javascript" id="breeze-prefetch-js-extra">
/* <![CDATA[ */
var breeze_prefetch = {"local_url":"https:\/\/otus.ru\/journal","ignore_remote_prefetch":"1","ignore_list":["\/wp-admin\/"]};
/* ]]> */
</script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/plugins/breeze/assets/js/js-front-end/breeze-prefetch-links.min.js" id="breeze-prefetch-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-includes/js/jquery/jquery.min.js" id="jquery-core-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-includes/js/jquery/jquery-migrate.min.js" id="jquery-migrate-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/themes/contentberg/js/lazysizes.js" id="lazysizes-js"></script>
<link rel="https://api.w.org/" href="https://otus.ru/journal/wp-json/" /><link rel="alternate" type="application/json" href="https://otus.ru/journal/wp-json/wp/v2/posts/9859" /><link rel='shortlink' href='https://otus.ru/journal/?p=9859' />
<link rel="alternate" type="application/json+oembed" href="https://otus.ru/journal/wp-json/oembed/1.0/embed?url=https%3A%2F%2Fotus.ru%2Fjournal%2Fparser-opisanie-i-primer-koda%2F" />
<link rel="alternate" type="text/xml+oembed" href="https://otus.ru/journal/wp-json/oembed/1.0/embed?url=https%3A%2F%2Fotus.ru%2Fjournal%2Fparser-opisanie-i-primer-koda%2F&format=xml" />
<script>var Sphere_Plugin = {"ajaxurl":"https:\/\/otus.ru\/journal\/wp-admin\/admin-ajax.php"};</script><link rel="icon" href="https://otus.ru/journal/wp-content/uploads/2020/11/cropped-OTUS_logo_OTUS-COMP-LOGO-WHITE-1-32x32.png" sizes="32x32" />
<link rel="icon" href="https://otus.ru/journal/wp-content/uploads/2020/11/cropped-OTUS_logo_OTUS-COMP-LOGO-WHITE-1-192x192.png" sizes="192x192" />
<link rel="apple-touch-icon" href="https://otus.ru/journal/wp-content/uploads/2020/11/cropped-OTUS_logo_OTUS-COMP-LOGO-WHITE-1-180x180.png" />
<meta name="msapplication-TileImage" content="https://otus.ru/journal/wp-content/uploads/2020/11/cropped-OTUS_logo_OTUS-COMP-LOGO-WHITE-1-270x270.png" />
<style type="text/css" id="wp-custom-css">
#menu-item-10406 .wpel-icon {
display: none;
}
#menu-item-10407 .wpel-icon {
display: none;
}
.otus-login-site a .wpel-icon {
display: none;
}
.menu-menju-navykov-container a .wpel-icon {
display: none;
}
.otus-login-site a
{
background: #ffd709;
border-radius: 12px;
color: #0f0f10;
font-size: 14px;
font-weight: 700;
line-height: 20px;
display: block;
text-align: center;
padding: 8px 25px;
}
.main-footer.dark {
background: linear-gradient(90deg, #a64fc5, #4f54e6);
border-color: transparent;
}
.main-footer.bold .copyright {
color: #fff;
}
.main-footer.bold .to-top i {
color: #fff;
}
.main-footer.bold .back-to-top {
color: #fff;
}
.nav__scroll {
overflow-x: auto;
-webkit-overflow-scrolling: touch;
}
.scrollable-menu .menu {
display: flex;
}
.nav__scroll
{
background: linear-gradient(90deg, #a64fc5, #4f54e6);
}
.scrollable-menu .menu .menu-item {
flex: 0 0 auto;
padding: 15px 15px;
}
.scrollable-menu .menu .menu-item a {
color: #fff;
}
.nav__scroll::-webkit-scrollbar{background-color:#fff;height:5px;}
.nav__scroll::-webkit-scrollbar-thumb{background-color:#dcdcdc;}
.nav__scroll::-webkit-scrollbar-track{-webkit-border-radius:0;border-radius:0;background-color:#fff;}/
body {
min-width: 320px;
}
.banner-click img {
margin: 0 auto;
display: block;
}
.banner-click {
cursor: pointer;
}
.banner-footer-area {
margin-bottom: 20px;
}
.banner-left-area {
margin-top: 40px;
} </style>
<!--Start VDZ Yandex Metrika Plugin-->
<!-- Yandex.Metrika counter --><script type="text/javascript" >(function(m,e,t,r,i,k,a){m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)};m[i].l=1*new Date();k=e.createElement(t),a=e.getElementsByTagName(t)[0],k.async=1,k.src=r,a.parentNode.insertBefore(k,a)})(window, document, "script", "https://mc.yandex.ru/metrika/tag.js", "ym");ym(34531570, "init", {clickmap:true, trackLinks:true, accurateTrackBounce:true, webvisor:true, trackHash:true, ecommerce:"dataLayer"});</script>
<noscript><div><img src="https://mc.yandex.ru/watch/34531570" style="position:absolute; left:-9999px;" alt="" /></div></noscript>
<!-- /Yandex.Metrika counter --><!--START ADD EVENTS FROM CF7--><script type='text/javascript'>document.addEventListener( 'wpcf7submit', function( event ) {
//event.detail.contactFormId;
if(ym){
//console.log(event.detail);
ym(34531570, 'reachGoal', 'VDZ_SEND_CONTACT_FORM_7');
ym(34531570, 'params', {
page_url: window.location.href,
status: event.detail.status,
locale: event.detail.contactFormLocale,
form_id: event.detail.contactFormId,
});
}
}, false );
</script><!--END ADD EVENTS FROM CF7-->
<!--End VDZ Yandex Metrika Plugin-->
</head>
<body class="post-template-default single single-post postid-9859 single-format-standard right-sidebar lazy-normal has-lb">
<div class="main-wrap">
<header id="main-head" class="main-head head-nav-below has-search-modal simple simple-boxed">
<div class="inner inner-head" data-sticky-bar="0">
<div class="wrap cf wrap-head">
<div class="left-contain">
<span class="mobile-nav"><i class="fa fa-bars"></i></span>
<div class="title">
<a href="https://otus.ru/journal/" title="OTUS JOURNAL" rel="home" data-wpel-link="internal">
<span class="text-logo"><img src="/journal/wp-content/themes/contentberg/img/logo_site.svg" alt="OTUS JOURNAL"></span>
</a>
</div>
</div>
<div class="navigation-wrap inline">
<nav class="navigation inline simple light" data-sticky-bar="0">
<div class="menu-rubriki-container"><ul id="menu-rubriki" class="menu"><li id="menu-item-109" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-cat-1 menu-item-109"><a href="https://otus.ru/journal/category/pro-it/" data-wpel-link="internal"><span>Про IT</span></a></li>
<li id="menu-item-113" class="menu-item menu-item-type-taxonomy menu-item-object-category current-post-ancestor current-menu-parent current-post-parent menu-cat-4 menu-item-113"><a href="https://otus.ru/journal/category/polza/" data-wpel-link="internal"><span>Полезное</span></a></li>
<li id="menu-item-114" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-cat-3 menu-item-114"><a href="https://otus.ru/journal/category/lifestyle/" data-wpel-link="internal"><span>Лайфстайл</span></a></li>
<li id="menu-item-10406" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10406"><a href="https://otus.ru/catalog/courses" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right"><span>Обучение</span><span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li id="menu-item-10407" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10407"><a href="https://otus.ru/about" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right"><span>Информация</span><span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
</ul></div> </nav>
</div>
<div class="actions">
<div class="otus-login-site">
<a href="https://otus.ru/login/" target="_blank" data-wpel-link="external" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Войти<span class="wpel-icon wpel-image wpel-icon-6"></span></a>
</div>
<a href="#" title="Search" class="search-link"><i class="fa fa-search"></i></a>
</div>
</div>
</div>
</header> <!-- .main-head -->
<div class="nav nav_disable nav_colored nav_transparent course-categories__nav nav__scroll ">
<div class="container wrap">
<div class="links inline simple light scrollable-menu">
<div class="menu-menju-navykov-container"><ul id="menu-menju-navykov" class="menu"><li id="menu-item-10413" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10413"><a href="https://otus.ru/categories/programming/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Программирование<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li id="menu-item-10414" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10414"><a href="https://otus.ru/categories/architecture/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Архитектура<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li id="menu-item-10415" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10415"><a href="https://otus.ru/categories/operations/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Инфраструктура<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li id="menu-item-10416" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10416"><a href="https://otus.ru/categories/information-security-courses/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Безопасность<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li id="menu-item-10417" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10417"><a href="https://otus.ru/categories/data-science/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Data Science<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li id="menu-item-10418" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10418"><a href="https://otus.ru/categories/gamedev/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">GameDev<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li id="menu-item-10419" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10419"><a href="https://otus.ru/categories/marketing-business/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Управление<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li id="menu-item-10420" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10420"><a href="https://otus.ru/categories/analytics/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Аналитика и анализ<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li id="menu-item-10421" class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10421"><a href="https://otus.ru/categories/testing/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Тестирование<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
</ul></div> </div>
</div>
</div>
<div class="main wrap">
<div class="ts-row cf">
<div class="col-8 main-content cf">
<article id="post-9859" class="the-post post-9859 post type-post status-publish format-standard has-post-thumbnail category-polza tag-beautiful-soup">
<header class="post-header the-post-header cf">
<div class="post-meta the-post-meta">
<span class="post-cat">
<a href="https://otus.ru/journal/category/polza/" class="category" data-wpel-link="internal">Полезное</a>
</span>
<h1 class="post-title">
Парсер: описание и пример кода
</h1>
<a href="https://otus.ru/journal/parser-opisanie-i-primer-koda/" class="date-link" data-wpel-link="internal"><time class="post-date">13 мая, 2024</time></a>
</div>
<div class="featured">
<a href="https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-93-1.jpg" class="image-link" data-wpel-link="internal"><img width="770" height="515" src="data:image/svg+xml,%3Csvg%20viewBox%3D%270%200%20770%20515%27%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%3E%3C%2Fsvg%3E" class="attachment-contentberg-main size-contentberg-main lazyload wp-post-image" alt="Парсер: описание и пример кода" title="Парсер: описание и пример кода" decoding="async" fetchpriority="high" data-srcset="https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-93-1-770x515.jpg 770w, https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-93-1-270x180.jpg 270w" data-src="https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-93-1-770x515.jpg" data-sizes="(max-width: 770px) 100vw, 770px" /> </a>
</div>
</header><!-- .post-header -->
<div class="post-content description cf entry-content content-normal">
<div id="ez-toc-container" class="ez-toc-v2_0_61 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction">
<div class="ez-toc-title-container">
<p class="ez-toc-title " >Содержание</p>
<span class="ez-toc-title-toggle"><a href="#" class="ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle" aria-label="Toggle Table of Content"><span class="ez-toc-js-icon-con"><span class=""><span class="eztoc-hide" style="display:none;">Toggle</span><span class="ez-toc-icon-toggle-span"><svg style="fill: #999;color:#999" xmlns="http://www.w3.org/2000/svg" class="list-377408" width="20px" height="20px" viewBox="0 0 24 24" fill="none"><path d="M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z" fill="currentColor"></path></svg><svg style="fill: #999;color:#999" class="arrow-unsorted-368013" xmlns="http://www.w3.org/2000/svg" width="10px" height="10px" viewBox="0 0 24 24" version="1.2" baseProfile="tiny"><path d="M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z"/></svg></span></span></span></a></span></div>
<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class="ez-toc-link ez-toc-heading-1" href="#%D0%9E%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5" title="Определение">Определение</a></li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class="ez-toc-link ez-toc-heading-2" href="#%D0%9E%D0%B1%D0%BB%D0%B0%D1%81%D1%82%D0%B8_%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D0%BD%D0%B5%D0%BD%D0%B8%D1%8F" title="Области применения">Области применения</a></li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class="ez-toc-link ez-toc-heading-3" href="#%D0%9F%D1%80%D0%B8%D0%BD%D1%86%D0%B8%D0%BF_%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D1%8B" title="Принцип работы">Принцип работы</a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class="ez-toc-link ez-toc-heading-4" href="#%D0%98%D1%81%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D1%83%D0%B5%D0%BC%D1%8B%D0%B5_%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D1%8B" title="Используемые алгоритмы">Используемые алгоритмы</a></li></ul></li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class="ez-toc-link ez-toc-heading-5" href="#%D0%9F%D1%80%D0%B5%D0%B8%D0%BC%D1%83%D1%89%D0%B5%D1%81%D1%82%D0%B2%D0%B0_%D0%B8_%D0%BD%D0%B5%D0%B4%D0%BE%D1%81%D1%82%D0%B0%D1%82%D0%BA%D0%B8" title="Преимущества и недостатки">Преимущества и недостатки</a></li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class="ez-toc-link ez-toc-heading-6" href="#%D0%9D%D0%B0%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80%D0%B0" title="Написание парсера">Написание парсера</a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class="ez-toc-link ez-toc-heading-7" href="#%D0%91%D0%B8%D0%B1%D0%BB%D0%B8%D0%BE%D1%82%D0%B5%D0%BA%D0%B8_Python_%D0%B4%D0%BB%D1%8F_%D0%BF%D0%B0%D1%80%D1%81%D0%B8%D0%BD%D0%B3%D0%B0" title="Библиотеки Python для парсинга">Библиотеки Python для парсинга</a><ul class='ez-toc-list-level-4' ><li class='ez-toc-heading-level-4'><a class="ez-toc-link ez-toc-heading-8" href="#Requests" title="Requests">Requests</a></li><li class='ez-toc-page-1 ez-toc-heading-level-4'><a class="ez-toc-link ez-toc-heading-9" href="#Beautiful_Soup" title="Beautiful Soup">Beautiful Soup</a></li><li class='ez-toc-page-1 ez-toc-heading-level-4'><a class="ez-toc-link ez-toc-heading-10" href="#Selenium" title="Selenium">Selenium</a></li></ul></li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class="ez-toc-link ez-toc-heading-11" href="#%D0%A3%D1%81%D1%82%D0%B0%D0%BD%D0%BE%D0%B2%D0%BA%D0%B0_%D0%B1%D0%B8%D0%B1%D0%BB%D0%B8%D0%BE%D1%82%D0%B5%D0%BA" title="Установка библиотек">Установка библиотек</a></li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class="ez-toc-link ez-toc-heading-12" href="#%D0%9F%D0%BE%D0%B8%D1%81%D0%BA_%D1%81%D0%B0%D0%B9%D1%82%D0%B0_%D0%B4%D0%BB%D1%8F_%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D1%8B" title="Поиск сайта для работы">Поиск сайта для работы</a></li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class="ez-toc-link ez-toc-heading-13" href="#%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_%D1%81%D0%BA%D1%80%D0%B8%D0%BF%D1%82%D0%B0" title="Создание скрипта">Создание скрипта</a></li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class="ez-toc-link ez-toc-heading-14" href="#HTML-%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D1%83%D1%80%D0%B0" title="HTML-структура">HTML-структура</a></li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class="ez-toc-link ez-toc-heading-15" href="#HTML-%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%BA%D0%B0_%D0%B8_%D0%B5%D0%B5_%D0%BF%D0%B0%D1%80%D1%81%D0%B8%D0%BD%D0%B3" title="HTML-разметка и ее парсинг">HTML-разметка и ее парсинг</a></li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class="ez-toc-link ez-toc-heading-16" href="#Beautiful_Soup_%D0%B8_%D1%81%D0%B2%D0%BE%D0%B9%D1%81%D1%82%D0%B2%D0%BE_text" title="Beautiful Soup и свойство text">Beautiful Soup и свойство text</a></li></ul></li></ul></nav></div>
<p>Информация для бизнеса и его продвижения – один из самых ценных ресурсов. Это привело к тому, что владельцы различных компаний стали интересоваться изобретением и приобретением специализированных инструментов для сбора и анализа данных.</p>
<p>Одним из подобных продуктов выступает так называемый парсер. Далее предстоит познакомиться с ними получше. Необходимо разобраться в особенностях и областях применения парсеров, их преимуществах и недостатках. Также предстоит изучить алгоритм написания первого такого инструмента на Python. В работе будет использована библиотека Beautiful Soup. Предложенная информация пригодится как программистам-новичкам, так и их более опытным коллегам.</p>
<h2 class="wp-block-heading"><span class="ez-toc-section" id="%D0%9E%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5"></span>Определение<span class="ez-toc-section-end"></span></h2>
<p>Google характеризует парсер как программу, с помощью которой осуществляется сбор данных с различных веб-сайтов, их анализ и объединение в информационные базы в различных форматах. Подобный сервис избавляет клиентов от необходимости выполнения огромного объема однотипных задач, а также экономит время и силы.</p>
<p>Парсер – приложение для сбора и анализа данных. Парсинг – это сам процесс сбора информации. Он может осуществляться как вручную, так и через специальные программы.</p>
<h2 class="wp-block-heading"><span class="ez-toc-section" id="%D0%9E%D0%B1%D0%BB%D0%B0%D1%81%D1%82%D0%B8_%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D0%BD%D0%B5%D0%BD%D0%B8%D1%8F"></span>Области применения<span class="ez-toc-section-end"></span></h2>
<p>Парсинг, согласно Google – операция, которая применяется в любых областях, где требуется анализ и систематизация крупных информационных объемов.</p>
<p>Чаще всего парсинг встречается в:</p>
<ol>
<li>Разработке программного обеспечения. Компьютеры способны воспринимать только машинный код – набор нулей и единиц. Чтобы устройство выполняло различные операции, нужно пользоваться языками программирования. Они понятны разработчикам, но не компьютерам. Из-за этого специальные программы сначала проводят парсинг написанного приложения, затем – переводят их в бинарный машинный код для дальнейшей обработки.</li>
<li>Создании сайтов. HTML и другие языки разметки по умолчанию компьютерам не понятны. Для отображения HTML-разметки в виде понятного и структурированного интерфейса сайта используются парсеры. Они встроены в браузеры. Данные приложения, согласно Google, переводят HTML-код в машинный формат. Парсинг также дает возможность обнаруживать ошибки в получившемся сайте.</li>
<li>Веб-краулинге. Так называется частный случай парсинга. Google указывает, что при краулинге робот-парсер поисковой системы в ответ на пользовательский запрос будет просматривать релевантные ему страницы, а затем – выбирать наиболее подходящую по содержанию страницу. Краулеры не занимаются извлечением информации с сайтов. Они только ищут совпадения с пользовательским запросом.</li>
<li>Агрегации новостей. Рассматриваемые программы используются для упорядоченной подачи новостей.</li>
<li>Интернет-маркетинге. В SEO и SMM при помощи парсеров, согласно Google, осуществляется сбор и анализ данных пользователей, товарных позиций в Интернет-магазинах, метатегов, ключевых слов и иной информации. Соответствующие сведения будут использоваться для оптимизации сайтов, их продвижения в социальных сетях, а также для настройки таргетированной и контекстной рекламы.</li>
<li>Мониторинге цен. Google подчеркивает, что при помощи программ-парсеров можно извлекать расценки товаров на сайтах-конкурентах для дальнейшего анализа ситуации на рынке. Эти данные также помогают формировать ценовую политику.</li>
</ol>
<p>Google подчеркивает, что парсинг (parsing) – это очень полезная операция для бизнеса и SEO/SMM.</p>
<h2 class="wp-block-heading"><span class="ez-toc-section" id="%D0%9F%D1%80%D0%B8%D0%BD%D1%86%D0%B8%D0%BF_%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D1%8B"></span>Принцип работы<span class="ez-toc-section-end"></span></h2>
<p>Слово «парсинг» произошло от английского «to parse» – «по частям». Google описывает рассматриваемый процесс как синтаксический анализ любого представленного набора связанных друг с другом данных.</p>
<p>В общих чертах можно представить работу парсеров так:</p>
<ol>
<li>Сначала сканируется исходный информационный массив (HTML-коды, базы данных, текст и так далее).</li>
<li>После – осуществляется поиск и выявление семантически значимых единиц по заданным параметрам. Примерами могут послужить заголовки, ссылки, абзацы с жирным выделением, пункты меню.</li>
<li>Завершается процесс конвертацией полученной информации в формат, удобный для изучения человеком, а также ее систематизация в виде таблиц или отчетов.</li>
</ol>
<p>Google отмечает – объектом парсинга может стать любая грамматически структурированная система: информация, закодированная естественным языком, математическими выражениями, языками программирования и так далее.</p>
<h3 class="wp-block-heading"><span class="ez-toc-section" id="%D0%98%D1%81%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D1%83%D0%B5%D0%BC%D1%8B%D0%B5_%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D1%8B"></span>Используемые алгоритмы<span class="ez-toc-section-end"></span></h3>
<p>Примером использования парсинга может послужить SEO-оптимизация сайта. В процессе работы соответствующие приложения действуют по двум алгоритмам:</p>
<ol>
<li>Нисходящий парсинг. Google описывает его как анализ, который осуществляется от общего к частному. Синтаксическое дерево разрастается вниз.</li>
<li>Восходящий парсинг. Согласно Google, это анализ и построение синтаксического дерева, которые осуществляются снизу-вверх.</li>
</ol>
<p>Выбор метода реализации рассматриваемой процедуры зависит от итоговой цели. Программа-парсер в случае чего должна уметь вычленять из общего массива только необходимую пользователю информацию и преобразовывать ее в удобный для решения той или иной задачи формат.</p>
<h2 class="wp-block-heading"><span class="ez-toc-section" id="%D0%9F%D1%80%D0%B5%D0%B8%D0%BC%D1%83%D1%89%D0%B5%D1%81%D1%82%D0%B2%D0%B0_%D0%B8_%D0%BD%D0%B5%D0%B4%D0%BE%D1%81%D1%82%D0%B0%D1%82%D0%BA%D0%B8"></span>Преимущества и недостатки<span class="ez-toc-section-end"></span></h2>
<p>Программы-парсеры, согласно Google, имеют следующие преимущества:</p>
<ul>
<li>возможность автоматизации процесса анализа информации;</li>
<li>снижение нагрузки на сотрудников при работе с большими информационными объемами;</li>
<li>экономия времени сотрудников компании на решение тех или иных задач;</li>
<li>ускорение анализа большого объема данных;</li>
<li>выявление ошибок на сайтах или в любых других информационных продуктах, если в приложении заданы соответствующие настройки.</li>
</ul>
<p>Рассматриваемый инструмент – это функциональное и полезное программное обеспечение, но оно имеет некоторые недостатки. К ним можно отнести не всегда релевантный анализ данных. Этот момент напрямую зависит от возможностей выбранного для парсинга программного обеспечения. Большинство таких продуктов позволяют осуществлять детализированную настройку для обработки информации.</p>
<h2 class="wp-block-heading"><span class="ez-toc-section" id="%D0%9D%D0%B0%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80%D0%B0"></span>Написание парсера<span class="ez-toc-section-end"></span></h2>
<p>Задумываясь над тем, как создать парсер, необходимо сначала определиться с языком программирования. Далее будет представлен код соответствующего инструмента на Python. Этот язык разработки является достаточно простым для понимания. Он поддерживает множество библиотек и фреймворков, значительно упрощающих написание программного обеспечения.</p>
<h3 class="wp-block-heading"><span class="ez-toc-section" id="%D0%91%D0%B8%D0%B1%D0%BB%D0%B8%D0%BE%D1%82%D0%B5%D0%BA%D0%B8_Python_%D0%B4%D0%BB%D1%8F_%D0%BF%D0%B0%D1%80%D1%81%D0%B8%D0%BD%D0%B3%D0%B0"></span>Библиотеки Python для парсинга<span class="ez-toc-section-end"></span></h3>
<p>Google отмечает, что у Python предусматриваются разнообразные библиотеки, помогающие в создании парсеров. Их несколько, но упор будет сделан всего на одну – Beautiful Soup.</p>
<h4 class="wp-block-heading"><span class="ez-toc-section" id="Requests"></span><em>Requests</em><span class="ez-toc-section-end"></span></h4>
<p>Библиотека, позволяющая выполнять HTTP-запросы при помощи Python. С ее помощью можно значительно облегчить отправку HTTP-запросов, особенно по сравнению со стандартной Python-библиотекой HTTP. Requests имеет огромную роль для скрапинга и парсинга. Это связано с тем, что для сбора информации со страницы сначала необходимо получить ее через HTTP-запрос GET.</p>
<h4 class="wp-block-heading"><span class="ez-toc-section" id="Beautiful_Soup"></span><em>Beautiful Soup</em><span class="ez-toc-section-end"></span></h4>
<p>Beautiful Soup (далее – просто Soup) – библиотека, которая значительно упрощает сбор информации со страниц. Она поддерживает работу с любым HTML- или XML-парсером, а также предоставляет все необходимое для поиска, итерации, модификации абстрактного синтаксического дерева.</p>
<p>Beautiful Soup разрешено использовать вместе с html.parser. Это парсер, который, согласно Google, включен в стандартную библиотеку Python. Он позволяет парсить текстовые HTML-документы. Beautiful Soup поможет обойти DOM и извлечь из него необходимую информацию.</p>
<h4 class="wp-block-heading"><span class="ez-toc-section" id="Selenium"></span><em>Selenium</em><span class="ez-toc-section-end"></span></h4>
<p>Google называет Selenium современной системой автоматизированного тестирования с открытым исходным кодом. С ее помощью получится выполнять различные операции на страницах в веб-браузерах.</p>
<p>Selenium даст возможность поручить браузеру выполнение некоторых задач. Страницы, посещаемые данной «библиотекой», отображаются в реальном браузере. у Selenium есть все необходимое для создания собственного парсера без привлечения дополнительных инструментов.</p>
<h3 class="wp-block-heading"><span class="ez-toc-section" id="%D0%A3%D1%81%D1%82%D0%B0%D0%BD%D0%BE%D0%B2%D0%BA%D0%B0_%D0%B1%D0%B8%D0%B1%D0%BB%D0%B8%D0%BE%D1%82%D0%B5%D0%BA"></span>Установка библиотек<span class="ez-toc-section-end"></span></h3>
<p>Перед началом разработки рассматриваемого приложения необходимо сначала установить ряд Python-библиотек. К ним относятся: lxml, Beautiful Soup и Requests. Сделать это лучше всего через pip:</p>
<p><code>pip install lxml</code></p>
<p><code>pip install requests</code></p>
<p><code>pip install beautifulsoup4</code></p>
<p>Теперь все готово к полноценной разработке. Она будет вестись в несколько этапов. Такой подход, согласно Google, позволяет лучше разобраться в процедуре написания рассматриваемого приложения.</p>
<h3 class="wp-block-heading"><span class="ez-toc-section" id="%D0%9F%D0%BE%D0%B8%D1%81%D0%BA_%D1%81%D0%B0%D0%B9%D1%82%D0%B0_%D0%B4%D0%BB%D1%8F_%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D1%8B"></span>Поиск сайта для работы<span class="ez-toc-section-end"></span></h3>
<p>Знакомство с рассматриваемой операцией рекомендуется проводить при помощи этого сайта: https://quotes.toscrape.com/. Он был создан для скрапинга и парсинга.</p>
<p>С помощью соответствующего сервиса можно сделать хранилище имен авторов, тегов или имеющихся цитат. Для этого достаточно изучить исходный код страницы. Это те самые данные, что будут возвращаться на посылаемый запрос. В современных браузерах посмотреть код сайта получится, если кликнуть правой кнопкой мыши на странице и выбрать пункт «Просмотр кода страницы».</p>
<p>На экране появится HTML-разметка. Вот ее наглядный пример:</p>
<figure class="wp-block-image"><img decoding="async" src="https://lh7-us.googleusercontent.com/AS34AX5mZbQNz0jF1UeQTTH__o7sOBmKp0RVJlah4QZcFwR3zb-MmZtzgu4yArZq5vO06hUScwKJAsyMIREiOl_pK4pWCtWOcy-owxpf__jSbFw_O9RkF4Dj0Guv-uOGQmZpREoTmKaudN2r91re2g" alt="Парсер: описание и пример кода"/></figure>
<p>Здесь можно заметить, что разметка включает в себя массу перемешанных данных. Задачей веб-скраппинга, согласно Google, является получение доступа к тем частям страницы, которые действительно нужны для дальнейшей работы пользователя. Соответствующая операция возможна при помощи регулярных выражений, но лучше всего пользоваться библиотекой Beautiful Soup.</p>
<h3 class="wp-block-heading"><span class="ez-toc-section" id="%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_%D1%81%D0%BA%D1%80%D0%B8%D0%BF%D1%82%D0%B0"></span>Создание скрипта<span class="ez-toc-section-end"></span></h3>
<p>Теперь можно начать написание программного кода для будущего приложения-парсера. В любой IDE (пример – PyCharm) нужно добавить новый файл. Этот документ будет отвечать непосредственно за парсинг.</p>
<figure class="wp-block-image"><img decoding="async" src="https://lh7-us.googleusercontent.com/cvDK_NTzXGK0UgyQbe9yVE8sK70uJ2YWkYmtKFiR0V6JqRJYLIAtfBg9pJnWnhtxLA5-3uVgbZfOPr2EoGqEyHSiAwYqrynbaavLLaU3hKX0CWp6LPHSx3s2TMxK8xZ59fwLXwE3Rc5-AKDN89sLYA" alt="Парсер: описание и пример кода"/></figure>
<p>Выше можно увидеть начало будущего приложения. Google указывает, что данный фрагмент работает так:</p>
<ol>
<li>В верхней части файла осуществляет импорт библиотек: Requests и Beautiful Soup.</li>
<li>Далее в переменной url происходит сохранение адреса страницы, с которой поступает информация.</li>
<li>Url (переменная) передает функции requests.get().</li>
<li>Результат передается переменной response.</li>
<li>Далее используется конструктор BeautifulSoup(). Он необходим для размещения текста ответа в переменную soup.</li>
<li>В качестве используемого формата выбран lxml.</li>
<li>В самом конце нужно вывести переменную soup на экран.</li>
</ol>
<p>Google описывает работу предложенного фрагмента так:</p>
<ol>
<li>Приложение заходит на обозначенный сайт.</li>
<li>Осуществляется считывание данных.</li>
<li>Программа-парсер получает исходный код.</li>
</ol>
<p>Все это – аналогия ручного подхода, но с помощью предложенного фрагмента запуск процесса осуществляется буквально в один клик.</p>
<h3 class="wp-block-heading"><span class="ez-toc-section" id="HTML-%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D1%83%D1%80%D0%B0"></span>HTML-структура<span class="ez-toc-section-end"></span></h3>
<p>HTML – это язык гипертекста. Он включает в себя множество разнообразных тегов. Стандартными (и основными) выступают всего три элемента:</p>
<ul>
<li>body;</li>
<li>html;</li>
<li>head.</li>
</ul>
<p>Эти теги отвечают за организацию всего HTML-документа. В случае с парсингом и скрапингом, согласно Google, значимость имеет только body.</p>
<p>Ранее представленный фрагмент кода с Beautiful Soup уже получает информацию о разметке с указанного веб-адреса. Теперь необходимо сконцентрироваться только на интересующих пользователя сведениях.</p>
<p>Если в браузере активировать инструмент «Inspect» (сочетанием CTRL+SHIFT+I), можно увидеть, какая из частей разметки отвечает за те или иные компоненты на веб-странице. Достаточно навести курсор на определенный тег span, чтобы он подсветил соответствующую информацию. Google отмечает, что каждая цитата относится к тегу span с классом text.</p>
<p>Так осуществляется дешифровка данных, которые необходимо получить. Сначала требуется найти некий шаблон на заданной странице, а затем – создать код, который будет для него работать. Скрапинг позволяет извлекать все похожие разделы HTML-документа.</p>
<h3 class="wp-block-heading"><span class="ez-toc-section" id="HTML-%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%82%D0%BA%D0%B0_%D0%B8_%D0%B5%D0%B5_%D0%BF%D0%B0%D1%80%D1%81%D0%B8%D0%BD%D0%B3"></span>HTML-разметка и ее парсинг<span class="ez-toc-section-end"></span></h3>
<p>HTML-документы включают в себя множество информации, но за счет библиотеки Beautiful Soup становится намного проще искать нужные данные. Обычно для этого достаточно написать всего одну строку кода.</p>
<p>Необходимо найти все теги span с классом text. Если нужно отыскать несколько одинаковых тегов, предстоит пользоваться функцией find_all():</p>
<figure class="wp-block-image"><img decoding="async" src="https://lh7-us.googleusercontent.com/ZiMX0qCzdGDyS8e5FO1zDAS8UivqH798BAbENfy6AJzl16blhcfx5VR5QkUJs756nOt3emUxlUJFtQz0f5mvE2xkthymclxBMcJshVm5XOy6uUgEUQTLIEgw1iOZsTta--x9UMVEjwCDamjtyXdUHw" alt="Парсер: описание и пример кода"/></figure>
<p>В результате работы данного фрагмента переменная quotes получит список элементов span с классом text из имеющегося HTML-файла.</p>
<h3 class="wp-block-heading"><span class="ez-toc-section" id="Beautiful_Soup_%D0%B8_%D1%81%D0%B2%D0%BE%D0%B9%D1%81%D1%82%D0%B2%D0%BE_text"></span>Beautiful Soup и свойство text<span class="ez-toc-section-end"></span></h3>
<p>Возвращаемая разметка – это не то, что нужно специалистам в процессе парсинга. Для получения только информации (в предложенном примере – цитат) требуется использовать свойство .text библиотеки Beautiful Soup.</p>
<figure class="wp-block-image"><img decoding="async" src="https://lh7-us.googleusercontent.com/IkOa9yX0fw1ASu2bekTy9PJFtgQhUTSWROEWaRdsrS63uNuXpCrdGjaGCaTCZ5af-i_qCbGxpbEzAY4fYB6OsCbaG0tobZxbb0DFs5TxhxhZ8suatPvZg0U8wUsxkxcZZ-olEhMJdAPIKems_PpGPQ" alt="Парсер: описание и пример кода"/></figure>
<p>Выше представлен код, который перебивает все полученные данные и выводит только нужное человеку содержимое.</p>
<p>Для поиска и вывода всех авторов используется следующий код:</p>
<figure class="wp-block-image"><img decoding="async" src="https://lh7-us.googleusercontent.com/46Pra6TxmcEJpseVFEpoqGCoN-5jPS-fHXnMsdKH2h7HMTkSPwSo7g2AZquZ5L1kaZM2jWjNoQ3B9af7BSW8F8h1bAAkhES5lhIc0_I5tikJJjpfVQ5raVCkpLDU3tnNiufKoIJKdASjLsJvQjrbKQ" alt="Парсер: описание и пример кода"/></figure>
<p>Здесь:</p>
<ol>
<li>Сначала осуществляется ручное изучение страницы. Можно обратить внимание на то, что каждый автор заключен в тег <small> с классом author.</li>
<li>Использовать функцию find_all().</li>
<li>Сохранить результат в переменную authors.</li>
</ol>
<p>Рекомендуется также поменять цикл. Это поможет сразу при помощи Soup перебирать цитаты и авторов.</p>
<p>Завершающим этапом процесса Google называет получение всех тегов для каждой имеющейся цитаты. Здесь сначала придется получить каждый внешний блок каждой теговой коллекции. Если этого не сделать, при помощи Soup получится извлечь теги, а ассоциировать их с конкретной цитатой – нет.</p>
<p>После получения блока можно опуститься ниже, используя функцию find_all для соответствующего подмножества. Заключительным этапом работы с Soup станет добавление внутреннего цикла для прекращения процесса.</p>
<figure class="wp-block-image"><img decoding="async" src="https://lh7-us.googleusercontent.com/wJ9AdpfMbVArV8PWNAV8iGTZfdoonOSTYbdI72_3ItTZPBS-VWJqly8q7247PHAz9EJPSorpdhijalotTpqA5pDo3DUv1OxkWHWVkf5F28r9Y4h7pqTbmg7N0aYZbAJkXvdmXz8-g-zXxtiMgg2CvQ" alt="Парсер: описание и пример кода"/></figure>
<p>Выше можно увидеть наглядный пример того, как написать парсер при помощи Beautiful Soup. Это всего лишь один из множества вариантов. Лучше разобраться с рассматриваемой операцией, Python и Beautiful Soup помогут дистанционные компьютерные курсы.</p>
<p><em>Хотите освоить современную IT-специальность? Огромный выбор курсов по востребованным IT-направлениям есть в <a href="https://otus.ru/?utm_source=oj" target="_blank" rel="noreferrer noopener nofollow external" data-wpel-link="external" class="wpel-icon-right">Otus<span class="wpel-icon wpel-image wpel-icon-6"></span></a>!</em> </p>
</div><!-- .post-content -->
<div class="the-post-foot cf">
<div class="tag-share cf">
<div class="post-tags"><a href="https://otus.ru/journal/tag/beautiful-soup/" rel="tag" data-wpel-link="internal">Beautiful Soup</a></div>
<div class="post-share">
<div class="post-share-icons cf">
<span class="counters">
</span>
<a href="https://www.facebook.com/sharer.php?u=https%3A%2F%2Fotus.ru%2Fjournal%2Fparser-opisanie-i-primer-koda%2F" class="link facebook wpel-icon-right" target="_blank" title="Share on Facebook" data-wpel-link="external" rel="nofollow external noopener noreferrer"><i class="fa fa-facebook"></i><span class="wpel-icon wpel-image wpel-icon-6"></span></a>
<a href="https://twitter.com/intent/tweet?url=https%3A%2F%2Fotus.ru%2Fjournal%2Fparser-opisanie-i-primer-koda%2F&text=%D0%9F%D0%B0%D1%80%D1%81%D0%B5%D1%80%3A%20%D0%BE%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%B8%20%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%20%D0%BA%D0%BE%D0%B4%D0%B0" class="link twitter wpel-icon-right" target="_blank" title="Share on Twitter" data-wpel-link="external" rel="nofollow external noopener noreferrer"><i class="fa fa-twitter"></i><span class="wpel-icon wpel-image wpel-icon-6"></span></a>
<a href="https://www.linkedin.com/shareArticle?mini=true&url=https%3A%2F%2Fotus.ru%2Fjournal%2Fparser-opisanie-i-primer-koda%2F" class="link linkedin wpel-icon-right" target="_blank" title="LinkedIn" data-wpel-link="external" rel="nofollow external noopener noreferrer"><i class="fa fa-linkedin"></i><span class="wpel-icon wpel-image wpel-icon-6"></span></a>
<a href="https://pinterest.com/pin/create/button/?url=https%3A%2F%2Fotus.ru%2Fjournal%2Fparser-opisanie-i-primer-koda%2F&media=https%3A%2F%2Fotus.ru%2Fjournal%2Fwp-content%2Fuploads%2F2024%2F05%2Foj-1080x720-93-1.jpg&description=%D0%9F%D0%B0%D1%80%D1%81%D0%B5%D1%80%3A%20%D0%BE%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%B8%20%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%20%D0%BA%D0%BE%D0%B4%D0%B0" class="link pinterest wpel-icon-right" target="_blank" title="Pinterest" data-wpel-link="external" rel="nofollow external noopener noreferrer"><i class="fa fa-pinterest-p"></i><span class="wpel-icon wpel-image wpel-icon-6"></span></a>
</div>
</div>
</div>
</div>
<div class="post-nav">
<div class="post previous cf">
<a href="https://otus.ru/journal/osnovy-ispolzovaniya-makrosov-v-excel/" title="Prev Post" class="nav-icon" data-wpel-link="internal">
<i class="fa fa-angle-left"></i>
</a>
<span class="content">
<a href="https://otus.ru/journal/osnovy-ispolzovaniya-makrosov-v-excel/" class="image-link" rel="previous" data-wpel-link="internal">
<img width="150" height="106" src="data:image/svg+xml,%3Csvg%20viewBox%3D%270%200%20150%20106%27%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%3E%3C%2Fsvg%3E" class="attachment-thumbnail size-thumbnail lazyload wp-post-image" alt="Основы использования макросов в Excel" decoding="async" data-srcset="https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-92-150x106.jpg 150w, https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-92-300x212.jpg 300w, https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-92-1024x724.jpg 1024w, https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-92-768x543.jpg 768w, https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-92-1536x1086.jpg 1536w" data-src="https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-92-150x106.jpg" data-sizes="(max-width: 150px) 100vw, 150px" title="Основы использования макросов в Excel" /> </a>
<div class="post-meta">
<span class="label">Prev Post</span>
<div class="post-meta post-meta-b">
<h2 class="post-title">
<a href="https://otus.ru/journal/osnovy-ispolzovaniya-makrosov-v-excel/" data-wpel-link="internal">Основы использования макросов в Excel</a>
</h2>
<div class="below">
<a href="https://otus.ru/journal/osnovy-ispolzovaniya-makrosov-v-excel/" class="meta-item date-link" data-wpel-link="internal"><time class="post-date" datetime="2024-05-07T22:29:24+00:00">7 мая, 2024</time></a>
<span class="meta-sep"></span>
<span class="meta-item read-time">9 Mins Read</span>
</div>
</div> </div>
</span>
</div>
<div class="post next cf">
<a href="https://otus.ru/journal/kak-napisat-programmu-s-nulya-i-stat-programmistom/" title="Next Post" class="nav-icon" data-wpel-link="internal">
<i class="fa fa-angle-right"></i>
</a>
<span class="content">
<a href="https://otus.ru/journal/kak-napisat-programmu-s-nulya-i-stat-programmistom/" class="image-link" rel="next" data-wpel-link="internal">
<img width="150" height="106" src="data:image/svg+xml,%3Csvg%20viewBox%3D%270%200%20150%20106%27%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%3E%3C%2Fsvg%3E" class="attachment-thumbnail size-thumbnail lazyload wp-post-image" alt="Как написать программу с нуля и стать программистом" decoding="async" data-srcset="https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-94-150x106.jpg 150w, https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-94-300x212.jpg 300w, https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-94-1024x724.jpg 1024w, https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-94-768x543.jpg 768w, https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-94-1536x1086.jpg 1536w" data-src="https://otus.ru/journal/wp-content/uploads/2024/05/oj-1080x720-94-150x106.jpg" data-sizes="(max-width: 150px) 100vw, 150px" title="Как написать программу с нуля и стать программистом" /> </a>
<div class="post-meta">
<span class="label">Next Post</span>
<div class="post-meta post-meta-b">
<h2 class="post-title">
<a href="https://otus.ru/journal/kak-napisat-programmu-s-nulya-i-stat-programmistom/" data-wpel-link="internal">Как написать программу с нуля и стать программистом</a>
</h2>
<div class="below">
<a href="https://otus.ru/journal/kak-napisat-programmu-s-nulya-i-stat-programmistom/" class="meta-item date-link" data-wpel-link="internal"><time class="post-date" datetime="2024-05-13T11:31:43+00:00">13 мая, 2024</time></a>
<span class="meta-sep"></span>
<span class="meta-item read-time">9 Mins Read</span>
</div>
</div> </div>
</span>
</div>
</div>
<section class="related-posts grid-3">
<h4 class="section-head"><span class="title">Читать ещё</span></h4>
<div class="ts-row posts cf">
<article class="post col-4">
<a href="https://otus.ru/journal/uroven-gotovnosti-cto-k-2026/" title="Уровень готовности CTO к 2026" class="image-link" data-wpel-link="internal">
<img width="270" height="180" src="data:image/svg+xml,%3Csvg%20viewBox%3D%270%200%20270%20180%27%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%3E%3C%2Fsvg%3E" class="image lazyload wp-post-image" alt="Уровень готовности CTO к 2026" title="Уровень готовности CTO к 2026" decoding="async" loading="lazy" data-srcset="https://otus.ru/journal/wp-content/uploads/2025/11/oj-1080x720-kopiya-3-270x180.jpg 270w, https://otus.ru/journal/wp-content/uploads/2025/11/oj-1080x720-kopiya-3-770x515.jpg 770w, https://otus.ru/journal/wp-content/uploads/2025/11/oj-1080x720-kopiya-3-370x245.jpg 370w" data-src="https://otus.ru/journal/wp-content/uploads/2025/11/oj-1080x720-kopiya-3-270x180.jpg" data-sizes="(max-width: 270px) 100vw, 270px" /> </a>
<div class="content">
<h3 class="post-title"><a href="https://otus.ru/journal/uroven-gotovnosti-cto-k-2026/" class="post-link" data-wpel-link="internal">Уровень готовности CTO к 2026</a></h3>
<div class="post-meta">
<time class="post-date" datetime="2025-11-16T19:50:59+00:00">16 ноября, 2025</time>
</div>
</div>
</article >
<article class="post col-4">
<a href="https://otus.ru/journal/novye-uroki-noyabrya-tolko-top-temy-po-programmirovaniju/" title="Новые уроки ноября: только топ-темы по программированию" class="image-link" data-wpel-link="internal">
<img width="270" height="180" src="data:image/svg+xml,%3Csvg%20viewBox%3D%270%200%20270%20180%27%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%3E%3C%2Fsvg%3E" class="image lazyload wp-post-image" alt="Новые уроки ноября: только топ-темы по программированию" title="Новые уроки ноября: только топ-темы по программированию" decoding="async" loading="lazy" data-srcset="https://otus.ru/journal/wp-content/uploads/2025/11/oj-1080x720-kopiya-2-270x180.jpg 270w, https://otus.ru/journal/wp-content/uploads/2025/11/oj-1080x720-kopiya-2-770x515.jpg 770w, https://otus.ru/journal/wp-content/uploads/2025/11/oj-1080x720-kopiya-2-370x245.jpg 370w" data-src="https://otus.ru/journal/wp-content/uploads/2025/11/oj-1080x720-kopiya-2-270x180.jpg" data-sizes="(max-width: 270px) 100vw, 270px" /> </a>
<div class="content">
<h3 class="post-title"><a href="https://otus.ru/journal/novye-uroki-noyabrya-tolko-top-temy-po-programmirovaniju/" class="post-link" data-wpel-link="internal">Новые уроки ноября: только топ-темы по программированию</a></h3>
<div class="post-meta">
<time class="post-date" datetime="2025-11-09T23:24:11+00:00">9 ноября, 2025</time>
</div>
</div>
</article >
<article class="post col-4">
<a href="https://otus.ru/journal/schjot-idjot-na-chasy/" title="Счёт идёт на часы" class="image-link" data-wpel-link="internal">
<img width="270" height="180" src="data:image/svg+xml,%3Csvg%20viewBox%3D%270%200%20270%20180%27%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%3E%3C%2Fsvg%3E" class="image lazyload wp-post-image" alt="Счёт идёт на часы" title="Счёт идёт на часы" decoding="async" loading="lazy" data-srcset="https://otus.ru/journal/wp-content/uploads/2025/10/oj-1080x720-kopiya-7-270x180.png 270w, https://otus.ru/journal/wp-content/uploads/2025/10/oj-1080x720-kopiya-7-770x515.png 770w, https://otus.ru/journal/wp-content/uploads/2025/10/oj-1080x720-kopiya-7-370x245.png 370w" data-src="https://otus.ru/journal/wp-content/uploads/2025/10/oj-1080x720-kopiya-7-270x180.png" data-sizes="(max-width: 270px) 100vw, 270px" /> </a>
<div class="content">
<h3 class="post-title"><a href="https://otus.ru/journal/schjot-idjot-na-chasy/" class="post-link" data-wpel-link="internal">Счёт идёт на часы</a></h3>
<div class="post-meta">
<time class="post-date" datetime="2025-10-30T15:04:59+00:00">30 октября, 2025</time>
</div>
</div>
</article >
</div>
</section>
</article> <!-- .the-post -->
</div>
<aside class="col-4 sidebar">
<div class="inner">
<ul>
<li id="search-2" class="widget widget_search"><h5 class="widget-title"><span>Поиск по блогу</span></h5>
<form method="get" class="search-form" action="https://otus.ru/journal/">
<label>
<span class="screen-reader-text">Search for:</span>
<input type="search" class="search-field" placeholder="Введите запрос и нажмите Enter" value="" name="s" title="Search for:" />
</label>
<button type="submit" class="search-submit"><i class="fa fa-search"></i></button>
</form>
</li>
<li id="tag_cloud-5" class="widget widget_tag_cloud"><h5 class="widget-title"><span>Метки</span></h5><div class="tagcloud"><a href="https://otus.ru/journal/tag/android-2/" class="tag-cloud-link tag-link-74 tag-link-position-1" style="font-size: 12.472222222222pt;" aria-label="Android (34 элемента)" data-wpel-link="internal">Android</a>
<a href="https://otus.ru/journal/tag/c-3/" class="tag-cloud-link tag-link-91 tag-link-position-2" style="font-size: 10.916666666667pt;" aria-label="C (23 элемента)" data-wpel-link="internal">C</a>
<a href="https://otus.ru/journal/tag/c-2/" class="tag-cloud-link tag-link-81 tag-link-position-3" style="font-size: 12.666666666667pt;" aria-label="C# (35 элементов)" data-wpel-link="internal">C#</a>
<a href="https://otus.ru/journal/tag/c/" class="tag-cloud-link tag-link-20 tag-link-position-4" style="font-size: 12.472222222222pt;" aria-label="c++ (34 элемента)" data-wpel-link="internal">c++</a>
<a href="https://otus.ru/journal/tag/computer-science/" class="tag-cloud-link tag-link-209 tag-link-position-5" style="font-size: 15.972222222222pt;" aria-label="computer science (78 элементов)" data-wpel-link="internal">computer science</a>
<a href="https://otus.ru/journal/tag/css/" class="tag-cloud-link tag-link-288 tag-link-position-6" style="font-size: 8.6805555555556pt;" aria-label="CSS (13 элементов)" data-wpel-link="internal">CSS</a>
<a href="https://otus.ru/journal/tag/data-science/" class="tag-cloud-link tag-link-151 tag-link-position-7" style="font-size: 8pt;" aria-label="Data Science (11 элементов)" data-wpel-link="internal">Data Science</a>
<a href="https://otus.ru/journal/tag/devops/" class="tag-cloud-link tag-link-98 tag-link-position-8" style="font-size: 10.138888888889pt;" aria-label="devops (19 элементов)" data-wpel-link="internal">devops</a>
<a href="https://otus.ru/journal/tag/docker/" class="tag-cloud-link tag-link-143 tag-link-position-9" style="font-size: 8.2916666666667pt;" aria-label="Docker (12 элементов)" data-wpel-link="internal">Docker</a>
<a href="https://otus.ru/journal/tag/gamedev/" class="tag-cloud-link tag-link-25 tag-link-position-10" style="font-size: 11.694444444444pt;" aria-label="gamedev (28 элементов)" data-wpel-link="internal">gamedev</a>
<a href="https://otus.ru/journal/tag/hr/" class="tag-cloud-link tag-link-103 tag-link-position-11" style="font-size: 8pt;" aria-label="hr (11 элементов)" data-wpel-link="internal">hr</a>
<a href="https://otus.ru/journal/tag/html/" class="tag-cloud-link tag-link-217 tag-link-position-12" style="font-size: 11.208333333333pt;" aria-label="HTML (25 элементов)" data-wpel-link="internal">HTML</a>
<a href="https://otus.ru/journal/tag/ios/" class="tag-cloud-link tag-link-101 tag-link-position-13" style="font-size: 8.9722222222222pt;" aria-label="iOS (14 элементов)" data-wpel-link="internal">iOS</a>
<a href="https://otus.ru/journal/tag/it/" class="tag-cloud-link tag-link-50 tag-link-position-14" style="font-size: 10.527777777778pt;" aria-label="IT (21 элемент)" data-wpel-link="internal">IT</a>
<a href="https://otus.ru/journal/tag/java/" class="tag-cloud-link tag-link-75 tag-link-position-15" style="font-size: 15.680555555556pt;" aria-label="Java (73 элемента)" data-wpel-link="internal">Java</a>
<a href="https://otus.ru/journal/tag/javascript/" class="tag-cloud-link tag-link-83 tag-link-position-16" style="font-size: 14.319444444444pt;" aria-label="JavaScript (53 элемента)" data-wpel-link="internal">JavaScript</a>
<a href="https://otus.ru/journal/tag/linux/" class="tag-cloud-link tag-link-141 tag-link-position-17" style="font-size: 11.888888888889pt;" aria-label="Linux (29 элементов)" data-wpel-link="internal">Linux</a>
<a href="https://otus.ru/journal/tag/machine-learning/" class="tag-cloud-link tag-link-167 tag-link-position-18" style="font-size: 8.6805555555556pt;" aria-label="Machine Learning (13 элементов)" data-wpel-link="internal">Machine Learning</a>
<a href="https://otus.ru/journal/tag/otus-book/" class="tag-cloud-link tag-link-261 tag-link-position-19" style="font-size: 9.9444444444444pt;" aria-label="otus book (18 элементов)" data-wpel-link="internal">otus book</a>
<a href="https://otus.ru/journal/tag/php/" class="tag-cloud-link tag-link-45 tag-link-position-20" style="font-size: 10.527777777778pt;" aria-label="PHP (21 элемент)" data-wpel-link="internal">PHP</a>
<a href="https://otus.ru/journal/tag/python/" class="tag-cloud-link tag-link-27 tag-link-position-21" style="font-size: 16.944444444444pt;" aria-label="Python (99 элементов)" data-wpel-link="internal">Python</a>
<a href="https://otus.ru/journal/tag/qa/" class="tag-cloud-link tag-link-155 tag-link-position-22" style="font-size: 11.402777777778pt;" aria-label="qa (26 элементов)" data-wpel-link="internal">qa</a>
<a href="https://otus.ru/journal/tag/sql/" class="tag-cloud-link tag-link-38 tag-link-position-23" style="font-size: 12.861111111111pt;" aria-label="SQL (37 элементов)" data-wpel-link="internal">SQL</a>
<a href="https://otus.ru/journal/tag/team-lead/" class="tag-cloud-link tag-link-364 tag-link-position-24" style="font-size: 9.9444444444444pt;" aria-label="team lead (18 элементов)" data-wpel-link="internal">team lead</a>
<a href="https://otus.ru/journal/tag/unity/" class="tag-cloud-link tag-link-24 tag-link-position-25" style="font-size: 8pt;" aria-label="unity (11 элементов)" data-wpel-link="internal">unity</a>
<a href="https://otus.ru/journal/tag/algoritmy/" class="tag-cloud-link tag-link-30 tag-link-position-26" style="font-size: 9.9444444444444pt;" aria-label="Алгоритмы (18 элементов)" data-wpel-link="internal">Алгоритмы</a>
<a href="https://otus.ru/journal/tag/bazy-dannyh/" class="tag-cloud-link tag-link-40 tag-link-position-27" style="font-size: 10.138888888889pt;" aria-label="Базы данных (19 элементов)" data-wpel-link="internal">Базы данных</a>
<a href="https://otus.ru/journal/tag/matematika/" class="tag-cloud-link tag-link-44 tag-link-position-28" style="font-size: 10.916666666667pt;" aria-label="Математика (23 элемента)" data-wpel-link="internal">Математика</a>
<a href="https://otus.ru/journal/tag/arhitektura-po/" class="tag-cloud-link tag-link-10 tag-link-position-29" style="font-size: 9.4583333333333pt;" aria-label="архитектура ПО (16 элементов)" data-wpel-link="internal">архитектура ПО</a>
<a href="https://otus.ru/journal/tag/bazy-dannyh-2/" class="tag-cloud-link tag-link-251 tag-link-position-30" style="font-size: 10.138888888889pt;" aria-label="базы данных (19 элементов)" data-wpel-link="internal">базы данных</a>
<a href="https://otus.ru/journal/tag/vebinar/" class="tag-cloud-link tag-link-201 tag-link-position-31" style="font-size: 13.930555555556pt;" aria-label="вебинар (48 элементов)" data-wpel-link="internal">вебинар</a>
<a href="https://otus.ru/journal/tag/dajdzhest/" class="tag-cloud-link tag-link-308 tag-link-position-32" style="font-size: 10.722222222222pt;" aria-label="дайджест (22 элемента)" data-wpel-link="internal">дайджест</a>
<a href="https://otus.ru/journal/tag/zapis-vebinara/" class="tag-cloud-link tag-link-226 tag-link-position-33" style="font-size: 14.902777777778pt;" aria-label="запись вебинара (61 элемент)" data-wpel-link="internal">запись вебинара</a>
<a href="https://otus.ru/journal/tag/zapis-uroka/" class="tag-cloud-link tag-link-272 tag-link-position-34" style="font-size: 16.069444444444pt;" aria-label="запись урока (80 элементов)" data-wpel-link="internal">запись урока</a>
<a href="https://otus.ru/journal/tag/informacionnaya-bezopasnost/" class="tag-cloud-link tag-link-232 tag-link-position-35" style="font-size: 10.138888888889pt;" aria-label="информационная безопасность (19 элементов)" data-wpel-link="internal">информационная безопасность</a>
<a href="https://otus.ru/journal/tag/karera-v-it/" class="tag-cloud-link tag-link-292 tag-link-position-36" style="font-size: 9.9444444444444pt;" aria-label="карьера в IT (18 элементов)" data-wpel-link="internal">карьера в IT</a>
<a href="https://otus.ru/journal/tag/podborka/" class="tag-cloud-link tag-link-7 tag-link-position-37" style="font-size: 12.666666666667pt;" aria-label="подборка (35 элементов)" data-wpel-link="internal">подборка</a>
<a href="https://otus.ru/journal/tag/podborka-statej/" class="tag-cloud-link tag-link-219 tag-link-position-38" style="font-size: 15.777777777778pt;" aria-label="подборка статей (75 элементов)" data-wpel-link="internal">подборка статей</a>
<a href="https://otus.ru/journal/tag/programmirovanie/" class="tag-cloud-link tag-link-65 tag-link-position-39" style="font-size: 22pt;" aria-label="программирование (332 элемента)" data-wpel-link="internal">программирование</a>
<a href="https://otus.ru/journal/tag/proekt/" class="tag-cloud-link tag-link-321 tag-link-position-40" style="font-size: 11.888888888889pt;" aria-label="проект (29 элементов)" data-wpel-link="internal">проект</a>
<a href="https://otus.ru/journal/tag/proektnaya-rabota/" class="tag-cloud-link tag-link-310 tag-link-position-41" style="font-size: 11.597222222222pt;" aria-label="проектная работа (27 элементов)" data-wpel-link="internal">проектная работа</a>
<a href="https://otus.ru/journal/tag/seti/" class="tag-cloud-link tag-link-181 tag-link-position-42" style="font-size: 12.958333333333pt;" aria-label="сети (38 элементов)" data-wpel-link="internal">сети</a>
<a href="https://otus.ru/journal/tag/testirovanie/" class="tag-cloud-link tag-link-69 tag-link-position-43" style="font-size: 13.930555555556pt;" aria-label="тестирование (48 элементов)" data-wpel-link="internal">тестирование</a>
<a href="https://otus.ru/journal/tag/upravlenie-komandoj/" class="tag-cloud-link tag-link-63 tag-link-position-44" style="font-size: 11.694444444444pt;" aria-label="управление командой (28 элементов)" data-wpel-link="internal">управление командой</a>
<a href="https://otus.ru/journal/tag/habr-2/" class="tag-cloud-link tag-link-203 tag-link-position-45" style="font-size: 13.930555555556pt;" aria-label="хабр (48 элементов)" data-wpel-link="internal">хабр</a></div>
</li>
</ul>
</div>
</aside>
</div> <!-- .ts-row -->
</div> <!-- .main -->
<footer class="main-footer dark bold">
<section class="lower-footer cf">
<div class="wrap">
<div class="links">
<div class="menu-menju-navykov-container"><ul id="menu-menju-navykov-1" class="menu"><li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10413"><a href="https://otus.ru/categories/programming/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Программирование<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10414"><a href="https://otus.ru/categories/architecture/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Архитектура<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10415"><a href="https://otus.ru/categories/operations/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Инфраструктура<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10416"><a href="https://otus.ru/categories/information-security-courses/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Безопасность<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10417"><a href="https://otus.ru/categories/data-science/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Data Science<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10418"><a href="https://otus.ru/categories/gamedev/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">GameDev<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10419"><a href="https://otus.ru/categories/marketing-business/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Управление<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10420"><a href="https://otus.ru/categories/analytics/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Аналитика и анализ<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
<li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-10421"><a href="https://otus.ru/categories/testing/" data-wpel-link="external" target="_blank" rel="nofollow external noopener noreferrer" class="wpel-icon-right">Тестирование<span class="wpel-icon wpel-image wpel-icon-6"></span></a></li>
</ul></div> </div>
<p class="copyright"> © 2015-2026 OTUS </p>
<div class="to-top">
<a href="#" class="back-to-top"><i class="fa fa-angle-up"></i> Top</a>
</div>
</div>
</section>
</footer>
</div> <!-- .main-wrap -->
<div class="mobile-menu-container off-canvas" id="mobile-menu">
<a href="#" class="close"><i class="fa fa-times"></i></a>
<div class="logo">
</div>
<ul class="mobile-menu"></ul>
</div>
<div class="search-modal-wrap">
<div class="search-modal-box" role="dialog" aria-modal="true">
<form method="get" class="search-form" action="https://otus.ru/journal/">
<input type="search" class="search-field" name="s" placeholder="Search..." value="" required />
<button type="submit" class="search-submit visuallyhidden">Submit</button>
<p class="message">
Type above and press <em>Enter</em> to search. Press <em>Esc</em> to cancel. </p>
</form>
</div>
</div>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/plugins/clearfy/components/comments-plus/assets/js/url-span.js" id="wbcr-comments-plus-url-span-js"></script>
<script type="text/javascript" id="ez-toc-scroll-scriptjs-js-extra">
/* <![CDATA[ */
var eztoc_smooth_local = {"scroll_offset":"30"};
/* ]]> */
</script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/plugins/easy-table-of-contents/assets/js/smooth_scroll.min.js" id="ez-toc-scroll-scriptjs-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/plugins/easy-table-of-contents/vendor/js-cookie/js.cookie.min.js" id="ez-toc-js-cookie-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/plugins/easy-table-of-contents/vendor/sticky-kit/jquery.sticky-kit.min.js" id="ez-toc-jquery-sticky-kit-js"></script>
<script type="text/javascript" id="ez-toc-js-js-extra">
/* <![CDATA[ */
var ezTOC = {"smooth_scroll":"1","visibility_hide_by_default":"","scroll_offset":"30","fallbackIcon":"<span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span>"};
/* ]]> */
</script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/plugins/easy-table-of-contents/assets/js/front.min.js" id="ez-toc-js-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/themes/contentberg/js/custom-script.js" id="custom-script-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/themes/contentberg/js/magnific-popup.js" id="magnific-popup-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/themes/contentberg/js/jquery.fitvids.js" id="jquery-fitvids-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-includes/js/imagesloaded.min.js" id="imagesloaded-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/themes/contentberg/js/object-fit-images.js" id="object-fit-images-js"></script>
<script type="text/javascript" id="contentberg-theme-js-extra">
/* <![CDATA[ */
var Bunyad = {"custom_ajax_url":"\/journal\/parser-opisanie-i-primer-koda\/"};
/* ]]> */
</script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/themes/contentberg/js/theme.js" id="contentberg-theme-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/themes/contentberg/js/theia-sticky-sidebar.js" id="theia-sticky-sidebar-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/themes/contentberg/js/jquery.slick.js" id="jquery-slick-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-content/themes/contentberg/js/jarallax.js" id="jarallax-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-includes/js/masonry.min.js" id="masonry-js"></script>
<script type="text/javascript" src="https://otus.ru/journal/wp-includes/js/jquery/jquery.masonry.min.js" id="jquery-masonry-js"></script>
</body>
</html>
<!-- Cache served by breeze CACHE - Last modified: Tue, 10 Mar 2026 15:06:43 GMT -->