3 added
0 removed
Original
2026-01-01
Modified
2026-02-21
1
<p><a>#статьи</a></p>
1
<p><a>#статьи</a></p>
2
<ul><li>21 ноя 2019</li>
2
<ul><li>21 ноя 2019</li>
3
<li>0</li>
3
<li>0</li>
4
</ul><p>В данном руководстве я расскажу, где искать причину возникновения ошибки сканирования сайта и как вернуть страницы в индекс Google.</p>
4
</ul><p>В данном руководстве я расскажу, где искать причину возникновения ошибки сканирования сайта и как вернуть страницы в индекс Google.</p>
5
<p> vlada_maestro / shutterstock</p>
5
<p> vlada_maestro / shutterstock</p>
6
<p>SEO-специалист компании Adindex.ua</p>
6
<p>SEO-специалист компании Adindex.ua</p>
7
<p>Googlebot не всегда должным образом обрабатывает директивы в тегах<em><meta name="robots"></em>. Одной из причин может быть неверное расположение этих элементов в структуре кода страницы. Из-за этого нужные страницы выпадают из поиска, а нежелательные, наоборот, попадают.</p>
7
<p>Googlebot не всегда должным образом обрабатывает директивы в тегах<em><meta name="robots"></em>. Одной из причин может быть неверное расположение этих элементов в структуре кода страницы. Из-за этого нужные страницы выпадают из поиска, а нежелательные, наоборот, попадают.</p>
8
<p>На сайте нашего клиента были реализованы метатеги<strong>noindex</strong>(для закрытия страниц от индексации поисковым роботом) и <strong>canonical</strong>(для указания основной версии страницы для Googlebot). Эти теги размещались в секции<em><head></em>и были действительны, однако поисковый робот не мог их распознать.</p>
8
<p>На сайте нашего клиента были реализованы метатеги<strong>noindex</strong>(для закрытия страниц от индексации поисковым роботом) и <strong>canonical</strong>(для указания основной версии страницы для Googlebot). Эти теги размещались в секции<em><head></em>и были действительны, однако поисковый робот не мог их распознать.</p>
9
<p>Как следствие, в индекс Google попадали страницы, ненужные с точки зрения поискового продвижения. Проверка страниц в консоли поиска показала, что Googlebot не видит установленные директивы<em><meta name="robots">:</em></p>
9
<p>Как следствие, в индекс Google попадали страницы, ненужные с точки зрения поискового продвижения. Проверка страниц в консоли поиска показала, что Googlebot не видит установленные директивы<em><meta name="robots">:</em></p>
10
<p>Для поиска решения проблемы сравнили исходный HTML-код страницы с готовым DOM. Первое - это код, который браузер выдаёт в режиме просмотра кода страницы, а второе - то, что браузер использует для показа страницы конечным пользователям, когда весь код выполнен на стороне клиента (например, JavaScript-сценарии).</p>
10
<p>Для поиска решения проблемы сравнили исходный HTML-код страницы с готовым DOM. Первое - это код, который браузер выдаёт в режиме просмотра кода страницы, а второе - то, что браузер использует для показа страницы конечным пользователям, когда весь код выполнен на стороне клиента (например, JavaScript-сценарии).</p>
11
<p>В результате заметили интересную особенность: в необработанном HTML-коде стоял блок JavaScript, он находился над метатегами<em>robots</em>. Когда страница была полностью обработана и весь код на стороне клиента выполнен, JavaScript вставлял на страницу дополнительный блок<em><iframe></em>, который размещался над метатегами.</p>
11
<p>В результате заметили интересную особенность: в необработанном HTML-коде стоял блок JavaScript, он находился над метатегами<em>robots</em>. Когда страница была полностью обработана и весь код на стороне клиента выполнен, JavaScript вставлял на страницу дополнительный блок<em><iframe></em>, который размещался над метатегами.</p>
12
<p>Этот блок кода оказался проблематичным в связи с двухэтапным процессом индексации Google:</p>
12
<p>Этот блок кода оказался проблематичным в связи с двухэтапным процессом индексации Google:</p>
13
<ul><li>Первый этап индексации основан на исходном коде HTML веб-страницы, когда никакие клиентские скриптовые сценарии не выполняются как часть процесса индексации.</li>
13
<ul><li>Первый этап индексации основан на исходном коде HTML веб-страницы, когда никакие клиентские скриптовые сценарии не выполняются как часть процесса индексации.</li>
14
<li>На втором этапе Google выполняет индексацию той же страницы, но с загрузкой клиентских сценариев, и страница отображается в том виде, как это сделал бы веб-браузер.</li>
14
<li>На втором этапе Google выполняет индексацию той же страницы, но с загрузкой клиентских сценариев, и страница отображается в том виде, как это сделал бы веб-браузер.</li>
15
</ul><p>Проблема была как раз на втором этапе индексации. JavaScript-сценарий вставлял блок скриптов над метатегами<em>robots</em>в финальном коде страницы. Но по официальному стандарту W3C блок не принадлежит разделу<em><head></em>кода страницы и должен находиться в <em><body></em>.</p>
15
</ul><p>Проблема была как раз на втором этапе индексации. JavaScript-сценарий вставлял блок скриптов над метатегами<em>robots</em>в финальном коде страницы. Но по официальному стандарту W3C блок не принадлежит разделу<em><head></em>кода страницы и должен находиться в <em><body></em>.</p>
16
<p>Когда Google видит данный блок в разделе<em><head></em>, он предполагает, что<em><head></em>завершился и начался раздел<em><body></em>страницы. Судя по всему, Google обрабатывает метатеги как часть второго этапа индексации. Это и стало причиной ошибки, так как Google преждевременно обработал остальной код скриптового блока как часть<em><body></em>и проигнорировал наличие тегов<em>robots</em>.</p>
16
<p>Когда Google видит данный блок в разделе<em><head></em>, он предполагает, что<em><head></em>завершился и начался раздел<em><body></em>страницы. Судя по всему, Google обрабатывает метатеги как часть второго этапа индексации. Это и стало причиной ошибки, так как Google преждевременно обработал остальной код скриптового блока как часть<em><body></em>и проигнорировал наличие тегов<em>robots</em>.</p>
17
<p>Решение проблемы оказалось довольно простым - переместить метатеги robots над блоком скриптов в разделе<em><head></em>. В течение нескольких дней бот распознал изменения и начал сообщать о них в Google Search Console:</p>
17
<p>Решение проблемы оказалось довольно простым - переместить метатеги robots над блоком скриптов в разделе<em><head></em>. В течение нескольких дней бот распознал изменения и начал сообщать о них в Google Search Console:</p>
18
Результаты проверки страницы, закрытой от индексации метатегом noindex, в Google Search Console<p>Количество проиндексированных страниц с тегом canonical заметно увеличилось. Вот такую динамику показывает Google Search Console:</p>
18
Результаты проверки страницы, закрытой от индексации метатегом noindex, в Google Search Console<p>Количество проиндексированных страниц с тегом canonical заметно увеличилось. Вот такую динамику показывает Google Search Console:</p>
19
+
<p>Интернет-маркетинг на практике</p>
20
+
<p>Вы изучите SMM, копирайтинг, таргетинг и продвижение в интернете. На примере кафе с доставкой еды вы разберёте, как продвигать бизнес в интернете, и соберёте сильное портфолио.</p>
21
+
<p><a>Пройти бесплатно</a></p>
19
<a><b>Попробуйте 4 профессии в интернет-маркетинге на практике ➞</b>На бесплатном мини-курсе вы исследуете ЦА, создадите сайт, оформите социальные сети, напишете продающие тексты и настроите рекламу. Смотреть программу</a>
22
<a><b>Попробуйте 4 профессии в интернет-маркетинге на практике ➞</b>На бесплатном мини-курсе вы исследуете ЦА, создадите сайт, оформите социальные сети, напишете продающие тексты и настроите рекламу. Смотреть программу</a>