HTML Diff
3 added 0 removed
Original 2026-01-01
Modified 2026-02-21
1 <p><a>#статьи</a></p>
1 <p><a>#статьи</a></p>
2 <ul><li>21 ноя 2019</li>
2 <ul><li>21 ноя 2019</li>
3 <li>0</li>
3 <li>0</li>
4 </ul><p>В данном руководстве я расскажу, где искать причину возникновения ошибки сканирования сайта и как вернуть страницы в индекс Google.</p>
4 </ul><p>В данном руководстве я расскажу, где искать причину возникновения ошибки сканирования сайта и как вернуть страницы в индекс Google.</p>
5 <p> vlada_maestro / shutterstock</p>
5 <p> vlada_maestro / shutterstock</p>
6 <p>SEO-специалист компании Adindex.ua</p>
6 <p>SEO-специалист компании Adindex.ua</p>
7 <p>Googlebot не всегда должным образом обрабатывает директивы в тегах<em>&lt;meta name="robots"&gt;</em>. Одной из причин может быть неверное расположение этих элементов в структуре кода страницы. Из-за этого нужные страницы выпадают из поиска, а нежелательные, наоборот, попадают.</p>
7 <p>Googlebot не всегда должным образом обрабатывает директивы в тегах<em>&lt;meta name="robots"&gt;</em>. Одной из причин может быть неверное расположение этих элементов в структуре кода страницы. Из-за этого нужные страницы выпадают из поиска, а нежелательные, наоборот, попадают.</p>
8 <p>На сайте нашего клиента были реализованы метатеги<strong>noindex</strong>(для закрытия страниц от индексации поисковым роботом) и <strong>canonical</strong>(для указания основной версии страницы для Googlebot). Эти теги размещались в секции<em>&lt;head&gt;</em>и были действительны, однако поисковый робот не мог их распознать.</p>
8 <p>На сайте нашего клиента были реализованы метатеги<strong>noindex</strong>(для закрытия страниц от индексации поисковым роботом) и <strong>canonical</strong>(для указания основной версии страницы для Googlebot). Эти теги размещались в секции<em>&lt;head&gt;</em>и были действительны, однако поисковый робот не мог их распознать.</p>
9 <p>Как следствие, в индекс Google попадали страницы, ненужные с точки зрения поискового продвижения. Проверка страниц в консоли поиска показала, что Googlebot не видит установленные директивы<em>&lt;meta name="robots"&gt;:</em></p>
9 <p>Как следствие, в индекс Google попадали страницы, ненужные с точки зрения поискового продвижения. Проверка страниц в консоли поиска показала, что Googlebot не видит установленные директивы<em>&lt;meta name="robots"&gt;:</em></p>
10 <p>Для поиска решения проблемы сравнили исходный HTML-код страницы с готовым DOM. Первое - это код, который браузер выдаёт в режиме просмотра кода страницы, а второе - то, что браузер использует для показа страницы конечным пользователям, когда весь код выполнен на стороне клиента (например, JavaScript-сценарии).</p>
10 <p>Для поиска решения проблемы сравнили исходный HTML-код страницы с готовым DOM. Первое - это код, который браузер выдаёт в режиме просмотра кода страницы, а второе - то, что браузер использует для показа страницы конечным пользователям, когда весь код выполнен на стороне клиента (например, JavaScript-сценарии).</p>
11 <p>В результате заметили интересную особенность: в необработанном HTML-коде стоял блок JavaScript, он находился над метатегами<em>robots</em>. Когда страница была полностью обработана и весь код на стороне клиента выполнен, JavaScript вставлял на страницу дополнительный блок<em>&lt;iframe&gt;</em>, который размещался над метатегами.</p>
11 <p>В результате заметили интересную особенность: в необработанном HTML-коде стоял блок JavaScript, он находился над метатегами<em>robots</em>. Когда страница была полностью обработана и весь код на стороне клиента выполнен, JavaScript вставлял на страницу дополнительный блок<em>&lt;iframe&gt;</em>, который размещался над метатегами.</p>
12 <p>Этот блок кода оказался проблематичным в связи с двухэтапным процессом индексации Google:</p>
12 <p>Этот блок кода оказался проблематичным в связи с двухэтапным процессом индексации Google:</p>
13 <ul><li>Первый этап индексации основан на исходном коде HTML веб-страницы, когда никакие клиентские скриптовые сценарии не выполняются как часть процесса индексации.</li>
13 <ul><li>Первый этап индексации основан на исходном коде HTML веб-страницы, когда никакие клиентские скриптовые сценарии не выполняются как часть процесса индексации.</li>
14 <li>На втором этапе Google выполняет индексацию той же страницы, но с загрузкой клиентских сценариев, и страница отображается в том виде, как это сделал бы веб-браузер.</li>
14 <li>На втором этапе Google выполняет индексацию той же страницы, но с загрузкой клиентских сценариев, и страница отображается в том виде, как это сделал бы веб-браузер.</li>
15 </ul><p>Проблема была как раз на втором этапе индексации. JavaScript-сценарий вставлял блок скриптов над метатегами<em>robots</em>в финальном коде страницы. Но по официальному стандарту W3C блок не принадлежит разделу<em>&lt;head&gt;</em>кода страницы и должен находиться в <em>&lt;body&gt;</em>.</p>
15 </ul><p>Проблема была как раз на втором этапе индексации. JavaScript-сценарий вставлял блок скриптов над метатегами<em>robots</em>в финальном коде страницы. Но по официальному стандарту W3C блок не принадлежит разделу<em>&lt;head&gt;</em>кода страницы и должен находиться в <em>&lt;body&gt;</em>.</p>
16 <p>Когда Google видит данный блок в разделе<em>&lt;head&gt;</em>, он предполагает, что<em>&lt;head&gt;</em>завершился и начался раздел<em>&lt;body&gt;</em>страницы. Судя по всему, Google обрабатывает метатеги как часть второго этапа индексации. Это и стало причиной ошибки, так как Google преждевременно обработал остальной код скриптового блока как часть<em>&lt;body&gt;</em>и проигнорировал наличие тегов<em>robots</em>.</p>
16 <p>Когда Google видит данный блок в разделе<em>&lt;head&gt;</em>, он предполагает, что<em>&lt;head&gt;</em>завершился и начался раздел<em>&lt;body&gt;</em>страницы. Судя по всему, Google обрабатывает метатеги как часть второго этапа индексации. Это и стало причиной ошибки, так как Google преждевременно обработал остальной код скриптового блока как часть<em>&lt;body&gt;</em>и проигнорировал наличие тегов<em>robots</em>.</p>
17 <p>Решение проблемы оказалось довольно простым - переместить метатеги robots над блоком скриптов в разделе<em>&lt;head&gt;</em>. В течение нескольких дней бот распознал изменения и начал сообщать о них в Google Search Console:</p>
17 <p>Решение проблемы оказалось довольно простым - переместить метатеги robots над блоком скриптов в разделе<em>&lt;head&gt;</em>. В течение нескольких дней бот распознал изменения и начал сообщать о них в Google Search Console:</p>
18 Результаты проверки страницы, закрытой от индексации метатегом noindex, в Google Search Console<p>Количество проиндексированных страниц с тегом canonical заметно увеличилось. Вот такую динамику показывает Google Search Console:</p>
18 Результаты проверки страницы, закрытой от индексации метатегом noindex, в Google Search Console<p>Количество проиндексированных страниц с тегом canonical заметно увеличилось. Вот такую динамику показывает Google Search Console:</p>
 
19 + <p>Интернет-маркетинг на практике</p>
 
20 + <p>Вы изучите SMM, копирайтинг, таргетинг и продвижение в интернете. На примере кафе с доставкой еды вы разберёте, как продвигать бизнес в интернете, и соберёте сильное портфолио.</p>
 
21 + <p><a>Пройти бесплатно</a></p>
19 <a><b>Попробуйте 4 профессии в интернет-маркетинге на практике ➞</b>На бесплатном мини-курсе вы исследуете ЦА, создадите сайт, оформите социальные сети, напишете продающие тексты и настроите рекламу. Смотреть программу</a>
22 <a><b>Попробуйте 4 профессии в интернет-маркетинге на практике ➞</b>На бесплатном мини-курсе вы исследуете ЦА, создадите сайт, оформите социальные сети, напишете продающие тексты и настроите рекламу. Смотреть программу</a>