Частный случай сражения с некорректным подсчётом отказов
В данной теме опишу одно несложное решение, которым воспользовался в рамках борьбы с неверным подсчётом Яндекс-Метрикой уровня отказов (и соответственно, поведенческого фактора). Заметил, что в последнее время как-то уж очень активно начал расти на сайте процент отказов — при нормальном уровне в 15-25% он достиг 40% и продолжил расти дальше.
Странно как-то, согласитесь. Контент абсолютно собственный, разнообразный, включая мультимедиа, судя по немногочисленным комментариям — интересный, стороннему тырингу не подвержен в силу самописности движка, пополняется автором уже лет эдак как минимум пять или шесть, Откуда вдруг рост отказов?
Тут надо пояснить, что я — сторонник мнения, согласно которому подсчитываемый Метрикой процент отказов влияет на ранжирование в поисковой выдаче (что время от времени вроде бы косвенно подтверждается результатами аналитики по нескольким разным сайтам). Ясно, что на сайт льётся «мусорный» трафик (кем, откуда и зачем, это второй вопрос), который портит ПФ и мешает мне анализировать реальные проблемы, возникающие на сайте у живых, реальных посетителей. Основная проблема тут кроется в том, что Метрика категорически отказывается персонифицировать трафик, отмазываясь общей статистикой. Пришлось в срочном порядке написать для сайта собственное детализированный сбор статистики по трафику.
Что сразу же бросилось в глаза при просмотре результатов?
Да прежде всего — обилие всевозможной автоматики. Взбесившийся краулер Мегаиндекса, какие-то интернет-архиверы, боты Bing и Mail.ru, сборщики сведений о версии движка, стоимости сайта, сервисы продвижения и сравнения конкурентов, куча каких-то левых запросов на предмет поиска каталогов типа «admin» и «template» с рекурсивным зацикливанием параметров адресной строки, и прочий мусор. Большинство визитов из этой категории — с интервалом максимум в пару секунд и количеством обращений по двадцать-тридцать в минуту, при этом в HTTP-заголовках ботами представляются, мягко говоря, далеко не все визитёры. Да, мне известно, что Метрика как бы отсеивает ботов при подсчётах, но мне неизвестны критерии этого отсева, и судя по бешеному росту процента отказов (напомню, с 15-25% до 40%) — качество отсева, мягко говоря, слегка прихрамывает.
Чтобы не утомлять длинным текстом, не буду перечислять все варианты, запроектированные в отношении незваных гостей. «Америка была открыта» автором в тот момент, когда последним было чётко сформулировано для себя: Метрика должна получать информацию о визите реальных посетителей и не должна получать данные о заходах ботов и краулеров. Решение очевидное — JavaScript!!!
Напомню, код Метрики представляет собой код JavaScript. До сих пор он подгружался у автора на страницы сайта априори и безусловно — на серверном уровне. Ну а раз пошла такая пьянка — прежний алгоритм сменился на новый: теперь код Метрики подгружается на страницы при помощи JQuery, соответственно ботов и краулеров, не умеющих подгружать и запускать JS, Метрика больше не видит, ибо для них она попросту отсутствует на сайте. Логично предположить, впрочем, что и сама Метрика может не увидеть свой код, установленный таким макаром на страницах сайта — но это предположение было проверено и установлено, что Метрике подгружаемый при помощи JQuery код счётчика виден прекрасно.
Предварительные результаты — уже второй день эксперимента уровень отказов в 16%. Ну а позже можно будет уже сделать более общие выводы,
Как обычно, буду рад комментариям и замечаниям.
Странно как-то, согласитесь. Контент абсолютно собственный, разнообразный, включая мультимедиа, судя по немногочисленным комментариям — интересный, стороннему тырингу не подвержен в силу самописности движка, пополняется автором уже лет эдак как минимум пять или шесть, Откуда вдруг рост отказов?
Тут надо пояснить, что я — сторонник мнения, согласно которому подсчитываемый Метрикой процент отказов влияет на ранжирование в поисковой выдаче (что время от времени вроде бы косвенно подтверждается результатами аналитики по нескольким разным сайтам). Ясно, что на сайт льётся «мусорный» трафик (кем, откуда и зачем, это второй вопрос), который портит ПФ и мешает мне анализировать реальные проблемы, возникающие на сайте у живых, реальных посетителей. Основная проблема тут кроется в том, что Метрика категорически отказывается персонифицировать трафик, отмазываясь общей статистикой. Пришлось в срочном порядке написать для сайта собственное детализированный сбор статистики по трафику.
Что сразу же бросилось в глаза при просмотре результатов?
Да прежде всего — обилие всевозможной автоматики. Взбесившийся краулер Мегаиндекса, какие-то интернет-архиверы, боты Bing и Mail.ru, сборщики сведений о версии движка, стоимости сайта, сервисы продвижения и сравнения конкурентов, куча каких-то левых запросов на предмет поиска каталогов типа «admin» и «template» с рекурсивным зацикливанием параметров адресной строки, и прочий мусор. Большинство визитов из этой категории — с интервалом максимум в пару секунд и количеством обращений по двадцать-тридцать в минуту, при этом в HTTP-заголовках ботами представляются, мягко говоря, далеко не все визитёры. Да, мне известно, что Метрика как бы отсеивает ботов при подсчётах, но мне неизвестны критерии этого отсева, и судя по бешеному росту процента отказов (напомню, с 15-25% до 40%) — качество отсева, мягко говоря, слегка прихрамывает.
Чтобы не утомлять длинным текстом, не буду перечислять все варианты, запроектированные в отношении незваных гостей. «Америка была открыта» автором в тот момент, когда последним было чётко сформулировано для себя: Метрика должна получать информацию о визите реальных посетителей и не должна получать данные о заходах ботов и краулеров. Решение очевидное — JavaScript!!!
Напомню, код Метрики представляет собой код JavaScript. До сих пор он подгружался у автора на страницы сайта априори и безусловно — на серверном уровне. Ну а раз пошла такая пьянка — прежний алгоритм сменился на новый: теперь код Метрики подгружается на страницы при помощи JQuery, соответственно ботов и краулеров, не умеющих подгружать и запускать JS, Метрика больше не видит, ибо для них она попросту отсутствует на сайте. Логично предположить, впрочем, что и сама Метрика может не увидеть свой код, установленный таким макаром на страницах сайта — но это предположение было проверено и установлено, что Метрике подгружаемый при помощи JQuery код счётчика виден прекрасно.
Предварительные результаты — уже второй день эксперимента уровень отказов в 16%. Ну а позже можно будет уже сделать более общие выводы,
Как обычно, буду рад комментариям и замечаниям.