Руководство оценщиков качества в Google.

Это переводная статья с английского. Выражаю большую и официальную благодарность моему хорошему другу ДАРЬЕ, которая и перевела, собственно, эту статью слово в слово, вместо того, чтоб писать диплом на тему: «Разрешимость каких-то там систем дифур в случае сингулярного пучка комплексных матриц коэффициентов. Или регулярного..»
Итак, некий Брайан Ассери обнаружил исправленную копию руководства Google по оценке качества для Агрессоров и  выложил на собственном сайте. Эта инструкция используется оценщиками качества поиска Google для классификации запросов, измерения релевантности и оценки результатов поиска. Для этого оценщик качества должен понимать, как Google работает и в этом документе вы найдёте ответы на многие вопросы.

Типы запросов.

Существует три типа запросов.
Навигационный: поиск сайта (например, сайт IBM)
Информационный: поиск информации по интересующей теме (например, поиск информации о Danny Sullivan)
Транзакционный: покупка чего-либо онлайн или оффлайн (например, «купить ipod touch»)

Шкала оценки качества:

Каждый документ (страница) получает определенную оценку в своей категории по конкретному запросу:
«Витальная». Это наивысшая оценка, которую может получить веб-страница по запросу. Витальный результат вероятнее всего достигается при навигационных запросах и является официальным сайтом объекта запроса. Например, при поиске ‘ibm’ витальный результат — www.ibm.com
«Полезная». Это вторая лучшая оценка, которую может получить веб-страница по данному запросу. Оценка «полезный» присваивается результатам, которые отвечают на запрос, но не достаточно широко и не достаточно конкретно охватывают  тему запроса. Одним из примеров «полезной»  веб-страницы может быть https://www.webmd.com/hw/infection/aa34586.asp как результат поиска «симптомы менингита».
«Релевантная». Следующая после «полезной» оценки. Используется для менее полезных результатов. В руководстве говорится, что результат часто «менее полный, исходит из менее достоверного источника и охватывает только один аспект запроса». Примером может служить обзор лэптопов, который охватывает только 5 компьютеров и не все компьютеры своего класса. Поскольку это не полный обзор, он будет оценен как «релевантный», а не «полезный»
«Нерелевантная». Эта оценка используется для страниц, которые не являются полезными, но всё же каким-то образом связаны с данным запросом. «Нерелевантная» страница «устаревшая, узконаправленная» и т.д. Примером является статья с сайта BBC, которую возвращает запрос ‘BBC’; результат слишком конкретизирован.
«Не про то»/ «Не по теме». Это низшая оценка, которую может получить страница по запросу. Если возвращаемая страница полностью нерелевантна, ей будет присвоена оценка «не по теме». Пример: страница о собачьих будках, которая является результатом запроса «хот-дог».

Категории результатов, которые не могут быть оценены:

Не все результаты могут быть оценены и те, которые не могут быть, должны быть каким-либо образом классифицированы. Категории этих типов результатов включают:
«Не загружается»: для страниц, которые возвращают «ошибка 404», «страница не найдена»,  «продукт не найден», «таймаут сервера», «403 forbidden», «login required» и т.д.
«На иностранном языке»: для страниц «на иностранном языке» по отношению к языку запроса. Английский не считается иностранным ни в каком случае. Итак, если запрос на китайском возвращает страницу на иврите, это страница «на иностранном языке», если же возвращается страница на английском, она не является страницей «на иностранном языке».
«Не подлежащая оценке»: когда оценщик не может оценить страницу по какой-либо причине.

Спам-метки
А теперь о хорошем, спам-метки. Это новое и относительно маленькое дополнение к оценкам качества. Метки включают:
Не спам: эта метка присваивается страницам, которые «не были разработаны с использованием «обманчивых» техник веб-дизайна»
Возможно спам: эта метка присваивается, когда вы подозреваете, что страница – спам, но не уверены в этом на 100%.
Спам: присваивается страницам, которые нарушают принципы веб-мастеров Google.
Флажки-метки: нужны для страниц, которые требуют немедленного внимания. Это страницы содержащие:
Порнографический контент
Вредоносный код
Это краткий обзор некоторых из многочисленных пунктов документа. Для получения большей информации обращайтесь к the archived document, немного истории: Google Blogoscoped. Ещё одна копия документа на Huomah.com


28 января 2012