Schema.org запустил публичный набор данных, который показывает, сколько доменов используют конкретные термины Schema.org. Данные агрегируются по доменам и публикуются в виде диапазонов популярности — это помогает отрезать ежедневный шум и увидеть реальные тенденции внедрения разметки на вебе.
Основные детали новости
Новый датасет обновляется ежемесячно и предоставляет статистику использования терминов Schema.org на публичной части веба. Ключевые моменты:
- Источник измерений — инфраструктура публичного краулинга Google. Это значит, что охват основан на наблюдениях крупного поискового краулера, а не на выборках отдельных инструментов.
- Агрегация происходит на уровне домена (например, example.com). Если один и тот же термин применяется на сотне страниц одного сайта, это учитывается как одно доменное использование.
- Вместо точных цифр Schema.org публикует данные в диапазонах («бакетах») — например, 10K–100K или 100K–1M доменов. Такая подача делает отчеты более стабильными и защищает приватность сайтов.
- Доступные форматы и место хранения: сырые файлы выложены в репозитории на GitHub (Google Public Stats dataset) в JSON и CSV, а также в сводном JSON с распределением по бакетам. Данные обновляются ежемесячно.
- Каждая запись включает тип термина (Type, например Person или Event, или Property, например price или telephone), официальный URI термина (например http://schema.org/Person) и бакет количества доменов, где он используется.
На страницах самих терминов Schema.org теперь рядом с описанием можно видеть эти показатели — примеры в публикации демонстрируют статистику для author и Event.
Дополнительные факты
- Использование бакетов вместо точных чисел служит двум задачам: уменьшает влияние ежедневных колебаний индексации и минимизирует риск идентификации отдельных сайтов по их статистике.
- Публикация данных в открытом репозитории позволяет исследователям и разработчикам скачивать как детальные файлы, так и агрегированные сводки для построения собственных отчетов и инструментов.
- Отметка типа термина (Type vs Property) упрощает фильтрацию: можно быстро отделить схемы сущностей от конкретных свойств разметки.
- Агрегация на уровне домена означает, что для оценки распространенности разметки достаточно понимать, на каком количестве сайтов применяется термин, а не сколько страниц маркировано на каждом сайте.
Почему это важно для SEO
Для специалистов по SEO и продуктовых команд новый датасет — практический инструмент при приоритизации внедрения структурированных данных. Несколько конкретных сценариев:
- Выбор приоритетных схем. Если нужный вам термин широко используется (попадает в высокий бакет), это сигнал, что поисковые системы и экосистема инструментов учитывают его чаще — весомый аргумент в переговорах с разработчиками и менеджерами продукта.
- Оценка рыночных ожиданий. Данные помогают понять, какие свойства и типы наиболее популярны у конкурентов и отрасли, и скорректировать стратегию контентной разметки под ожидаемую практику.
- Планирование разработок. Доменно-агрегированная статистика дает представление о том, какой объем работ окупится в контексте отрасли: если термин используется на тысячах сайтов, внедрение его на вашем ресурсе имеет смысл с точки зрения совместимости и видимости.
- Мониторинг трендов. Поскольку файлы обновляются ежемесячно, можно отслеживать динамику внедрения тех или иных схем и оперативно реагировать на появление новых стандартов или расширений.
- Инструментальная поддержка. Разработчикам SEO-инструментов и тулкитов датасет предоставляет репрезентативную базу для настройки рекомендаций и проверки соответствия разметки реальному распространению терминов.
Практическое действие для специалистов: скачайте сводные JSON/CSV из репозитория на GitHub, оцените, в какие бакеты попадают ключевые для вас термины, и используйте это как аргумент в roadmap по внедрению разметки. Для аналитиков это источник, позволяющий строить метрики принятия schema-разметки по сектору или региону, а для SEO-специалистов — инструмент при составлении брифов для дев-команд.
Schema.org сделал очередной шаг к прозрачности экосистемы структурированных данных: теперь принятие тех или иных схем можно количественно оценить на уровне доменов, а не полагаться только на анекдотические наблюдения или ограниченные выборки.