ChatGPT извлекает много источников, но цитирует лишь 15%

AirOps проанализировала поведение ChatGPT при поиске и обнаружила серьезный разрыв между количеством извлечённых страниц и теми, которые в итоге появляются в ответе. Главный вывод прост: попадание в «исходный набор» для модели далеко не гарантирует, что ваш контент будет процитирован пользователю.

Содержание

Основные детали новости
Дополнительные факты
Почему это важно для SEO

Основные детали новости

В исследовании, названном «The Influence of Retrieval, Fan-out, and Google SERPs on ChatGPT Citations», AirOps проследила путь 15 000 запросов и 548 534 страниц, которые ChatGPT извлечь в процессе генерации ответов. Результаты показывают, что модель проводит более широкое исследование, чем затем афиширует в виде ссылок в финальном ответе.

Всего в итоговых ответах появилось 82 108 цитат.
Только 15% извлечённых страниц были напрямую процитированы.
85% страниц, использованных при исследовании, не появились в ответе.

Это означает, что эффективность попадания на «радар» модели и вероятность получить видимую цитату — два разных показателя. Среди типов запросов уровень цитирования также заметно варьируется: 18,3% — для запросов о поиске товаров, 16,9% — для how-to, и 11,3% — для запросов валидационного типа.

Дополнительные факты

Особое внимание в исследовании уделено так называемому «fan-out» — внутренним дополнительным поискам, которые ChatGPT инициирует уже в ходе генерации ответа. Эти расширения запроса создают вторую поверхность для возможных цитат и имеют свои особенности:

89,6% исходных запросов запустили по крайней мере два дополнительных поиска.
15 000 исходных запросов разрослись до 43 233 отдельных запросов в процессе fan-out.
32,9% страниц, которые в итоге были процитированы, появились только в результатах fan-out, а не в исходном пуле.
95% fan-out запросов не имеют традиционного объёма поиска — это внутренние, редко встречающиеся или полностью синтетические расширения.

Важная корреляция касается рейтинга в Google: более высокая позиция в традиционной выдаче сильно повышает шансы на цитирование в ответах ChatGPT. Так, 55,8% процитированных страниц находились в топ-20 Google, а страницы на первой позиции цитировались в 3,5 раза чаще, чем те, что вне топ-20.

Почему это важно для SEO

Для специалистов по SEO исследование AirOps меняет акцент: хватит только быть найденным — надо быть выбранным. Разрыв между извлечением и цитированием означает, что ваши метрики видимости (индексация, ранжирование, трафик) — это ещё не гарантия присутствия в ответах AI. Стратегии оптимизации должны учитывать дополнительные факторы отбора внутри процесса синтеза модели.

Практические следствия для оптимизации:

Держите фокус на релевантности к типам запросов, которые чаще получают цитаты (например, product discovery и how-to — более высокие показатели цитирования).
Высокий Google-позиционирование остаётся важным фактором: страницы из топ-20 имеют заметно больше шансов быть использованы моделью.
Не игнорируйте контент, оптимизированный под нишевые или редкие формулировки: фан-аут генерирует много внутренних запросов, и значительная часть цитат появляется именно из них.

Итог: в эпоху ответов, собранных AI, нужно думать не только о том, чтобы алгоритмы и пользователи находили страницу, но и о том, чтобы модель выбрала именно её при синтезе информации. AirOps предоставляет количественные доказательства того, что оптимизация должна охватывать и видимость, и вероятность селекции внутри процесса генерации ответов.