Как работать с нейросетевым поиском

За поиск отвечают специализированные модели

Sonar делает запросы напрямую в интернет — в источники вроде Википедии, научных баз данных и СМИ. Модель оперативно получает свежие данные и включает их в контекст ответа.

Представьте, что вы задали вопрос: «Что такое квантовая запутанность?». Обычная языковая модель (LLM), работающая только на заранее загруженных данных, опирается на обучающую выборку, которая может устареть. Sonar, благодаря интернет-компоненту, всегда использует актуальные данные и автоматически включает их в ответ. Это повышает точность, актуальность и скорость ответов, а также позволяет давать ссылки на первоисточники.

Что работает иначе при нейросетевом поиске

Некоторые традиционные приёмы работы с LLM хуже подходят для поискового этапа.

Role — стилизация под персонажа менее выражена, потому что приоритет модели — точность информации, а не поддержание роли.
Algorithm и Step-by-step thinking — модель не всегда строго следует прописанному алгоритму, особенно если шаги не связаны с поиском.
Pre-generated knowledge — приём лучше использовать так: сначала получить актуальную информацию через Sonar, затем применять её в дальнейших диалогах.
Генеративный бриф — модель может задавать уточняющие вопросы, но они меньше влияют на сам поиск информации.

Приёмы, которые улучшают поиск

Эти приёмы помогают улучшить качество информации:

Instructions и Keywords — задавайте конкретные источники или ключевые слова для поиска. Например:

«Используй только статьи в The Guardian, The Washington Post и The New York Times». «Не используй источники на русском языке». «Ключевые слова: конференция, маркетинг, digital-маркетинг, Сан-Франциско».

Context — объясните, для какой цели используете информацию:

«Я планирую разместить рекламу для сотрудников главного офиса „Яндекса“ в Москве».

References — приводите примеры или ориентиры для поиска похожих данных:

Перечислите рестораны, которые вам понравились, и попросите модель найти аналогичные.

Examples — указание хороших и плохих примеров ограниченно влияет на поиск, но помогает лучше обобщить информацию на этапе генерации ответа.

Две сущности Sonar: поиск и генерация

В Sonar работают две связанные сущности:

Классическая языковая модель (LLM) отвечает за генерацию текста, стилизацию и роль.
Поисковый модуль отвечает за получение свежих данных из внешних источников в реальном времени.

Большинство приёмов взаимодействия (Role, Algorithm, Step-by-step) больше влияют на генерацию, стилизацию и обработку данных, чем на сам поиск. Однако этапы поиска можно включать в алгоритмические инструкции, и модель выполнит их как часть общего задания.

Нейросети — это «чёрный ящик»

Чем сложнее модель, тем менее прозрачна её работа — даже для разработчиков. Иногда сложно понять причину галлюцинаций, но часто проблему можно исправить корректировкой промпта. Если вы используете устаревшие данные (например, цены 2010 года), модель может ошибочно прогнозировать текущие цены с поправкой на инфляцию. Уберите устаревшие даты или явно попросите модель не делать подобных прогнозов.

Главный принцип: «мусор на входе — мусор на выходе»

Качество поиска и генерации напрямую зависит от вашего промпта. Регулярно анализируйте результаты и корректируйте запросы, чтобы получать точные и полезные ответы.