Глоссарий ИИ-терминов

Короткий словарь понятий, которыми обычно пользуются при работе с ИИ. Без академических формулировок — так, чтобы было понятно с первого прочтения. Английский термин в скобках — чтобы вы могли искать дополнительные материалы.

Термины сгруппированы по пяти темам: модели и интерфейсы, промптинг, агенты и инструменты, данные и контекст, метрики и оценка. Внутри каждой темы — от общего к частному.

Модели и интерфейсы

LLM — большая языковая модель (Large Language Model) — Программа, которая обучилась на огромных объёмах текста и научилась продолжать любой текст так, как это сделал бы человек. Claude, ChatGPT, Gemini — это интерфейсы поверх LLM. Сама модель — это математическая конструкция, она не «думает» и не «знает», но за счёт масштаба обучения отвечает так, как будто думает.

Пример. Когда вы пишете в Claude «помоги составить план встречи» — внутри работает LLM, которая предсказывает наиболее уместный ответ.

Модель (Model) — Конкретная версия LLM. У Claude в линейке три тира: Opus (максимальные возможности, текущая версия 4.7), Sonnet (баланс скорости и качества, текущая 4.6), Haiku (быстрый и дешёвый, текущая 4.5). У OpenAI — семейство GPT-5.x: GPT-5.3 Instant (быстрый ответ по умолчанию), Thinking (с рассуждением), Pro (максимальный тариф). Более мощная модель — не всегда лучшая: для простой задачи быстрая и дешёвая модель часто уместнее.

Пример. Для разовой переформулировки письма хватит Sonnet. Для разбора 200-страничного договора с поиском противоречий лучше взять Opus.

Чат / интерфейс (Chat interface) — Окно с историей сообщений, куда вы пишете и где получаете ответ. claude.ai, chat.openai.com — это чаты. Чат — самая простая форма работы с моделью, но не единственная: есть API, есть инструменты вроде Claude Code, есть встроенные ассистенты в редакторах.

Мультимодальность (Multimodality) — Способность модели работать не только с текстом, но и с другими типами данных: изображениями, аудио, видео. В современный чат с Claude или ChatGPT можно отправить скриншот таблицы, фото документа, схему на доске, голосовое сообщение или диаграмму — модель «увидит» и «услышит» это так же, как прочитает текст. На практике это снимает массу мелких трений: не нужно перепечатывать данные с фотографии регламента, не нужно расшифровывать встречу руками, не нужно описывать словами график из отчёта.

Пример. Сфотографировали страницу договора с правками от руки и попросили модель свести их в чистовик — это мультимодальный сценарий.

Размышление / reasoning-режим (Reasoning / extended thinking) — Режим, в котором модель сначала «думает вслух» — строит цепочку рассуждений во внутреннем черновике — и только потом даёт ответ. На сложных задачах (логика, математика, многошаговый анализ, разбор противоречий) это даёт заметно более точный результат. Платится временем и стоимостью: ответ занимает дольше, и токенов уходит больше.

Пример. Разобрать пять вариантов оргструктуры по семи критериям и обосновать выбор — задача под reasoning-режим.

Как это устроено сейчас (How reasoning works in 2026) — Год-два назад reasoning был отдельной линейкой моделей: у OpenAI — серия o1, o3, у Anthropic — отдельные настройки в API. К 2026 году подход поменялся. У Claude Opus 4.6 и выше встроен Adaptive Thinking: модель сама решает, сколько «думать» над задачей, в зависимости от её сложности. У OpenAI семейство GPT-5.x делится на три варианта: Instant (быстрый ответ), Thinking (с рассуждением), Pro (максимальное рассуждение). На практике: пользователь больше не выбирает «модель для рассуждения отдельно от обычной» — он выбирает уровень усилия внутри одной модели.

Когда включать reasoning (When to use reasoning) — Включать стоит, когда задача требует логики, цепочки выводов или работы с противоречивыми вводными. Не включать — когда задача про скорость и объём: переформулировать письмо, сделать саммари встречи, набросать черновик. Главное правило: reasoning не делает ответ красивее или умнее в обычном тексте — он помогает на задачах, где есть «правильный» и «неправильный» ответ, и нужно его выловить.

Пример. Свести десять разрозненных отчётов в один с поиском противоречий — нужен reasoning. Переписать вступление к презентации в трёх вариантах — не нужен.

Галлюцинация (Hallucination) — Когда модель уверенно выдумывает факт, которого нет: несуществующую статью, неправильную цифру, придуманную цитату. Это не баг и не злой умысел — это свойство технологии: модель оптимизирована на «звучать правдоподобно», а не на «говорить правду». Защита одна — проверять фактуру руками.

Пример. Модель ссылается на «исследование McKinsey 2023 года», которого не существует. Звучит убедительно, выглядит как правда — проверяется поиском по сайту McKinsey.

Промптинг

Промпт (Prompt) — Текст, который вы пишете модели. Любой запрос — от «привет» до пятистраничного ТЗ — это промпт. От качества промпта зависит качество ответа больше, чем от выбора модели.

Системный промпт (System prompt) — Инструкция, которая задаёт модели правила игры на весь разговор: «ты — редактор юридических текстов, отвечай формально, проверяй каждую формулировку». В чатах системный промпт обычно скрыт от пользователя; в API и в продвинутых интерфейсах его можно задать самому.

Контекст (Context) — Всё, что модель видит в моменте: ваше сообщение, история чата, прикреплённые файлы, системный промпт. Контекст имеет границу — после неё модель «забывает» начало разговора. Хороший контекст = точный ответ; раздутый контекст с лишним = размытый ответ.

Пример. Вы прикрепили к чату 50-страничный отчёт и спросили про один абзац. Модель видит весь отчёт — это контекст. Если отчёт был бы 5000 страниц, он бы не поместился.

Контекстное окно (Context window) — Максимальный объём текста, который модель может одновременно держать «в голове». Измеряется в токенах. У Claude Opus и Sonnet — 1 миллион токенов (примерно 2500 страниц), у Haiku — 200 тысяч. Несколько лет назад окно было в десятки раз меньше, и это меняло саму логику работы: теперь в контекст помещается целая книга регламентов, а не три страницы.

Токен (Token) — Единица, которой модель «нарезает» текст. Один токен — это примерно 4 символа на английском или 2–3 символа на русском. Слово «корпоративный» — это 3–4 токена. От количества токенов зависит цена в API и помещается ли документ в контекстное окно.

Few-shot / примеры в промпте (Few-shot prompting) — Способ объяснить модели, чего вы хотите, на конкретных примерах: «вот как надо: ... — а вот как не надо: ...». Часто работает лучше, чем длинные текстовые инструкции.

Пример. Вместо «пиши кратко» — дайте два примера «вот короткий вариант, вот длинный, делай в первом стиле».

Chain of thought / цепочка рассуждений (Chain of thought) — Приём, когда вы просите модель показать ход рассуждений по шагам, а не сразу выдавать ответ. Помогает на задачах, где нужна логика. Современные reasoning-модели делают это автоматически.

TRICERA (авторский фреймворк ИИЧАВО) — Структура промпта из шести компонентов, помогающая писать запросы со стабильным результатом — особенно для регулярных задач, которые повторяются. Используется внутри ИИЧАВО при работе с клиентами и в обучающих программах.

Агенты и инструменты

Агент (Agent) — Модель, которая не просто отвечает в чате, а действует: сама решает, какие шаги предпринять, использует инструменты (поиск, код, базы данных), выполняет цепочку действий до результата. Разница с чатом: чату вы говорите «найди X», агенту вы говорите «реши задачу Y» — и он сам ищет, читает, считает.

Пример. Вы говорите агенту «подготовь конкурентный анализ пяти компаний». Он сам идёт в поиск, читает сайты, собирает данные в таблицу, выдаёт отчёт.

Человек в контуре (Human-in-the-loop) — Принцип организации работы агента, при котором ключевые решения, согласования или необратимые действия всегда проходят через человека. Агент собирает черновик письма — человек проверяет и отправляет. Агент готовит платёж — человек подтверждает. Это не недостаток технологии, а сознательный выбор архитектуры: пока модели галлюцинируют и не понимают полного контекста, человек в контуре защищает от ошибок и держит ответственность. Со временем граница, где нужен человек, сдвигается — но она есть всегда.

Пример. Юридический агент проверяет договоры и помечает рисковые пункты — но решение «подписать или нет» остаётся за юристом.

Claude Code (Claude Code) — Инструмент Anthropic, в котором Claude работает не в чате, а в среде с файлами и командной строкой. Запущенный в вашей рабочей папке, он умеет читать ваши документы, писать новые, запускать скрипты, ставить программы. Несмотря на название «Code», часто оказывается удобнее обычного чата и для нерабочих с кодом задач — анализа документов, автоматизаций, обработки данных.

MCP — протокол подключения инструментов (Model Context Protocol) — Открытый стандарт, по которому к ИИ-моделям подключаются внешние сервисы: Google Drive, почта, базы данных, корпоративные CRM. После подключения модель может, например, сама читать ваши документы в Drive или искать письма в Gmail. MCP создан Anthropic в конце 2024 года, а к 2026 его поддерживают и Claude, и ChatGPT, и Gemini — это стало индустриальным стандартом под управлением Linux Foundation.

No-code / vibe-code инструменты (No-code / vibe-coding) — Среды, в которых вы описываете на естественном языке, какое приложение хотите, и оно собирается без написания кода. Lovable, v0, Bolt — основные представители. Подходят, чтобы за день собрать рабочий прототип внутреннего инструмента — без программистов.

Пример. HR-директор за полдня собирает мини-приложение для приёма заявок на обучение от сотрудников. Без разработчиков.

API (Application Programming Interface) — Способ обращаться к модели не через чат, а программно — из своего кода или из инструментов автоматизации. Через API строятся все корпоративные ИИ-продукты. Для обычного пользователя важно знать, что это существует — техническую часть обычно делает разработчик или партнёр.

Автоматизация (Automation) — Сборка цепочки действий, которая запускается по триггеру и работает без вас. Например, каждое утро берёт письма за вчера, выделяет важные, складывает резюме в Notion. Часто строится на связке «no-code платформа + LLM»: n8n, Make, Zapier плюс Claude или ChatGPT.

Данные и контекст

RAG — поиск с дополнением ответа (Retrieval-Augmented Generation) — Подход, при котором модель сначала ищет нужные документы в вашей базе знаний, а потом отвечает на основе найденного. Решает две проблемы: модель не выдумывает (отвечает по вашим документам) и видит больше, чем помещается в контекстное окно. На этой технологии построен SupaSearch.

Пример. Сотрудник спрашивает в боте «какой у нас регламент по командировкам в Узбекистан?». RAG-система находит нужный пункт в 500-страничной книге регламентов и даёт ответ с цитатой.

База знаний (Knowledge base) — Набор документов компании, по которым модель отвечает: регламенты, инструкции, протоколы, презентации. От качества базы знаний зависит качество ответов: грязные, противоречивые, устаревшие документы — грязные ответы.

Эмбеддинг / векторное представление (Embedding) — Способ представить текст в виде набора чисел, чтобы можно было искать «по смыслу», а не «по словам». Запрос «как уволить сотрудника» найдёт документ «процедура расторжения трудового договора», даже если в нём нет слова «уволить». Лежит в основе RAG.

Файн-тюнинг / дообучение (Fine-tuning) — Способ обучить модель на ваших данных, чтобы она по умолчанию знала ваши термины, стиль, контекст. Дорого, долго, и в 90% случаев не нужно: RAG плюс хороший промпт решают ту же задачу проще.

Внешний vs внутренний контур (External vs internal deployment) — Внешний контур — модель работает на серверах OpenAI или Anthropic, ваши данные уходят туда. Внутренний контур — модель развёрнута внутри периметра компании, данные не покидают её. Внешний быстрее и мощнее, внутренний безопаснее. Выбор зависит от регуляторики и чувствительности данных.

Персональные данные (Personal data) — Информация, идентифицирующая конкретного человека: ФИО, телефон, паспорт, адрес. По 152-ФЗ их нельзя передавать во внешние сервисы без согласия. На практике перед загрузкой в публичные модели такие данные либо обезличивают, либо работают с тестовыми наборами, либо используют корпоративную развёртку модели во внутреннем контуре.

Безопасный промптинг (Safe prompting) — Базовые правила: не загружать в публичные модели коммерческую тайну и персональные данные, не доверять модели на 100% (всегда проверять), помнить, что промпт и ответ могут логироваться на стороне провайдера. Эти правила одинаково применимы к работе в чате, к работе через API и к работе с агентами.

Метрики и оценка

Точность / accuracy (Accuracy) — Доля случаев, когда модель отвечает правильно. Замеряется на тестовом наборе задач с заранее известными правильными ответами. На практике именно по точности оценивают, готово ли ИИ-решение к продуктивному использованию, и насколько оно стало лучше после доработок.

Релевантность (Relevance) — Насколько ответ модели соответствует тому, что вы спрашивали. Может быть фактически правильным, но не релевантным: «расскажи про продажи в Q3» — а в ответ общая теория продаж.

Дельта "было → стало" (Before/after delta) — Измеримое изменение метрики после внедрения ИИ-решения: время задачи сократилось с 4 часов до 30 минут, количество ошибок упало с 15% до 3%, объём подготовленных материалов вырос в 5 раз. Без такой дельты любое ИИ-внедрение трудно отличить от хорошо звучащей презентации — поэтому замер «было → стало» нужно закладывать в проект с самого начала.