ИИЧАВО База знаний

Как работать с таблицами и данными

Нейросети не видят, но воспринимают

Нейросети умеют работать с таблицами и изображениями, но делают это не так, как человек. Они не «видят» таблицу глазами и не «читают» текст на изображении. Вместо этого они превращают данные в числовые представления, интерпретируют закономерности и выдают наиболее вероятный ответ. Чтобы правильно с ними работать, важно понимать, как всё устроено внутри.

Чтобы распознать изображение, например, нейросеть изучает картинку попиксельно — разделяет её на небольшие квадраты по несколько пикселей, изучает их расположение и сводит все такие квадраты вместе.

Нейросети не умеют работать с таблицами нативно, как с текстом. Для этого нейросеть сама придумывает, как решить задачу. За то, чтобы распознать таблицу, отвечает интерпретатор кода — нейросеть сама пишет код, чтобы выполнить задачу. Будь то извлечь данные, создать таблицу или график.

Поэтому модель может лениться — извлекать не все данные

Например, ты загрузил таблицу на 200 строк, а нейросеть «прочитала» только 50. Обычно это можно посмотреть в интерфейсе нейросети — в коде, — сколько строк извлекла модель. Другой способ — задать нейросети вопрос о данных

в таблице. Поэтому убедись, что модель точно восприняла всю таблицу.

В заданиях этого модуля не будет слишком длинных таблиц

для надёжности и точности ответов. Однако помни, что самый надёжный способ — скопировать данные из таблицы и вставить их текстом.

Нейросети также важен контекст: объясни, как устроена таблица; какие

в таблице есть листы; какие есть колонки и какие данные в них содержатся. Так модель ответит точнее — сразу будет понимать, куда ей смотреть и что делать. Это особенно поможет, если таблица сложная и запутанная: на одном листе несколько таблиц, текстовые пометки и лишние данные — «выбросы»

(не путать с «вбросами»).

Как приёмы TRICERA помогут в работе с таблицами и данными

Role — стилизация ответа слабо повлияет на результат, однако поможет

в смежных задачах.

Ответы в роли главбуха и инвестиционного аналитика на просьбу структурировать личный бюджет будут отличаться.

Instructions — опиши, какие данные стоит или не стоит использовать.

Не использовать данные из колонок G, F и H.

Context — опиши, есть ли ошибки в данных или другие проблемы с ними

или то, что ты планируешь создать на основе данных.

Укажи, что в таблице некоторые данные неправильные.

Examples — укажи оценку, которая поможет нейросети отфильтровать данные.

Укажи примеры негативных, нейтральных и позитивных отзывов, если твоя задача — оценить репутацию бренда на основе текстовых отзывов пользователей.

References — покажи пример, в каком формате нейросети стоит структурировать данные.

Опиши формат отчёта, который ты хочешь составить на основе таблицы.

Algorithm — опиши последовательность, чтобы снизить количество галлюцинаций модели.

Попроси отдельно проанализировать каждый лист в таблице — и укажи названия и последовательность листов, — если листов в таблице много

или есть лишние листы, которые не нужно анализировать.

Хотите внедрить ИИ в работу команды? Назначить звонок →