Question 1

Будет ли система «фантазировать» как ChatGPT?

Accepted Answer

Нет. Мы строим на RAG: модель отвечает только по вашей проверенной базе, с указанием источника каждого факта. Если ответа в данных нет — система честно говорит «не знаю», а не выдумывает. Guardrails и тестирование на пограничных случаях — обязательная часть внедрения. Метрику галлюцинаций (hallucination rate) держим ниже 5%.

Question 2

Данные не утекут? У нас режимная информация.

Accepted Answer

Возможно полностью on-premise развёртывание — система работает на вашей инфраструктуре, данные не покидают контур. Для чувствительных задач используем self-hosted модели (Qwen, Llama) без обращений к внешним API. Соответствие 152-ФЗ, RBAC по типам документов, аудит каждого запроса. Подходит для госсектора, банков и промышленности.

Question 3

Чем это отличается от обычного поиска или wiki?

Accepted Answer

Полнотекстовый поиск находит файлы по словам — вы дальше читаете сами. Wiki стареет и умирает: около 40% страниц не открываются за год. Наша система отвечает на вопрос по сути, агрегируя информацию из разных источников, обходя связи между сущностями, и приводит ссылки. Это разница между «нашёл 50 документов» и «вот ответ и вот откуда он».

Question 4

Сколько это занимает и с чего начать?

Accepted Answer

Работаем лестницей: аудит (1–2 недели) → пилот (4–8 недель) → внедрение (2–4 месяца) → поддержка. Начать разумно с аудита — он дёшев, снимает baseline и даёт понимание объёма работ и точную смету остальных этапов без обязательств идти дальше.

Question 5

Что если у нас данные в беспорядке?

Accepted Answer

Это норма, и часть работы. На аудите определяем границы: начинаем со структурного (реестры, протоколы, регламенты), деграды (сканы, неструктурированные таблицы) разбираем отдельно. Самый важный и при этом самый дешёвый этап — семантический слой: договориться, что в компании считать «клиентом», «договором», «проектом». От качества схемы зависит всё остальное.

Question 6

Как формируется стоимость?

Accepted Answer

Зависит от объёма и состояния источников, требований к инфраструктуре (облако / on-premise), числа интеграций и глубины семантической схемы. Точную смету по этапам собираем после аудита. Поддержка — отдельной ежемесячной строкой.

Система, которая отвечает по вашим данным. С источниками. На вашей инфраструктуре.

Wiki не умирает от нехватки. Она умирает от того, что её не найти.

Четыре этапа. Каждый — точка возврата.

Аудит

Пилот

Внедрение

Поддержка

Гибрид vector + graph — стандарт продакшен-внедрений.

Данные не покидают ваш контур.

Если система отвечает на это за 30 секунд — она работает.

«Какие позиции мы заявляли по этому вопросу за последние 5 лет?»

«Кто из команды уже работал с этим заказчиком / ведомством?»

«Готов ли пакет материалов по теме X?»

«Как мы обычно решаем такую задачу?»

«Что изменилось в регламенте с прошлой версии?»

«Эти два документа противоречат друг другу?»

Мы это не только проектируем — мы про это пишем.

Шесть сигналов, что база знаний окупится.

Что обычно спрашивают до подписания брифа.

Начните с аудита — без обязательств идти дальше.