1. Главный секрет: Мы не обучаем, мы даем контекст (RAG)

Обучение (Pre-training) нейросети стоит миллионы долларов. Но для юридического помощника нам не нужно, чтобы нейросеть «выучила» все законы наизусть (она все равно будет галлюцинировать и придумывать несуществующие статьи).

Нам нужна архитектура RAG (Retrieval-Augmented Generation):
  • Когда пользователь пишет проблему, система сначала ищет нужные законы и похожие судебные практики в нашей базе данных.
  • Затем мы берем готовую умную нейросеть и говорим ей: "Вот проблема клиента, а вот 5 статей закона. Опираясь СТРОГО на эти статьи, напиши план действий".
  • Цена: Доли цента за один запрос.
  • Плюс для B2B и корпоратов: Законы меняются каждый день. С RAG нам не нужно переобучать модель — мы просто загружаем новый PDF-файл с законом в базу, и система уже завтра работает по новым правилам.
2. Если нужна приватность: Аренда GPU (Cloud GPU)

Для корпоративных клиентов часто критична конфиденциальность — они не хотят, чтобы их внутренние документы или данные сотрудников улетали на серверы OpenAI или Google. В этом случае мы берем мощную Open-Source модель (например, Llama 3 или Mistral) и разворачиваем её в облаке.

Серверы под это арендуются почасово:
  • RunPod, Vast.ai или Lambda Labs: Это Airbnb для видеокарт. Ты можешь арендовать топовую карточку (например, RTX 4090 или A100) всего за $0.50 – $2.00 в час.
  • Если нам нужно дообучить модель (сделать Fine-tuning на специфических юридических терминах), мы арендуем сервер на 2-3 дня, тратим условно $50-$100, получаем готовую модель и выключаем сервер. Никаких капитальных затрат.
3. Serverless AI (Оплата за токены)

Сейчас есть провайдеры (Groq, Together AI, Anyscale), которые уже развернули у себя Open-Source модели на огромных кластерах серверов. Мы подключаемся к ним по API. Это работает так же, как наш Vercel: сервер просыпается на миллисекунду, генерирует ответ клиенту и засыпает. Мы платим только за сгенерированные слова (токены). Это позволяет держать стоимость обслуживания одного клиента в районе 1-2 рублей.
Made on
Tilda