Fine‑Tuning & RLHF 
российских LLM
Secure Agentic AI
под 152-ФЗ
Дообучите RuGPT3Turbo, YaGPTMini или Mistral‑ru с FastLoRA на своём датасете, добавьте RLHF‑PPO в trlX и отладьте модель по метрикам RuSEval / latency / toxicity, а затем задеплойте её в SberCloud ML Space Serving или on‑prem Triton без vendor‑lock‑in.
Дообучите RuGPT3Turbo, YaGPTMini 
или Mistral‑ru с FastLoRA на своём
датасете, добавьте RLHF‑PPO в trlX 
и отладьте модель по метрикам RuSEval / latency / toxicity,
а затем задеплойте её в SberCloud ML Space Serving 
или on‑prem Triton без vendor‑lock‑in.
  • Что?
    Очистка и сбор датасета (≈2 000 Q‑A) → LoRA‑дообучение + RLHF‑PPO → метрики RuSEval / latency / toxicity → продовый деплой в ML Space Serving или Triton.
  • Формат и длительность
    до 25 человек; 8 часов
  • Для кого?
    ML/DL‑инженеры, R&D‑группы и DevOps‑команды, которым нужен управляемый fine‑tune отечественных LLM.
Содержание
Подготовка данных. Быстрая выгрузка и очистка 2 000 Q‑A, разметка предпочтений для RLHF.
FastLoRA‑fine‑tune. Настройка гиперпараметров, Gemini‑style training loop, контроль GPU‑памяти.
RLHF‑PPO с trlX. Сбор human‑feedback, запуск PPO‑обучения, ранняя остановка по метрикам.
Оценка качества. Автоматические RuSEval, latency и toxicity‑чек, генерация отчёта.
Пакетирование модели. Экспорт чекпойнта, генерация Tokenizer/Config, Docker‑образ.
Деплой и инференс. ML Space Serving (GPU autoscale) или Triton ensemble, REST/gRPC‑эндпоинт.
Продакшн‑best‑practices. CI/CD‑hook, мониторинг токенов и затрат, план масштабирования.
Технологический стек
RuGPT3Turbo, YaGPTMini, Mistral 7B‑ru, FastLoRA, trlX, SberCloud ML Space Serving, NVIDIA Triton.
Предварительные требования
Python 3.10+, CUDA‑совместимый GPU, Docker, Git.
Эксперты
  • Дмитрий Жечков
    Эксперт по AI и облачным решениям, архитектор облачных решений в Yandex Cloud, сосредоточен на разработке ПО с использованием Generative AI и агентных архитектур.
  • Носов Андрей
    Профильный специалист с более чем 20-летним опытом в ИТ, специализирующийся на архитектуре решений в области ИИ, LLM, RAG, NLP, системной интеграции и руководстве мультидисциплинарными командами. Практический опыт разработки 27 AI/ML решений. Эксперт в построении AI-инфраструктур и развитии продуктовых команд.
  • Александр Миленкин
    ML Team Lead | Dodo Brands
    Senior Data Scientist | Red Mad Robot
    Senior Data Scientist | X5 Retail Group
Стоимость
Фиксированная цена
за командный пакет
25 000 ₽/участник
для физических лиц
Ознакомьтесь с другими
мастер-классами
Закрываем конкретный вызов: внедрить RAG‑конвейер на LangChain, настроить MLOps‑CI/CD и мониторинг, освоить LoRA/RLHF‑тонкую настройку или добавить guardrails и безопасность
Ваша команда умеет собирать AI уже завтра: технологично, практично, экономно

Напишите нам, и мы подберем решение