Копоративное обучение искусственному интеллекту

Корпоративное обучение искусственному интеллекту

Fine‑Tuning & RLHF 
российских LLM

Secure Agentic AI
под 152-ФЗ

Дообучите RuGPT3Turbo, YaGPTMini или Mistral‑ru с FastLoRA на своём датасете, добавьте RLHF‑PPO в trlX и отладьте модель по метрикам RuSEval / latency / toxicity, а затем задеплойте её в SberCloud ML Space Serving или on‑prem Triton без vendor‑lock‑in.

Дообучите RuGPT3Turbo, YaGPTMini 
или Mistral‑ru с FastLoRA на своём
датасете, добавьте RLHF‑PPO в trlX 
и отладьте модель по метрикам RuSEval / latency / toxicity,
а затем задеплойте её в SberCloud ML Space Serving 
или on‑prem Triton без vendor‑lock‑in.

Что?

Очистка и сбор датасета (≈2 000 Q‑A) → LoRA‑дообучение + RLHF‑PPO → метрики RuSEval / latency / toxicity → продовый деплой в ML Space Serving или Triton.
Формат и длительность

до 25 человек; 8 часов
Для кого?

ML/DL‑инженеры, R&D‑группы и DevOps‑команды, которым нужен управляемый fine‑tune отечественных LLM.

Содержание

Подготовка данных. Быстрая выгрузка и очистка 2 000 Q‑A, разметка предпочтений для RLHF.
FastLoRA‑fine‑tune. Настройка гиперпараметров, Gemini‑style training loop, контроль GPU‑памяти.
RLHF‑PPO с trlX. Сбор human‑feedback, запуск PPO‑обучения, ранняя остановка по метрикам.
Оценка качества. Автоматические RuSEval, latency и toxicity‑чек, генерация отчёта.
Пакетирование модели. Экспорт чекпойнта, генерация Tokenizer/Config, Docker‑образ.
Деплой и инференс. ML Space Serving (GPU autoscale) или Triton ensemble, REST/gRPC‑эндпоинт.
Продакшн‑best‑practices. CI/CD‑hook, мониторинг токенов и затрат, план масштабирования.

Технологический стек

RuGPT3Turbo, YaGPTMini, Mistral 7B‑ru, FastLoRA, trlX, SberCloud ML Space Serving, NVIDIA Triton.

Предварительные требования

Python 3.10+, CUDA‑совместимый GPU, Docker, Git.

Эксперты

Дмитрий Жечков

Эксперт по AI и облачным решениям, архитектор облачных решений в Yandex Cloud, сосредоточен на разработке ПО с использованием Generative AI и агентных архитектур.
Носов Андрей

Профильный специалист с более чем 20-летним опытом в ИТ, специализирующийся на архитектуре решений в области ИИ, LLM, RAG, NLP, системной интеграции и руководстве мультидисциплинарными командами. Практический опыт разработки 27 AI/ML решений. Эксперт в построении AI-инфраструктур и развитии продуктовых команд.
Александр Миленкин

ML Team Lead | Dodo Brands
Senior Data Scientist | Red Mad Robot
Senior Data Scientist | X5 Retail Group

Стоимость

от 350 000 рублей

за команду до 25 человек

Ознакомьтесь с другими
мастер-классами

Закрываем конкретный вызов: внедрить RAG‑конвейер на LangChain, настроить MLOps‑CI/CD и мониторинг, освоить LoRA/RLHF‑тонкую настройку или добавить guardrails и безопасность

мастер-класс

LangChain Start. От первого запроса до работающего чат-бота

Соберите FAQ-бота для службы поддержки, деплой через Streamlit

Fine‑Tuning & RLHF российских LLM

Fine‑Tuning & RLHF 
российских LLM