Дообучите RuGPT3Turbo, YaGPTMini или Mistral‑ru с FastLoRA на своём датасете, добавьте RLHF‑PPO в trlX и отладьте модель по метрикам RuSEval / latency / toxicity, а затем задеплойте её в SberCloud ML Space Serving или on‑prem Triton без vendor‑lock‑in.
Дообучите RuGPT3Turbo, YaGPTMini или Mistral‑ru с FastLoRA на своём датасете, добавьте RLHF‑PPO в trlX и отладьте модель по метрикам RuSEval / latency / toxicity, а затем задеплойте её в SberCloud ML Space Serving или on‑prem Triton без vendor‑lock‑in.
Что?
Очистка и сбор датасета (≈2 000 Q‑A) → LoRA‑дообучение + RLHF‑PPO → метрики RuSEval / latency / toxicity → продовый деплой в ML Space Serving или Triton.
Формат и длительность
до 25 человек; 8 часов
Для кого?
ML/DL‑инженеры, R&D‑группы и DevOps‑команды, которым нужен управляемый fine‑tune отечественных LLM.
Содержание
Подготовка данных. Быстрая выгрузка и очистка 2 000 Q‑A, разметка предпочтений для RLHF. FastLoRA‑fine‑tune. Настройка гиперпараметров, Gemini‑style training loop, контроль GPU‑памяти. RLHF‑PPO с trlX. Сбор human‑feedback, запуск PPO‑обучения, ранняя остановка по метрикам. Оценка качества. Автоматические RuSEval, latency и toxicity‑чек, генерация отчёта. Пакетирование модели. Экспорт чекпойнта, генерация Tokenizer/Config, Docker‑образ. Деплой и инференс. ML Space Serving (GPU autoscale) или Triton ensemble, REST/gRPC‑эндпоинт. Продакшн‑best‑practices. CI/CD‑hook, мониторинг токенов и затрат, план масштабирования.
Технологический стек
RuGPT3Turbo, YaGPTMini, Mistral 7B‑ru, FastLoRA, trlX, SberCloud ML Space Serving, NVIDIA Triton.
Предварительные требования
Python 3.10+, CUDA‑совместимый GPU, Docker, Git.
Эксперты
Дмитрий Жечков
Эксперт по AI и облачным решениям, архитектор облачных решений в Yandex Cloud, сосредоточен на разработке ПО с использованием Generative AI и агентных архитектур.
Носов Андрей
Профильный специалист с более чем 20-летним опытом в ИТ, специализирующийся на архитектуре решений в области ИИ, LLM, RAG, NLP, системной интеграции и руководстве мультидисциплинарными командами. Практический опыт разработки 27 AI/ML решений. Эксперт в построении AI-инфраструктур и развитии продуктовых команд.
Александр Миленкин
ML Team Lead | Dodo Brands Senior Data Scientist | Red Mad Robot Senior Data Scientist | X5 Retail Group
Стоимость
Фиксированная цена
за командный пакет
25 000 ₽/участник
для физических лиц
Ознакомьтесь с другими мастер-классами
Закрываем конкретный вызов: внедрить RAG‑конвейер на LangChain, настроить MLOps‑CI/CD и мониторинг, освоить LoRA/RLHF‑тонкую настройку или добавить guardrails и безопасность
мастер-класс
LangChain Start. От первого запроса до работающего чат-бота
Соберите FAQ-бота для службы поддержки, деплой через Streamlit