Копоративное обучение искусственному интеллекту

Корпоративное обучение искусственному интеллекту

On-prem Agentic AI: Hugging Face + K8s + NVIDIA Triton

Соберите локального AI‑агента на Mistral‑ru с LoRA‑тонкой настройкой и Hugging Face;
задеплойте его в Kubernetes через NVIDIA Triton Inference Server с CI/CD (GitLab Runner → Argo CD); получите автономное решение для техподдержки без передачи данных в облако.

Что?

Настроим Triton Server с LoRA‑версией Mistral‑ru, соберём CI/CD конвейер GitLab Runner → Argo CD и выпустим чат‑агента техподдержки.
Формат и длительность

до 25 человек; 8 часов
Для кого?

Enterprise R&D, DevOps и платформенные команды, строящие on‑prem AI‑сервисы на GPU‑кластерах.

Содержание

Архитектура on‑prem LLM — обзор Mistral‑ru, LoRA‑адаптация, формат Triton ensemble.
Kubernetes GPU‑кластер — подготовка узлов, драйверов и NVIDIA device plugin.
Развёртывание Triton Inference Server — загрузка модели, REST/gRPC‑эндпоинты.
Инфраструктура как код — Helm‑чарты, manifests, PVC‑хранилище моделей.
CI/CD — сборка и тестирование в GitLab Runner, автоматический rollout через Argo CD.
Агент техподдержки — настройка prompt‑логики, Memory, ручка /chat.
Мониторинг и масштабирование — метрики latency/TPS, горизонтальный авто‑скейлинг.

Технологический стек

HF models, Kubernetes, NVIDIA Triton, GitLab Runner, Argo CD, Mistral‑ru LoRA

Предварительные требования

Опыт работы с K8s, доступные GPU‑ноды, GitLab и Docker.

Эксперты

Дмитрий Жечков

Эксперт по AI и облачным решениям, архитектор облачных решений в Yandex Cloud, сосредоточен на разработке ПО с использованием Generative AI и агентных архитектур.
Носов Андрей

Профильный специалист с более чем 20-летним опытом в ИТ, специализирующийся на архитектуре решений в области ИИ, LLM, RAG, NLP, системной интеграции и руководстве мультидисциплинарными командами. Практический опыт разработки 27 AI/ML решений. Эксперт в построении AI-инфраструктур и развитии продуктовых команд.
Александр Миленкин

ML Team Lead | Dodo Brands
Senior Data Scientist | Red Mad Robot
Senior Data Scientist | X5 Retail Group

Стоимость

от 350 000 рублей

за команду до 25 человек

Ознакомьтесь с другими
мастер-классами

Закрываем конкретный вызов: внедрить RAG‑конвейер на LangChain, настроить MLOps‑CI/CD и мониторинг, освоить LoRA/RLHF‑тонкую настройку или добавить guardrails и безопасность

мастер-класс

LangChain Start. От первого запроса до работающего чат-бота

Соберите FAQ-бота для службы поддержки, деплой через Streamlit