Управление стоимостью агента: 
мониторинг и оптимизация в Selectel Cloud
Управление стоимостью 
агента: мониторинг 
и оптимизация 
в Selectel Cloud
Разверните Grafana и Prometheus в Selectel Cloud, чтобы отслеживать токены и GPU‑часы;
добавьте stop‑loss‑политику — при дорогом запросе агент автоматически снижает температуру или обрезает токены; включите failover на YaGPT‑Mini и держите расходы под контролем без потери качества.
  • Что?
    Подсчёт токенов и GPU‑часов, настройка stop‑loss‑алерта по стоимости запроса, автоматическое понижение параметров генерации и failover на YaGPT‑Mini.
  • Формат и длительность
    до 25 человек; 8 часов
  • Для кого?
    DevOps‑, FinOps‑ и ML‑Ops‑команды, отвечающие за бюджет и стабильность AI‑сервисов.
Содержание
Введение в cost‑metrics для LLM. Как считать токены, GPU‑время и переводить их в деньги.
Развёртывание Prometheus + Grafana в Selectel Cloud. Готовые Helm‑чарты, дашборды по токенам и GPU.
Stop‑loss‑политика. Alert‑rule: порог стоимости запроса → автоматическое снижение температуры / max_tokens.
Failover strategy. Переключение с основной модели на YaGPT‑Mini при превышении бюджета или SLA‑латенси.
Интеграция с LangChain‑ru. Хуки для логирования запрос‑ответ и передачи метрик в Prometheus.
Практика: подключаем собственный агент. Участники заводят метрики, тестируют алерты и failover.
Дальнейшие шаги. Cost‑forecast в Grafana ML, отчёты для FinOps, автоматический budget‑reset.
Технологический стек
Prometheus, Grafana, Selectel Cloud, LangChain‑ru
Предварительные требования
Базовые навыки Kubernetes, установленный Prometheus и Python‑окружение.
Эксперты
  • Дмитрий Жечков
    Эксперт по AI и облачным решениям, архитектор облачных решений в Yandex Cloud, сосредоточен на разработке ПО с использованием Generative AI и агентных архитектур.
  • Носов Андрей
    Профильный специалист с более чем 20-летним опытом в ИТ, специализирующийся на архитектуре решений в области ИИ, LLM, RAG, NLP, системной интеграции и руководстве мультидисциплинарными командами. Практический опыт разработки 27 AI/ML решений. Эксперт в построении AI-инфраструктур и развитии продуктовых команд.
  • Александр Миленкин
    ML Team Lead | Dodo Brands
    Senior Data Scientist | Red Mad Robot
    Senior Data Scientist | X5 Retail Group
Стоимость
Фиксированная цена
за командный пакет
25 000 ₽/участник
для физических лиц
Ознакомьтесь с другими
мастер-классами
Закрываем конкретный вызов: внедрить RAG‑конвейер на LangChain, настроить MLOps‑CI/CD и мониторинг, освоить LoRA/RLHF‑тонкую настройку или добавить guardrails и безопасность
Ваша команда умеет собирать AI уже завтра: технологично, практично, экономно

Напишите нам, и мы подберем решение