Управление стоимостью агента: мониторинг и оптимизация в Selectel Cloud
Управление стоимостью агента: мониторинг и оптимизация в Selectel Cloud
Разверните Grafana и Prometheus в Selectel Cloud, чтобы отслеживать токены и GPU‑часы; добавьте stop‑loss‑политику — при дорогом запросе агент автоматически снижает температуру или обрезает токены; включите failover на YaGPT‑Mini и держите расходы под контролем без потери качества.
Что?
Подсчёт токенов и GPU‑часов, настройка stop‑loss‑алерта по стоимости запроса, автоматическое понижение параметров генерации и failover на YaGPT‑Mini.
Формат и длительность
до 25 человек; 8 часов
Для кого?
DevOps‑, FinOps‑ и ML‑Ops‑команды, отвечающие за бюджет и стабильность AI‑сервисов.
Содержание
Введение в cost‑metrics для LLM. Как считать токены, GPU‑время и переводить их в деньги. Развёртывание Prometheus + Grafana в Selectel Cloud. Готовые Helm‑чарты, дашборды по токенам и GPU. Stop‑loss‑политика. Alert‑rule: порог стоимости запроса → автоматическое снижение температуры / max_tokens. Failover strategy. Переключение с основной модели на YaGPT‑Mini при превышении бюджета или SLA‑латенси. Интеграция с LangChain‑ru. Хуки для логирования запрос‑ответ и передачи метрик в Prometheus. Практика: подключаем собственный агент. Участники заводят метрики, тестируют алерты и failover. Дальнейшие шаги. Cost‑forecast в Grafana ML, отчёты для FinOps, автоматический budget‑reset.
Технологический стек
Prometheus, Grafana, Selectel Cloud, LangChain‑ru
Предварительные требования
Базовые навыки Kubernetes, установленный Prometheus и Python‑окружение.
Эксперты
Дмитрий Жечков
Эксперт по AI и облачным решениям, архитектор облачных решений в Yandex Cloud, сосредоточен на разработке ПО с использованием Generative AI и агентных архитектур.
Носов Андрей
Профильный специалист с более чем 20-летним опытом в ИТ, специализирующийся на архитектуре решений в области ИИ, LLM, RAG, NLP, системной интеграции и руководстве мультидисциплинарными командами. Практический опыт разработки 27 AI/ML решений. Эксперт в построении AI-инфраструктур и развитии продуктовых команд.
Александр Миленкин
ML Team Lead | Dodo Brands Senior Data Scientist | Red Mad Robot Senior Data Scientist | X5 Retail Group
Стоимость
Фиксированная цена
за командный пакет
25 000 ₽/участник
для физических лиц
Ознакомьтесь с другими мастер-классами
Закрываем конкретный вызов: внедрить RAG‑конвейер на LangChain, настроить MLOps‑CI/CD и мониторинг, освоить LoRA/RLHF‑тонкую настройку или добавить guardrails и безопасность
мастер-класс
LangChain Start. От первого запроса до работающего чат-бота
Соберите FAQ-бота для службы поддержки, деплой через Streamlit