Сдача своих GPU

Qudata Agent

Как Agent управляет инстансами, какие технологии использует и как за ним следить.

Qudata Agent — системный сервис, который управляет жизненным циклом инстансов на узле. Он работает в фоне, взаимодействует с платформой и обеспечивает корректный запуск, исполнение и завершение задач.

Технологии изоляции

Для запуска инстансов Agent использует проверенные открытые технологии виртуализации:

QEMU/KVM — аппаратная виртуализация. Каждый инстанс — полноценная VM, полностью изолированная от хоста и от других инстансов.

VFIO (PCI passthrough) — GPU передаётся напрямую в VM. Во время выполнения задачи хост не имеет доступа к GPU-контексту и содержимому видеопамяти.

NVIDIA-драйверы должны отсутствовать на хосте. Они устанавливаются только внутри VM. Наличие драйверов на хосте блокирует GPU passthrough.

Жизненный цикл инстанса

  1. Платформа отправляет команду на запуск.
  2. Agent подготавливает окружение и выделяет ресурсы.
  3. GPU переходит в режим passthrough — передаётся в VM.
  4. VM запускается и принимает пользовательскую нагрузку.
  5. После завершения задачи VM останавливается, GPU возвращается хосту, ресурсы освобождаются.

При сбое на любом из этапов Agent выполняет автоматический откат и возвращает узел в консистентное состояние.

Мониторинг

Agent работает как systemd-сервис. Основные команды:

# Статус
systemctl status qudata-agent

# Журнал в реальном времени
journalctl -u qudata-agent -f

# Перезапуск (только в окно обслуживания)
systemctl restart qudata-agent

On this page