Avatar-Server-Überblick: Fotorealistische KI-Avatare deployen

Der Avaluma-Avatar-Server ist ein Docker-basierter Dienst, der fotorealistische KI-Avatare aus .hvia-Dateien rendert und das resultierende Video direkt in einen LiveKit-Raum streamt. Er übernimmt das gesamte GPU-beschleunigte Rendering lokal und gibt dir volle Kontrolle über Rechenressourcen und Latenz. Du kannst mehrere Avatar-Sessions gleichzeitig betreiben — jede Session verbraucht etwa 2,5 GB VRAM —, sodass das Hochskalieren mit wachsenden Anforderungen unkompliziert ist.

Funktionsweise

Der Avatar-Server bildet den Kern des Avaluma-Stacks. Ein LiveKit-Agent steuert die Sprach-KI-Pipeline — Speech-to-Text, Sprachmodell und Text-to-Speech — und sendet Audio an den Avatar-Server. Der Server animiert den Avatar in Echtzeit und streamt das Video zurück in den LiveKit-Raum, sodass die Teilnehmer es sehen.

GPU-Anforderungen

Der Avatar-Server benötigt eine dedizierte NVIDIA-GPU. Reine CPU-Umgebungen werden nicht unterstützt.

Anforderung	Detail
CUDA-Version	12
Zusätzliche Fähigkeiten	OpenGL-Unterstützung, Grafiktreiber
Minimaler VRAM	6 GB (jede Avatar-Session nutzt ~2,5 GB)
Getestete Architekturen	Ampere, Ada Lovelace, Blackwell
NVIDIA Container Toolkit	Erforderlich — Installationsanleitung

Deployment-Optionen

Du kannst deinen LiveKit-Agent entweder mit dem von Avaluma gehosteten Server oder mit deiner eigenen selbst gehosteten Instanz verbinden:

Avaluma Hosted — richte deinen Agent auf api.avaluma.ai und lass Avaluma die Infrastruktur verwalten.
Selbst gehostet — betreibe den Docker-Dienst auf eigener Hardware für volle Kontrolle über Daten und Rechenleistung.

Verzeichnisstruktur

Das Verzeichnis avatar-server/ enthält alles, was du für den Start brauchst:

avatar-server/
├── assets/
│   └── avatars/          # Lege deine .hvia-Avatar-Dateien hier ab
├── reverse_proxy/        # Optional: Caddy-HTTPS-Reverse-Proxy
│   ├── Caddyfile
│   └── docker-compose.yaml
└── docker-compose.yaml

Lege deine .hvia-Avatar-Dateien in assets/avatars/ ab. Der Ordner reverse_proxy/ enthält eine optionale Caddy-Konfiguration zum Terminieren von TLS in der Produktion.

Nächste Schritte

Setup

Deploye den Avatar-Server mit Docker, füge deine Avatar-Dateien hinzu und konfiguriere die Umgebung.

HTTPS-Proxy

Füge deinem Deployment mit dem enthaltenen Caddy-Reverse-Proxy automatisches TLS hinzu.

So funktioniert Avaluma AI: Architektur-Überblick

Zurück

Avatar-Server-Setup: Mit Docker installieren und konfigurieren

Weiter

Agents

Preise & Abrechnung

Avatare

Self-Hosting

Doku als MCP

Avatar-Server-Überblick: Fotorealistische KI-Avatare deployen

Funktionsweise

GPU-Anforderungen

Deployment-Optionen

Verzeichnisstruktur

Nächste Schritte

Setup

HTTPS-Proxy

​Funktionsweise

​GPU-Anforderungen

​Deployment-Optionen

​Verzeichnisstruktur

​Nächste Schritte

Setup

HTTPS-Proxy

Funktionsweise

GPU-Anforderungen

Deployment-Optionen

Verzeichnisstruktur

Nächste Schritte