Erste Schritte mit Avaluma-AI-Avataren (Self-Hosting)

Am Ende dieser Anleitung rendert dein Avaluma-Avatar-Server deine .hvia-Avatar-Datei auf einer GPU, ein LiveKit-Agent betreibt eine vollständige Sprach-KI-Pipeline (STT → LLM → TTS), und ein verbundener Test-Client lässt dich in Echtzeit mit deinem Avatar sprechen.

Voraussetzungen

Stelle vor dem Start sicher, dass du Folgendes hast:

Docker & Docker Compose auf deinem Server installiert
Eine NVIDIA-GPU (CUDA 12, min. 6 GB VRAM) mit installiertem NVIDIA Container Toolkit
Einen Avaluma-Lizenzschlüssel und mindestens eine .hvia-Avatar-Datei
Ein LiveKit-Konto (Cloud oder selbst gehostet) mit API-Key und Secret

Avatar-Server deployen

Klone oder lade das Beispielverzeichnis avatar-server herunter und lege deine .hvia-Avatar-Dateien dort ab, wo der Container sie findet:

mkdir -p avatar-server/assets/avatars
cp /pfad/zu/deinem-avatar.hvia avatar-server/assets/avatars/

Öffne avatar-server/docker-compose.yaml und setze ein sicheres Passwort für die Utility-API:

environment:
  - API_SERVER_HOST=api.avaluma.ai   # öffentliche IP oder Domain dieses Servers
  - API_UTILS_PWD=CHANGE_THIS        # durch ein starkes Passwort ersetzen

Starte den Server:

docker compose up -d

Der Avatar-Server ist nun unter http://localhost:8080 erreichbar. Füge für die Produktion den optionalen Caddy-Reverse-Proxy aus avatar-server/reverse_proxy/ hinzu, um TLS automatisch zu terminieren.

Der Container nutzt pull_policy: always, ein Neustart zieht also automatisch das neueste Avaluma-Image.

LiveKit-Agent konfigurieren

Klone oder lade das Beispielverzeichnis livekit-agent herunter. Kopiere die Umgebungsvorlage:

cp .env.example .env.local

Öffne .env.local und trage deine Zugangsdaten ein:

AVALUMA_LICENSE_KEY=""      # Dein Avaluma-Lizenzschlüssel
AVATAR_SERVER_URL="https://your-avatar-server.com"
# Avaluma Hosted: https://api.avaluma.ai

LIVEKIT_URL=""              # wss://your-livekit-instance.livekit.cloud
LIVEKIT_API_KEY=""          # API-Key aus deinem LiveKit-Projekt
LIVEKIT_API_SECRET=""       # API-Secret aus deinem LiveKit-Projekt

Wenn du den verwalteten Avatar-Server von Avaluma nutzt, setze AVATAR_SERVER_URL=https://api.avaluma.ai. Hast du in Schritt 1 deinen eigenen Server deployt, verwende dessen öffentliche URL.

Öffne als Nächstes agents/1-agent-with-livekit-inference/agent-1.py und setze avatar_id auf den Dateinamen deiner .hvia-Datei ohne die Endung .hvia:

avatar_id = "your-avatar-id"   # z. B. "studio-avatar-v2" für studio-avatar-v2.hvia

Der AvatarSession-Block in dieser Datei verbindet die Sprach-Pipeline mit dem Avatar-Server:

from avaluma_livekit_plugin import AvatarSession

avatar = AvatarSession(
    license_key=license_key,       # Dein Lizenzschlüssel
    avatar_id=avatar_id,           # Avatar-Bezeichner (Name der .hvia-Datei)
    avatar_server_url=avatar_server_url,
)
await avatar.start(agent_session=session, room=ctx.room)

Du musst diesen Block nicht ändern — er liest die Werte aus .env.local und avatar_id automatisch.

Agent starten

Starte nur den Konversations-Agent (agent-1):

docker compose up livekit-agent-1 -d

Um beide Beispiel-Agenten auf einmal zu starten, lasse den Servicenamen weg:

docker compose up -d

Jeder Agent muss in docker-compose.yaml einen eindeutigen AGENT_NAME haben, wenn du mehrere Agenten im selben LiveKit-Projekt deployst.

Verbindung testen

Mit allen drei laufenden Services — Avatar-Server, LiveKit-Server und Agent — verbindest du einen Client mit deinem LiveKit-Raum.

Avaluma Test-Client
LiveKit Agent Playground

Öffne den Avaluma Test-Client im Browser. Er funktioniert mit jedem LiveKit-Setup — selbst gehostet oder Cloud. Gib deine LiveKit-Server-URL und Zugangsdaten ein und klicke auf Connect, um mit deinem Avatar zu sprechen.

Öffne das LiveKit Agent Playground. Wähle dein LiveKit-Cloud-Projekt oder gib deine Server-Zugangsdaten ein, trage agent-1 als Agent Name ein und klicke auf Connect.

Wenn der Agent nach dem Ändern des Agent-Namens nicht reagiert, lade die Seite neu und verbinde dich erneut.

Dein Avatar sollte im Video-Track erscheinen und in Echtzeit auf deine Stimme reagieren.

Nächste Schritte

Architektur

Erfahre, wie Avatar-Server und LiveKit-Agent unter der Haube zusammenspielen.

Avatar-Server

Konfiguriere GPU-Ressourcen, betreibe mehrere Avatare gleichzeitig und richte HTTPS ein.

LiveKit-Agent

Tausche verschiedene STT-, LLM- und TTS-Modelle aus und füge eigene Agent-Logik hinzu.

Externes Audio

Streame Audio von einem beliebigen externen Dienst direkt zum Avatar — ohne AgentSession.

Agents

Preise & Abrechnung

Avatare

Self-Hosting

Doku als MCP

Erste Schritte mit Avaluma-AI-Avataren (Self-Hosting)

Voraussetzungen

Nächste Schritte

Architektur

Avatar-Server

LiveKit-Agent

Externes Audio

​Voraussetzungen

​Nächste Schritte

Architektur

Avatar-Server

LiveKit-Agent

Externes Audio

Voraussetzungen

Nächste Schritte