.hvia-Avatar-Datei auf einer GPU, ein LiveKit-Agent betreibt eine vollständige Sprach-KI-Pipeline (STT → LLM → TTS), und ein verbundener Test-Client lässt dich in Echtzeit mit deinem Avatar sprechen.
Voraussetzungen
Stelle vor dem Start sicher, dass du Folgendes hast:
- Docker & Docker Compose auf deinem Server installiert
- Eine NVIDIA-GPU (CUDA 12, min. 6 GB VRAM) mit installiertem NVIDIA Container Toolkit
- Einen Avaluma-Lizenzschlüssel und mindestens eine
.hvia-Avatar-Datei - Ein LiveKit-Konto (Cloud oder selbst gehostet) mit API-Key und Secret
Avatar-Server deployen
Klone oder lade das Beispielverzeichnis Öffne Starte den Server:Der Avatar-Server ist nun unter http://localhost:8080 erreichbar. Füge für die Produktion den optionalen Caddy-Reverse-Proxy aus
avatar-server herunter und lege deine .hvia-Avatar-Dateien dort ab, wo der Container sie findet:avatar-server/docker-compose.yaml und setze ein sicheres Passwort für die Utility-API:avatar-server/reverse_proxy/ hinzu, um TLS automatisch zu terminieren.LiveKit-Agent konfigurieren
Klone oder lade das Beispielverzeichnis Öffne Öffne als Nächstes Der Du musst diesen Block nicht ändern — er liest die Werte aus
livekit-agent herunter. Kopiere die Umgebungsvorlage:.env.local und trage deine Zugangsdaten ein:Wenn du den verwalteten Avatar-Server von Avaluma nutzt, setze
AVATAR_SERVER_URL=https://api.avaluma.ai. Hast du in Schritt 1 deinen eigenen Server deployt, verwende dessen öffentliche URL.agents/1-agent-with-livekit-inference/agent-1.py und setze avatar_id auf den Dateinamen deiner .hvia-Datei ohne die Endung .hvia:AvatarSession-Block in dieser Datei verbindet die Sprach-Pipeline mit dem Avatar-Server:.env.local und avatar_id automatisch.Agent starten
Starte nur den Konversations-Agent (Um beide Beispiel-Agenten auf einmal zu starten, lasse den Servicenamen weg:
agent-1):Verbindung testen
Mit allen drei laufenden Services — Avatar-Server, LiveKit-Server und Agent — verbindest du einen Client mit deinem LiveKit-Raum.Dein Avatar sollte im Video-Track erscheinen und in Echtzeit auf deine Stimme reagieren.
- Avaluma Test-Client
- LiveKit Agent Playground
Öffne den Avaluma Test-Client im Browser. Er funktioniert mit jedem LiveKit-Setup — selbst gehostet oder Cloud. Gib deine LiveKit-Server-URL und Zugangsdaten ein und klicke auf Connect, um mit deinem Avatar zu sprechen.
Nächste Schritte
Architektur
Erfahre, wie Avatar-Server und LiveKit-Agent unter der Haube zusammenspielen.
Avatar-Server
Konfiguriere GPU-Ressourcen, betreibe mehrere Avatare gleichzeitig und richte HTTPS ein.
LiveKit-Agent
Tausche verschiedene STT-, LLM- und TTS-Modelle aus und füge eigene Agent-Logik hinzu.
Externes Audio
Streame Audio von einem beliebigen externen Dienst direkt zum Avatar — ohne AgentSession.
