Zum Hauptinhalt springen
Beim Self-Hosting betreibst du die Avaluma-Avatar-Pipeline auf deiner eigenen Infrastruktur. Du stellst einen LiveKit-Raum und eine von Avaluma ausgestellte .hvia-Avatar-Datei bereit; Avaluma übernimmt das GPU-beschleunigte Rendering, die Lippensynchronisation und das Video-Streaming — deine Nutzer sehen also einen lebensechten sprechenden Avatar, kein statisches Bild und keinen Comic.
Suchst du den schnellsten Weg, ohne eigene Infrastruktur? Erstelle stattdessen einen gehosteten Agent im Dashboard.

Funktionsweise

Self-Hosting basiert auf zwei zusammenarbeitenden Komponenten, die du unabhängig voneinander betreibst. Avatar-Server läuft auf einer NVIDIA-GPU und ist die Rendering-Engine. Er liest deine .hvia-Avatar-Dateien, animiert den Avatar Bild für Bild als Reaktion auf eingehendes Audio und veröffentlicht den resultierenden Video-Track direkt in einem LiveKit-Raum. Du kannst den Avatar-Server selbst hosten oder den verwalteten Endpunkt von Avaluma unter https://api.avaluma.ai nutzen. LiveKit-Agent ist eine Python-basierte Sprach-KI-Pipeline, die eine Konversation steuert. Er erfasst Mikrofon-Eingaben, leitet sie durch Speech-to-Text (STT), übergibt das Transkript an ein Large Language Model (LLM), synthetisiert Sprache per Text-to-Speech (TTS) und reicht das Audio dann über das avaluma-livekit-plugin an den Avatar-Server weiter. Der Avatar animiert dieses Audio und streamt das Video zurück in den Raum.

Voraussetzungen

Stelle vor dem Deployment sicher, dass du Folgendes hast:
  • Einen Avaluma-Lizenzschlüssel — erhältlich auf avaluma.ai
  • Eine oder mehrere .hvia-Avatar-Dateien, ausgestellt mit deiner Lizenz
  • Ein LiveKit-KontoLiveKit Cloud oder selbst gehostet
  • Eine NVIDIA-GPU mit CUDA-12-Unterstützung, OpenGL und mindestens 6 GB VRAM (jede gleichzeitige Avatar-Session benötigt ~2,5 GB)
  • Docker & Docker Compose auf deinem Server installiert
  • NVIDIA Container Toolkit installiert, damit Docker auf die GPU zugreifen kann
Der Avatar-Server läuft ausschließlich auf der GPU. Ein reiner CPU-Host wird nicht unterstützt. Getestete Architekturen sind Ampere, Ada Lovelace und Blackwell.

Dokumentation erkunden

Schnellstart

Setze Avatar-Server und LiveKit-Agent in wenigen Minuten auf und verbinde deinen ersten Client.

Architektur

Verstehe, wie Avatar-Server und LiveKit-Agent zusammenarbeiten, um deinen Avatar zu rendern und zu streamen.

Avatar-Server

Konfiguriere GPU-Ressourcen, verwalte .hvia-Dateien und richte einen HTTPS-Reverse-Proxy für die Produktion ein.

LiveKit-Agent

Passe die STT → LLM → TTS-Pipeline an und verbinde sie mit einem beliebigen LiveKit-Raum.