`elevenlabs` capabilities

11 mapped capabilities, each graded and dated. This is the diagnosis — the migration guide is the cure.

AI Dubbing

provisionalverified 2 days ago

Translates and re-voices audio or video content into 90+ languages, preserving speaker identity. Offers automatic dubbing (Dubbing v2) and manual Dubbing Studio for fine-grained editing.

medium confidence · 0.70docssource ↗source ↗

AI Music Generation

provisionalverified 2 days ago

Generates original songs with vocals and instrumentals from text prompts using the Music v2 model. Supports genre, mood, and structural customization including mid-track transitions.

medium confidence · 0.75docssource ↗source ↗

AI Sound Effects Generation

provisionalverified 2 days ago

Generates custom royalty-free sound effects and ambient audio from text prompts using a dedicated AI model. Returns multiple distinct samples per generation.

medium confidence · 0.75docssource ↗source ↗

Conversational AI Agents (ElevenAgents)

provisionalverified 2 days ago

Platform for building and deploying real-time voice and chat agents that combine speech recognition, configurable LLMs, and low-latency TTS. Formerly called Conversational AI.

medium confidence · 0.75docssource ↗source ↗

Developer API and SDKs

provisionalverified 2 days ago

REST API exposing all ElevenLabs capabilities (TTS, STT, voice cloning, sound effects, music, dubbing, voice agents, speech-to-speech) with official SDKs for Python, TypeScript/JavaScript, Flutter, Swift, and Kotlin.

medium confidence · 0.75docssource ↗source ↗

Pricing Plans and Commercial Rights

provisionalverified 2 days ago

Six self-serve subscription tiers plus Enterprise, governing monthly credit allowances, commercial use rights, voice clone slots, audio quality, and workspace seats.

medium confidence · 0.70docssource ↗

Speech-to-Text (Scribe)

provisionalverified 2 days ago

AI transcription system (Scribe) converting audio and video to text with speaker diarization, word-level timestamps, and non-speech event tagging across 90+ languages.

medium confidence · 0.75docssource ↗source ↗

Studio (Long-Form Audio/Video Editor)

provisionalverified 2 days ago

Timeline-based end-to-end production environment for creating audiobooks, narrated videos, and long-form audio with AI voice, music, sound effects, and captions.

medium confidence · 0.75docssource ↗source ↗

Text-to-Speech

provisionalverified 2 days ago

Converts text into lifelike, emotionally expressive speech using multiple AI models. Supports multilingual synthesis, inline audio tags for emotion and delivery control, and real-time streaming.

medium confidence · 0.75docssource ↗source ↗

Voice Cloning

provisionalverified 2 days ago

Replicates a speaker's voice from audio samples using two tiers: Instant Voice Cloning (IVC) for rapid prototyping from short samples, and Professional Voice Cloning (PVC) for near-indistinguishable results via fine-tuned model training.

medium confidence · 0.75docssource ↗source ↗

Voice Library

provisionalverified 2 days ago

Community marketplace of 10,000+ Professional Voice Clones shared by creators, with built-in commercial licensing and a creator payout program.

medium confidence · 0.75docssource ↗source ↗

Capabilities

AI Dubbing

AI Music Generation

AI Sound Effects Generation

Conversational AI Agents (ElevenAgents)

Developer API and SDKs

Pricing Plans and Commercial Rights

Speech-to-Text (Scribe)

Studio (Long-Form Audio/Video Editor)

Text-to-Speech

Voice Cloning

Voice Library