Kokoro

Kokoro is an open-weight text-to-speech model with 82 million parameters, optimized for fast inference on both CPU and GPU, generating speech in roughly 100 milliseconds. It supports 8 languages and delivers high-quality, natural-sounding output.

Visit on GitHub ↗ hexgrad/kokoro

GitHub repository github.com/hexgrad/kokoro

Stars 7,212

Category Voice & Multimodal

More in Voice & Multimodal