KittenTTS: Ультралёгкая модель преобразования текста в речь для любого устройства

Изображение для сервиса KittenTTS номер один

KittenTTS — это ультралёгкая открытая модель преобразования текста в речь, способная превращать написанный текст в естественно звучащий голос с впечатляющим качеством, при этом требуя минимальных вычислительных ресурсов. В отличие от большинства моделей ИИ, которые требуют мощного оборудования, KittenTTS успешно работает на почти любом устройстве — от старых компьютеров и Raspberry Pi до браузеров, благодаря своему крошечному размеру в 25 МБ и 15 миллионам параметров. Модель предоставляет несколько реалистичных голосов в реальном времени без необходимости в интернет-соединении или GPU, что делает её идеальной для разработчиков, создающих приложения с акцентом на конфиденциальность, проекты по обработке данных на краю сети, инструменты доступности или любые случаи, где важна эффективность ресурсов. С комбинацией высококачественного вывода, выдающейся скорости работы на системах лишь с ЦП и открытой лицензией Apache 2.0, KittenTTS представляет собой настоящий прорыв в области применения голосового ИИ в условиях ограниченных ресурсов, где использование более крупных моделей просто невозможно.