Официальный сайт сервиса
Whisper - это система автоматического распознавания речи с открытым исходным кодом, обученная на 680 000 часов многоязычных и мультитасковых данных, собранных из сети. Она разработана для того, чтобы быть устойчивой к акцентам, фоновому шуму и технической лексике, и может транскрибировать и переводить речь на нескольких языках на английский. Это простой подход end-to-end, реализованный в виде энкодер-декодер трансформера. Кроме того, она способна выполнять идентификацию языка и временные метки на уровне фразы. Она разработана таким образом, чтобы быть простой в использовании и обладать высокой точностью, что позволяет разработчикам добавлять голосовые интерфейсы в более множество приложений.