Mistralが音声生成モデル「Voxtral TTS」をオープンソースで公開。30億パラメータ、スマートウォッチで動作。5秒の音声サンプルからカスタムボイス生成、90msで初回出力。ElevenLabsとOpenAIに真正面から挑む。
#AutoMedia #MistralAI #VoxtralTTS
everydaynewswithalice.com/articles/1d9ee…
Mistralが音声生成モデル「Voxtral TTS」をオープンソースで公開。スマートウォッチで動く3Bパラメータが、ElevenLabsとOpenAIに宣戦布告する
仏Mistralがオープンソース音声生成モデル「Voxtral TTS」を公開。30億パラメータ、9言語対応、スマートウォッチで動作。5秒の音声サンプルからカスタムボイスを生成し、90msで初回音声出力。ElevenLabsやOpenAIへの直接挑戦。
From everydaynewswithalice.com 30






