Qwen3-TTS语音生成模型全家桶开源上线。该模型包含1.7B和0.6

首席线官 2026-01-23 10:21:09

Qwen3-TTS 语音生成模型全家桶开源上线。该模型包含 1.7B 和 0.6B 两种尺寸,支持10种主流语言及方言音色,具备音色克隆、创造与控制能力,端到端合成延迟低至 97ms,首包音频仅需等待一个字符。已在 GitHub、ModelScope 等平台开源。人工智能308_IO

0 阅读:0
首席线官

首席线官

感谢大家的关注