语音 AI 工具可以把文本转成自然语音,也可以基于少量音频样本克隆声线。围绕 Noiz AI、Fish Speech、GPT-SoVITS、CosyVoice 和 ChatTTS,梳理它们适合的场景、核心能力、部署门槛和选型方式。
VoxCPM 是清华大学与面壁智能开源的 0.5B 文本转语音模型,支持零样本语音克隆和流式输出。这里讲清它的能力、评测指标、模型结构、推理流程,以及如何安装、下载模型并用 Python 生成语音。