3秒生成30秒高品质音频,让AI音频创作变得简单而高效
from tangoflux import TangoFluxInference model = TangoFluxInference() audio = model.generate( "悦耳的鸟鸣与流水声", duration=10 )
仅需3-4秒即可生成长达30秒的高品质音频,效率领先业界
44.1kHz高保真立体声输出,确保最佳听觉体验
提供网页界面、命令行和Python API多种使用方式
TangoFlux 是一个基于深度学习的音频生成工具,能够将文本描述转换为高质量的音频内容。 它采用最新的AI技术,支持多种音频类型的生成,是创作者的得力助手。
支持通过文本描述生成对应的音频内容
可生成1-30秒不等的音频片段
支持批量音频生成,提高工作效率
采用优化的推理引擎,确保快速生成
支持Windows、Linux、MacOS等主流平台
提供Python API和命令行接口
运行 tangoflux-demo 启动界面
tangoflux-demo
输入声音描述文本
设置所需音频时长(1-30秒)
点击生成按钮获得音频
from tangoflux import TangoFluxInference model = TangoFluxInference( name='declare-lab/TangoFlux' ) audio = model.generate( '描述文本', steps=50, duration=10 )
通过Python API,您可以轻松集成到自己的项目中
适合生成各类环境音、音效和自然声音,特别擅长处理场景音效、氛围音乐和环境声音的生成。
在标准配置下,生成30秒的音频仅需约3.7秒,是目前市面上最快的AI音频生成工具之一。