3秒生成30秒高品質音頻,讓AI音頻創作變得簡單而高效
from tangoflux import TangoFluxInference model = TangoFluxInference() audio = model.generate( "悅耳的鳥鳴與流水聲", duration=10 )
只需3-4秒即可生成長達30秒的高品質音頻,效率領先業界
44.1kHz高保真立體聲輸出,確保最佳聽覺體驗
提供網頁介面、命令列和Python API多種使用方式
TangoFlux 是一個基於深度學習的音頻生成工具,能夠將文本描述轉換為高質量的音頻內容。 它採用最新的AI技術,支援多種音訊類型的生成,是創作者的得力助手。
支援透過文字描述生成對應的音頻內容
可生成1-30秒不等的音訊片段
支援批次音訊生成,提升工作效率
採用優化的推理引擎,確保快速生成
支援Windows、Linux、MacOS等主要平台
提供 Python API 和命令列介面
運行 tangoflux-demo 啟動介面
tangoflux-demo
輸入聲音描述文字
設定所需音頻時長(1-30秒)
點擊生成按鈕獲得音頻
from tangoflux import TangoFluxInference model = TangoFluxInference( name='declare-lab/TangoFlux' ) audio = model.generate( '描述文字', steps=50, duration=10 )
通過 Python API,您可以輕鬆集成到自己的項目中
適合生成各類環境音、音效和自然聲音,特別擅長處理場景音效、氛圍音樂和環境聲音的生成。
在標準配置下,生成30秒的音頻僅需約3.7秒,是目前市面上最快的AI音頻生成工具之一。