TangoFlux - 將文字轉化為
逼真的聲音體驗

3秒生成30秒高品質音頻,讓AI音頻創作變得簡單而高效

from tangoflux import TangoFluxInference

model = TangoFluxInference()
audio = model.generate(
  "悅耳的鳥鳴與流水聲",
  duration=10
)
                          

特色功能

超快生成速度

只需3-4秒即可生成長達30秒的高品質音頻,效率領先業界

卓越音質

44.1kHz高保真立體聲輸出,確保最佳聽覺體驗

簡單易用

提供網頁介面、命令列和Python API多種使用方式

工具介紹

TangoFlux 是一個基於深度學習的音頻生成工具,能夠將文本描述轉換為高質量的音頻內容。 它採用最新的AI技術,支援多種音訊類型的生成,是創作者的得力助手。

核心功能

  • 文本到音訊轉換

    支援透過文字描述生成對應的音頻內容

  • 自訂時長控制

    可生成1-30秒不等的音訊片段

  • 批量處理能力

    支援批次音訊生成,提升工作效率

技術特點

  • 高效能推理

    採用優化的推理引擎,確保快速生成

  • 多平台支援

    支援Windows、Linux、MacOS等主要平台

  • 靈活介面設計

    提供 Python API 和命令列介面

如何使用

網頁介面

  1. 1

    運行 tangoflux-demo 啟動介面

  2. 2

    輸入聲音描述文字

  3. 3

    設定所需音頻時長(1-30秒)

  4. 4

    點擊生成按鈕獲得音頻

代碼調用

from tangoflux import TangoFluxInference

model = TangoFluxInference(
  name='declare-lab/TangoFlux'
)

audio = model.generate(
  '描述文字',
  steps=50,
  duration=10
)

通過 Python API,您可以輕鬆集成到自己的項目中

開始使用

常見問題