TangoFlux - 将文字转化为
逼真的声音体验

3秒生成30秒高品质音频,让AI音频创作变得简单而高效

from tangoflux import TangoFluxInference

model = TangoFluxInference()
audio = model.generate(
  "悦耳的鸟鸣与流水声",
  duration=10
)
                          

特色功能

超快生成速度

仅需3-4秒即可生成长达30秒的高品质音频,效率领先业界

卓越音质

44.1kHz高保真立体声输出,确保最佳听觉体验

简单易用

提供网页界面、命令行和Python API多种使用方式

工具介绍

TangoFlux 是一个基于深度学习的音频生成工具,能够将文本描述转换为高质量的音频内容。 它采用最新的AI技术,支持多种音频类型的生成,是创作者的得力助手。

核心功能

  • 文本到音频转换

    支持通过文本描述生成对应的音频内容

  • 自定义时长控制

    可生成1-30秒不等的音频片段

  • 批量处理能力

    支持批量音频生成,提高工作效率

技术特点

  • 高性能推理

    采用优化的推理引擎,确保快速生成

  • 多平台支持

    支持Windows、Linux、MacOS等主流平台

  • 灵活接口设计

    提供Python API和命令行接口

如何使用

网页界面

  1. 1

    运行 tangoflux-demo 启动界面

  2. 2

    输入声音描述文本

  3. 3

    设置所需音频时长(1-30秒)

  4. 4

    点击生成按钮获得音频

代码调用

from tangoflux import TangoFluxInference

model = TangoFluxInference(
  name='declare-lab/TangoFlux'
)

audio = model.generate(
  '描述文本',
  steps=50,
  duration=10
)

通过Python API,您可以轻松集成到自己的项目中

开始使用

常见问题