Irodori-TTS-500M-v2-VoiceDesign Demo

Caption-conditioned Japanese TTS model based on rectified flow over DACVAE latents.

Text

Caption / Style Prompt (optional)

Num Steps

1 120

Num Candidates

1 32

Seed (blank=random)

CFG Guidance Mode

CFG Scale Text

0 10

CFG Scale Caption

0 10

Generated Audio 1

Run Log