Voice To Image
语音 / 文字描述 -> 结构化提炼 -> AI 生成图片
语音录制
文字输入
上传音频
点击开始录音
点击选择音频文件 (WAV / MP3 / M4A / FLAC)
开始生成
路由
语音识别
内容检查
结构提炼
提示词
风格化
生成图片
等待生成结果...
识别 / 输入文本
-
结构化提炼
最终提示词
-
负面提示词
-