原神语音合成

原神语音合成工具可将任意文本转换为原神角色风格的配音，基于角色参考音频通过 AI 克隆音色，输入台词即可生成可播放、可下载的音频文件。每次合成费用按文本字符数计算，单次最多支持 2000 个字符。

角色音色与语言参考

不同角色提供不同语言的参考音频：自动、中文、英语、日语、韩语。选择"自动"时系统会匹配该角色当前可用的语言；若某角色缺少所选语言的参考音频，提交前会收到提示。生成一般需要 20–60 秒，期间页面保持等待状态。

标点完整的单句或短段落
1000 字符以内语调更自然
明确的情绪上下文有助于表现力

支持最多 2000 字符
建议在自然段落处换行分次生成
可用语气描述控制整体语速节奏

语气描述的作用

语气描述是可选字段，最多 500 字符，用于传递情绪、语速或说话风格，例如"语速稍慢，语气温柔"或"冷漠、低沉、稍带疲惫"。该字段内容不会出现在音频中，仅影响生成音色的表现方式。不填时模型依据文本自行判断语气。

历史记录与结果

提交后在当前页面等待即可，合成完成后音频直接展示在页面上，可试听并下载。最近 7 天内的生成记录保存在历史面板中，包含角色名称、语言、字符数和积分消耗。

提示词写法建议

台词中保留完整标点，停顿与语调更准确
避免在单次文本中混合过多语种（如中英夹杂），可能影响音色还原度
角色名、地名等专有名词建议用角色原始语言书写
超长文本建议按对话段落切分，分批生成后拼接