请先登录后使用该工具
该工具可能会消耗积分,请先登录后继续使用。

原神语音合成

概述

原神语音合成工具可将任意文本转换为原神角色风格的配音,基于角色参考音频通过 AI 克隆音色,输入台词即可生成可播放、可下载的音频文件。每次合成费用按文本字符数计算,单次最多支持 2000 个字符。

角色音色与语言参考

不同角色提供不同语言的参考音频:自动、中文、英语、日语、韩语。选择"自动"时系统会匹配该角色当前可用的语言;若某角色缺少所选语言的参考音频,提交前会收到提示。生成一般需要 20–60 秒,期间页面保持等待状态。

适合短句台词

  • 标点完整的单句或短段落
  • 1000 字符以内语调更自然
  • 明确的情绪上下文有助于表现力

适合长段叙述

  • 支持最多 2000 字符
  • 建议在自然段落处换行分次生成
  • 可用语气描述控制整体语速节奏

语气描述的作用

语气描述是可选字段,最多 500 字符,用于传递情绪、语速或说话风格,例如"语速稍慢,语气温柔"或"冷漠、低沉、稍带疲惫"。该字段内容不会出现在音频中,仅影响生成音色的表现方式。不填时模型依据文本自行判断语气。

历史记录与结果

提交后在当前页面等待即可,合成完成后音频直接展示在页面上,可试听并下载。最近 7 天内的生成记录保存在历史面板中,包含角色名称、语言、字符数和积分消耗。

提示词写法建议

  • 台词中保留完整标点,停顿与语调更准确
  • 避免在单次文本中混合过多语种(如中英夹杂),可能影响音色还原度
  • 角色名、地名等专有名词建议用角色原始语言书写
  • 超长文本建议按对话段落切分,分批生成后拼接