MiniMax Text-to-Speech API 踩坑记录
问题
调用 MiniMax TTS API 时,返回的音频数据无法正常播放。
原因
MiniMax TTS API 返回的音频数据采用 hex(十六进制)编码,而不是常见的 base64 编码。
API 响应结构:
{
"data": {
"audio": "4944330400000000086a54..."
}
}
49443304 是 ID3 的十六进制表示,这是 MP3 文件头的标识。如果误用 base64 解码,会得到乱码,导致音频文件无法播放。
解决
将 hex 字符串转换为 Buffer:
const audioBuffer = Buffer.from(audioHex, "hex");
修复后的代码
const audioHex = result.data.audio || result.data.audio_file!;
const audioBuffer = Buffer.from(audioHex, "hex");
其他注意事项
- 成功响应没有
code字段:API 请求成功时不返回code字段,只有失败时才返回。因此检查逻辑应为if (result.code && result.code !== 0) - 环境变量:需要设置
MINIMAX_API_KEY
Description
Languages
TypeScript
100%