小智AI修改提示音P3文件(如开机和配网播报)
1、把音频转为指定采样率
可以使用以下 ffmpeg 命令将自己的WAV 文件转换为 16000 采样率,并将采样深度设置为 32 位:
bash
ffmpeg -i input.wav -ar 16000 -acodec pcm_s32le output.wav
参数说明:
- -i input.wav:输入文件。
- -ar 16000:指定输出的采样率为 16000 Hz。
- -acodec pcm_s32le:指定输出的音频编码格式为 32-bit 小端 PCM(Linear PCM)。
- output.wav:输出文件名。
如果需要更高质量的重采样:
你可以加上 -filter:a
选项使用 aresample
滤波器,指定重采样算法的质量:
bash
ffmpeg -i input.wav -ar 16000 -acodec pcm_s32le -filter:a "aresample=resampler=soxr" output.wav
这样会使用 soxr 高质量重采样算法。
2、把wav转为P3文件
把虾哥源码目录的convert_audio_to_p3.py文件复制到音频文件所在目录,
运行以下命令:
pip install librosa opuslib tqdm numpy
运行以下命令:
python .\convert_audio_to_p3.py output.wav output.p3
把输出的p3文件放到 xiaozhi-esp32\main\assets\zh-CN 目录下,重新编译即可在 lang_config.h 里看到自己的音频
3、如何调用P3文件
举个例子,如果我想改动配网的提示音,找到 WIFICONFIG
把他改成自己的,我的是 WOZAI
重新编译下载即可