xRecorder:语音语料库录制工具

作者:熊子瑜
脚本ID:Tools.XZY20211116.001
更新时间:2021年11月16日

语音语料库录制工具 xRecorder 程序由熊子瑜设计开发,属于 xSpeechTools 工具的一个子程序,主要面向语音语料库建设中的录音任务,支持 wav 格式的音频文件录制、播放与声学参数分析显示。主要功能包括:

(1)程序支持用户自由定制发音文本内容及其声音文件名(可使用多层级相对路径),基本能够满足有发音底稿的语音库录制需求,特别适用于字、词、句材料的大规模录音任务。

(2)程序可按照固定或随机的顺序逐条显示发音文本,并按照用户设定的路径和文件名自动保存录制好的声音文件(*.wav)及其相应的发音文本内容(*.txt)。

(3)程序支持用户逐条设置各类发音提示,如提示文本、提示声音(*.wav)或提示图片(*.jpg)等。

(4)程序可检测全局最大振幅和首尾段的最大振幅,全局最大振幅如果大于或小于设定的阈值则会自动报错并强制重新录音,首尾段的最大振幅如果大于设定的阈值则会自动报错并强制重新录音,可有效避免振幅过大或过弱,还可避免非正常截断等类型的错误数据。

(5)程序可实时显示波形图和宽带语图,有利于用户掌控发音进程,还可以缩放显示波形图和语图,并可以分析选定段的音高数据。

(6)程序支持用户对发音文本内容的编辑修改和自动保存。

(7)程序支持用户截取保存声音片段,或剪切掉噪声段数据,对声音进行整理。

(8)每次重启程序,会自动定位至第一个未录制的条目,以避免出现条目遗漏。

查看详情