xSegmenter:音段自动切分与标注工具

作者:熊子瑜
工具ID:Tools.XZY20211116.002
更新时间:2017年1月10日
简介: 音段自动切分与标注工具 xSegmenter程序由熊子瑜设计开发,属于 xSpeechTools 工具的一个子程序, 采用Perl脚本语言编写,主要面向较大规模的具有文字底稿的语音语料库建设,旨在解决音段标注的效率和一致性问题。该程序通过调用HTK工具,基于用户所提供的语料及相关资源训练生成HMM声学模型,然后进行音段强制对齐,最后针对每个声音文件转写生成相应的语音标注文件(*.TextGrid),包括文本层、词语层、音节层和音素层等标注内容。由于该工具自身不提供任何声学模型和词典,而是基于用户所提供的声音文件,带有分词信息的发音文本文件和发音词典文件等数据资源自动训练生成相应的语音声学模型,然后再利用所生成的语音声学模型去完成音段的自动切分和标注任务,因此这一工具可适用于任意语言和方言的语音库建设。

0001
自动切分与标注结果示例

查看详情