桌上语音工作室(MiniSpeechLab)功能简介
桌上语音工作室(MiniSpeechLab)是为南开大学中文系语音学实验室为国内语音专业工作者(语音方面的有关教师、研究人员等)开发的语音分析研究软件。除常见的各种分析功能外,结合汉语特点,特别着重声调、语调的分析,这方面的一些功能是国外系统没有的。下面介绍其部分功能。
n 录音或调入语音文件后,软件立即求出一屏语音的音高,并显示音强、音高和波形。由之可以方便地求出任意语音断面的音强、音高和任一段语音的音长。
语音波形图
(可以随意增、减幅度,可以纵向扩展、收缩)
n 软件可以把录入的语音数据存为文件(.wav )格式;可以对任选的一段语音进行放音或倒放(从后向前放音)。
宽带语图和共振峰轨迹
断面的语音参数
立体显示的三维语图如连绵起伏的山脉
n 基频统计和声调格局:软件可以对音高数据进行统计分析,得出声调、语调研究所需的各种数据、声调格局图和双字组、三字组,四字组的调型格局图。对方言调查研究有特别的意义。如:
单字音声调格局(北京话) 双字组调型格局(去声+去声)
三字组调型格局(上声+上声+上声)
四字组调型格局(阴平+阳平+上声+去声)
自动生成以下数据文件(可显示、复制、打印):
苏州第
1 组(单字组)
平均值(赫兹)283 285
286 286
286 288
289 285
280
声调T值
3.6 3.6
3.7 3.7
3.7 3.7
3.7 3.6
3.5
标准差(赫兹)9.3
9.7 9.8
8.4 8.4
10.0 12.1
11.3 9.3
第
2 组(单字组)
平均值(赫兹)276
277 279
281 282
282 282
278 275
声调T值
3.4 3.4
3.5 3.5
3.6 3.6
3.6 3.5
3.4
标准差(赫兹)14.2
14.0 14.3
10.5 10.8
9.6 10.2
11.2 14.3
…………
n 抗噪音的基频提取:提取音高时,如有较强的背景噪音或对轻声情况,各种系统往往都不能正确提取音高包络曲线。本软件借助频域音高谱图或窄带谱图,通过人机交互,可以在很困难的情况下正确地提取音高。还可以把已提取的音高数据保存到文件中。如:
上面是在剧场录制的京韵大鼓唱段,噪音极大,且有乐器伴奏(下图中的水平线),一般方法不能提取音调曲线。下面是用窄带语图为参照求出的演员演唱的基频曲线。
n 语音波形编辑:可以对语音数据进行剪切、复制、粘贴、增强、减弱等各种编辑操作,使语音数据符合用户的要求(图略)。
n 音长统计:本软件可以对选定的语音段进行音长分析和统计,如可以用来求各辅音的平均长度、研究语句中各种音节的长度分布规律等。
自动生成数据文件示例:
音长统计数据
第1组:组名:t
数据(ms): 86.8 136.6 123.7 120.7 156.6 147.1
平均值= 128.6ms, 标准差= 22.4ms
第2组:组名:x
数据(ms): 145.6 164.6 161.6 212.5 172.6 186.5 145.6
平均值= 169.9ms, 标准差= 22.0ms
……
上图为各组平均长度的图示
n 声学元音图:既可以画一段语音的元音图,也可以画选定语音断面的元音图。
一段语音(ai)的声学元音图
几个选定点的声学元音图
(可见从
a 到
i 的转移)
(分别是元音a,
i, u )
n
图形的复制和打印:可以选择软件窗口中任意矩形部分进行图形复制(到剪贴板),然后可以粘贴到word
等文字处理软件的文档中去。这样便于把所需的图形插入到文章中去。也可以直接进行打印。
n 国际音标:本软件已将汉语所使用的国际音标都录为数据文件(由周殿福发音,取自语文出版社出版的录音带,已得到版权许可),可以随意调入所需的国际音标发音,进行放音,分析等各种操作。
调入国际音标文件后的波形—注音显示
n动态腭位分析:与中国社会科学院民族研究所合作,提供普通话的电子腭位数据库。打开腭位数据文件后,可以显示波形--语谱--腭位图,也可以显示连续的15幅腭位图。
波形--语谱--腭位图
n 按给定音高进行放音:可以对选择的一段语音,按鼠标左键从左到右设置的音高值(只浊音部分有效)进行合成放音。这样可以按需要改变一段语音的音高。如下图所示:
改变一段语音的音高