桌上语音工作室(MiniSpeechLab)功能简介

桌上语音工作室(MiniSpeechLab)是为南开大学中文系语音学实验室为国内语音专业工作者(语音方面的有关教师、研究人员等)开发的语音分析研究软件。除常见的各种分析功能外,结合汉语特点,特别着重声调、语调的分析,这方面的一些功能是国外系统没有的。下面介绍其部分功能。

n 录音或调入语音文件后,软件立即求出一屏语音的音高,并显示音强、音高和波形。由之可以方便地求出任意语音断面的音强、音高和任一段语音的音长。


  语音音强和声调语调(音高)曲线包络图

语音波形图

(可以随意增、减幅度,可以纵向扩展、收缩)

  n 软件可以把录入的语音数据存为文件(.wav )格式;可以对任选的一段语音进行放音或倒放(从后向前放音)。

 n 软件可以求出某一段语音的多种语谱图(包括宽带、窄带语图,LPC谱图,倒谱,同态谱图)和共振峰走向,如:

宽带语图和共振峰轨迹  

 

断面的语音参数

 

立体显示的三维语图如连绵起伏的山脉

 

 

  n 基频统计和声调格局:软件可以对音高数据进行统计分析,得出声调、语调研究所需的各种数据、声调格局图和双字组、三字组,四字组的调型格局图。对方言调查研究有特别的意义。如:

单字音声调格局(北京话)  双字组调型格局(去声+去声)


 
              三字组调型格局(上声+上声+上声)

                   

                      四字组调型格局(阴平+阳平+上声+去声)

   

自动生成以下数据文件(可显示、复制、打印):

苏州第 1 组(单字组)

                        平均值(赫兹)283   285   286   286   286   288   289   285   280

声调T     3.6    3.6   3.7   3.7    3.7    3.7   3.7    3.6   3.5

标准差(赫兹)9.3    9.7   9.8   8.4    8.4   10.0  12.1   11.3   9.3

2 组(单字组)

平均值(赫兹)276   277   279   281   282   282   282   278   275

声调T     3.4    3.4   3.5    3.5   3.6    3.6   3.6    3.5   3.4

标准差(赫兹)14.2  14.0  14.3   10.5  10.8    9.6  10.2  11.2   14.3

…………

 

  n 抗噪音的基频提取:提取音高时,如有较强的背景噪音或对轻声情况,各种系统往往都不能正确提取音高包络曲线。本软件借助频域音高谱图或窄带谱图,通过人机交互,可以在很困难的情况下正确地提取音高。还可以把已提取的音高数据保存到文件中。如:


 


    上面是在剧场录制的京韵大鼓唱段,噪音极大,且有乐器伴奏(下图中的水平线),一般方法不能提取音调曲线。下面是用窄带语图为参照求出的演员演唱的基频曲线。

n 语音波形编辑:可以对语音数据进行剪切、复制、粘贴、增强、减弱等各种编辑操作,使语音数据符合用户的要求(图略)。

 

n 音长统计:本软件可以对选定的语音段进行音长分析和统计,如可以用来求各辅音的平均长度、研究语句中各种音节的长度分布规律等。

 

自动生成数据文件示例:

         音长统计数据

          1组:组名:t

数据(ms)   86.8  136.6  123.7  120.7  156.6  147.1

平均值=  128.6ms,  标准差=  22.4ms

          2组:组名:x

数据(ms)  145.6  164.6  161.6  212.5  172.6  186.5  145.6

平均值=  169.9ms,  标准差=  22.0ms

……


                  图为各组平均长度的图示

 

n 声学元音图:既可以画一段语音的元音图,也可以画选定语音断面的元音图。


   

       一段语音(ai)的声学元音图              几个选定点的声学元音图

        (可见从 a i 的转移)               (分别是元音a, i, u )

 

n 图形的复制和打印:可以选择软件窗口中任意矩形部分进行图形复制(到剪贴板),然后可以粘贴到word 等文字处理软件的文档中去。这样便于把所需的图形插入到文章中去。也可以直接进行打印。

   

n 国际音标:本软件已将汉语所使用的国际音标都录为数据文件(由周殿福发音,取自语文出版社出版的录音带,已得到版权许可),可以随意调入所需的国际音标发音,进行放音,分析等各种操作。

 

调入国际音标文件后的波形注音显示


 

n动态腭位分析:与中国社会科学院民族研究所合作,提供普通话的电子腭位数据库。打开腭位数据文件后,可以显示波形--语谱--腭位图,也可以显示连续的15幅腭位图。

波形--语谱--腭位图


 

n 按给定音高进行放音:可以对选择的一段语音,按鼠标左键从左到右设置的音高值(只浊音部分有效)进行合成放音。这样可以按需要改变一段语音的音高。如下图所示:

改变一段语音的音高