地铁车厢广播语音自动识别显示器

   2006-04-29 中国路桥网 佚名 5940
地铁车厢乘车站名动态显示的设计和应用摘要: 介绍一种基于专用的语音识别芯片HM2007,应用于地铁车厢内乘车站名动态显示系统,在车辆不作任何改动的基础上实现车厢内广播报站与站名显示器的同步。关键词: 语音识别 地铁车厢广播 车站名动态显示1.概述 语音识别技术成为当代数字时代的重要开发领域,在计算机应用、多媒体技术应用和远程工业自动化控制应用等等,成果令人属目。语音识别技术简单说是指用电子装置来识别某些人的某些特征语音,以实现自动化控制,“君子动口,不动手”。语音识别的手段一般分为二大类,一类利用在PC机或微型计算机上开发语音识别系统,通过编程软件达到对语音的识别,另一类采用专门的语音识别芯片来进行简单的语音识别。前者对软件、硬件要求高、体积大、费用高,通常应用在识别容量很大的、复杂的系统。后者硬件体积小、价格便宜、使用非常方便,但识别容量比较小,它是简单语音识别在自动控制应用中的一种优先方案。语音识别芯片又分为SI和SD二种,SI(Speaker Independent,与说话人无关)及 SD(Speaker Dependent,与说话人有关)的语音识别功能,SI可利用单片机实现多人的识别,而SD为单独人的识别,它具有保密性。语音识别芯片的型号目前也比较多,如:OKI公司的MSM6679A-110、TOSHIBA公司的TC6658、台湾HMC公司的HM2007等,它们在应用上各有特点。根据本项目的设计要求,采用台湾HMC公司的HM2007语音识别芯片。 2. HM2007的性能特点 HM2007是CMOS语音识别大规模集成电路,外接64K非易失性SRAM,能识别40个字组的语音(0.9秒字长),或1.92秒字长,但识别仅20个字组的语音。按正常人的讲话速度,一般每秒吐字2到4个,如选择0.9秒,那么每字长的汉字以1到3为宜。控制方法通过键盘手工操作或CPU自动控制,可以开发成 SD和SI,识别响应时间小于300 ms。芯片采用单片结构,将语音识别需要的全部电路:CPU、A/D、ROM、语音的AMP放大器、压缩器、滤波器、震荡器和接口界面等集中在一片芯片内,这样外围电路就非常少,如图一。略 其中: MIC IN为语音输入端 DATA OUT为数据输出端HM2007语音识别的过程是以模型为单元进行识别的,首先通过输入放置语音的地址号,将语音录入到SRAM中,便在系统中建立了特定的语音样本(模型),然后进行识别样本、分析。当有语音输入时,它与预存的模型进行比较,如果比较匹配相同,其输出不同相应的数据编码(八位),如:D1、D2、D3、 D4、 D5、 D6、 D7、 D8,其中前四位的数字为十位数显示从0到4、后四位的数字为个位数显示从0到9,如果识别结果是01010101编码(十进制:55),表示语音太长;如果识别结果是01100110编码(十进制:66),表示语音太短;如果识别结果是01110111编码(十进制:77),表示语音不匹配。所有录音的语音样本内容存放在SRAM中,数据可在断电情况下永久保存10年以上。 HM2007的技术参数:工作电压4----5.5V,工作电流1.5mA,工作温度 -20-----+70度,正常的语音输入电压:20mV。3. 设计和应用 项目主要针对目前上海地铁列车在车厢内无LED动态站名显示而设计,通过将列车车厢广播的模拟信号转换成数字信号,自动控制LED发光二极管,使得广播的内容(每个车站站名)与发光二极管显示面板声光同步,将显示面板放置地铁车辆的每扇车门上方,并且显示面板以地铁运营线路为背景,列车进站和出站时能分别指示,让乘客非常直观地、一目了然地随时了解车辆在运行时自己所乘的位置,从而方便乘客的上下车,提高了地铁服务水平。在国外的地铁列车上应用已相当普遍。 通过对语音模板多次试验和分析,发现按图一所设计的语音识别芯片及附件组成的电路在实际生活的应用中,其识别效果不够理想,因为人的发音随人的身体状况和周围的环境变化,其前后的发音有一定的区别,故在模型匹配上有一定难度。所以在家庭、玩具、通信和工业自动控制领域,难以推广的主要原因。然而应用在本项目中,其效果特别好,通过增加特殊的硬件电路,设计成的样品,经试验识别率高达到100%左右。因为地铁车厢内的广播的内容具有规律性,内容和音量具有恒定不变的特点。 LED站名显示用HM2007语言识别芯片和特殊电路设计而成,具有独特性和创造性,能达到简单的语言识别,语音识别显示器的输入端间接地与车载广播功放器相连接(采用变压器或光电结合器),实施广播模拟信号发出的语音进行车站名的自动识别。区别以前所设计的利用交流载波原理控制LED显示、复杂的编程技术等方法。 语音识别器组成:(1)输入控制部分(2)噪音滤波部分(3)语言识别部分(4)执行显示部分。(1)输入控制部分: 通过结合器连接,如图二所示,要求模拟语音输入A点的电压必须控制在大约20mv左右,以确保后期语音识别的正确性。在输入电路中增加了RC微分电路和延时电路,即将模拟信号转变成数字方波信号,对语音输入进行开关量的控制,确保在 T<0.9秒内的正确输入语音字长。图中K为微型继电器。(2)语音识别部分: 利用语音识别芯片HM2007和外接6264SRAM存储器组成为主要部分,(HM2007中ROM已经固化了语音语法技术)对语音的存储及语音语法算法进行控制。附加电路:扫描键盘电路3*4键盘12个(其中0------9为地址号码数字键,TRN为录音键,CLR为清除键)、地址显示采用二片数码管和数据锁存器74LS373、74LS47。HM2007的详细内容见产品说明书,图三。(3)噪音滤波部分: 功能是自动识别(阻挡)无用的语音,例如:司机的讲话及杂音等,确保输入语音的可靠性、稳定性,因为目前地铁车辆广播报站内容在车站与车站之间(区间)有二次广播。在建立模型时,我们将第一次的广播语音内容放在第77地址内,第二次的广播语音内容放在第01到40之间的地址内(如果车站有40个),而我们只要识别其中第二次的一段语音,如:“衡山路车站到了,乘客可以下车······”,就是“衡山路”三个字长度。为了能滤波55、66、77地址号码,(其中:55、66在实际使用中不会产生)正确显示01到40之间地址内的内容,特采用C031与门和UM3758串行编译器进行滤波电路。如图四:(4)执行显示部分: 将车厢广播喇叭的模拟信息通过语音识别器转变成数字信息,最终经过译码电路、多路数据选择器CD4514及RS485接口,去控制车厢内车门上十个LED显示面板。在进行广播内容更改时,本项目最大的特点是:不需要任何手段的手工软件编程的修改,而是通过远程电路控制技术进行按顺序自动录音地址和内容。如图五:利用滤波电路和脉冲键控多谐荡器电路实现远程集中输入录音功能。远程输入电路由与门电路、RC微分电路、延时电路和编码电路组成,输入IN来自与门电路C031的控制线,输出OUT到键盘3*4,模拟二次地址编码号码的输入,达到自动录音功能。4. 结论 语音识别器及LED显示面板的样品设计和初试,符合设计要求,完全能应用到以前没有LED显示面功能的地铁车辆上,与其他所设计的方式相比较,如:无线RF、红外线和磁性控制,语音识别控制简单、可靠性好、安装方便、相对投资最小和不改动车厢内任何电器,仅提供110VDC和音频接口线。其缺点:一但音频线路发生故障,既语音识别器就无法工作。 本项目的开发具有一定社会效益,能得到国内外乘客、残疾人员的欢迎,提高了地铁服务质量。参考文献:1. HUALON MICRELECTRONICS CORPORATION TIWAN PRODUCT NUMBER: HM20072. 中国集成电路大全 COMS集成电路 国防工业出版社
 
举报收藏 0打赏 0评论 0
 
更多>同类论文
推荐图文
推荐论文
点击排行

网站首页  |  隐私政策  |  版权隐私  |  使用协议  |  联系方式  |  关于我们  |  网站地图  |  排名推广  |  广告服务  |  网站留言  |  RSS订阅  |  违规举报

津ICP备20006083号-1

津公网安备 12010502100290号