首页 > 技术 > ML/机器学习

语音识别系统主要包含哪四大部分

人阅读 2024-04-25 08:23:11

在这篇文章中,小编将为大家带来语音识别系统的相关报道。如果你对本文即将要讲解的内容存在一定兴趣,不妨继续往下阅读哦。

一、语音识别系统主要包含哪四大部分

1.特征提取和信号处理

在科学和工程中,遇到的大多数信号都是连续的模拟信号,而计算机只能处理离散的信号,因此,必须对这些连续的模拟信号进行转化,通过采样和量化,转化成数字信号。

2.声学模型(Acoustic Model)

声学模型是语音识别系统中最为重要的部分之一,主流系统多采用隐马尔科夫模型进行建模。 隐马尔可夫模型的概念是一个离散时域有限状态自动机,隐马尔可夫模型HMM是指这一马尔可夫模型的内部状态外界不可见,外界只能看到各个时刻的输出值。

对语音识别系统,输出值通常就是从各个帧计算而得的声学特征。用HMM刻画语音信号需作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态(或当前的状态转移)有关,这两个假设大大降低了模型的复杂度。HMM的打分、解码和训练相应的算法是前向算法、Viterbi算法和前向后向算法。

3.语言模型(Language Model)

语言模型用来表示词序列出现的可能性,用文本数据训练而成,是语音识别系统重要的组成部分

基于规则的语言模型,其数据的主要来源是人类社会中语言学家掌握的语言学知识和领域知识,以及特定语法规则的约束下,受限领域内的句子。

统计语言模型,通过对大量文本语料进行处理,获取给定词序列的概率分布,客观描述隐含的规律,适合于处理大规模真实文本。

4.解码搜索

解码器是将语音中的信息解码识别并输出的一个关键结构。针对输入的语音信号,根据己经训练好的声学模型、语言模型及字典建立一个识别网络, 使用搜索算法在该网络中寻找最佳的一条路径 ,输出最大概率的情况下的文字。

二、语音识别系统有哪些功能特点

对比语音识别技术的两个发展方向,由于基于不同的运算平台,因此具有不同的特点。大词汇量连续语音识别系统一般都是基于PC机平台,而语音识别专用芯片的中心运算处理器则只是一片低功耗、低价位的智能芯片,与一台甚至多台PC机相比起来,其运算速度,存储容量都非常有限,因而这些由专用芯片实现的语音识别系统有如下几个特点:

1、多为中、小词汇量的语音识别系统,即只能够识别10~100词条。只有近一两年来,才有连续数码或连续字母语音识别专用芯片实现。

2、一般仅限于特定人语音识别的实现,即需要让使用者对所识别的词条先进行学习或训练这一类识别功能对语种、方言和词条没有限制。有的芯片也能够实现非特定人语音识别,即预先将所要识别的语句码本训练好而装入芯片,用户使用时不需要再进行学习而直接应用。但这一类识别功能只适用于规定的语种和方言,而且所识别的语句只限于预先已训练好的语句。

3、由此芯片组成一个完整的语音识别系统。因此,除了语音识别功能以外,为了有一个好的人机界面和识别正确与否的验证,该系统还必须具备语音提示(语音合成)及语音回放(语音编解码记录)功能。

4、多为实时系统,即当用户说完待识别的词条后,系统立即完成识别功能并有所回应,这就对电路的运算速度有较高的要求。

5、除了要求有尽可能好的识别性能外,还要求体积尽可能小、可靠性高、耗电省、价钱低等特点。

以上便是小编此次想要和大家共同分享的有关语音识别系统的内容,如果你对本文内容感到满意,不妨持续关注我们网站哟。最后,十分感谢大家的阅读,have a nice day!

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com