一、语音识别中隐马尔可夫模型状态数的选取原则及研究(论文文献综述)
刘开金[1](2021)在《基于混合模型的鲸鱼叫声识别》文中认为
吕星晨[2](2020)在《基于GM-HMM的驾驶疲劳检测研究》文中研究指明疲劳驾驶是产生交通事故的重要原因之一,若能对驾驶员进行驾驶疲劳检测并进行实时预警,可有效降低交通事故的发生率。在驾驶疲劳领域,国内外学者开展了广泛的研究,取得了一系列研究成果。其中,传统的基于时间片段的检测方法,没有考虑到疲劳的动态生成特性问题;基于动态决策模型的驾驶疲劳检测,其数据精细程度对模型检测准确性有不同影响。为此,本文以提高疲劳辨识准确率为目标,基于GM-HMM提出了一种驾驶疲劳检测方法,并对所构建的算法模型进行了有效性对比验证。基于本文的研究目标及思路,其主要工作内容包括:(1)驾驶员疲劳特征参数的优选及数据库构建通过相关的调研分析,疲劳驾驶时其生理信号会发生显着变化,因此选取EEG信号作为特征数据;为了获取脑电四种基本节律波,选取对高频和低频信号都有较高分辨率小波包变换对原始脑电数据进行处理,构建了多种能量比值。采用灰色关联分析法优选出三种指标,形成了最优特征指标集,完成了驾驶疲劳样本数据库的构建。(2)基于GM-HMM的驾驶疲劳检测模型构建为了提高模型的准确性,解决离散HMM将特征向量离散化带来的信息损失的问题,本文采用高斯混合模型对清醒特征指标和疲劳特征指标分别进行拟合,构建了清醒状态下GM-HMM模型和疲劳状态下GM-HMM模型,采用单因子方差分析法确定了驾驶疲劳检测时间窗长度。(3)模型的测试和对比分析为了对比GM-HMM在检测驾驶疲劳方面的有效性,本文建立了DHMM和逻辑回归模型。基于上述模型,从准确率、灵敏度、特异性三个评价函数进行评价,结合ROC曲线,对三种模型进行对比分析,结果表明,本文提出的GM-HMM,对驾驶疲劳动态生成具有良好的刻画能力,在数据量较大的情况下,GM-HMM优于离散HMM。本文通过对驾驶疲劳形成过程的特性分析,基于GM-HMM提出了一种驾驶疲劳检测方法。其中,所做的工作重点在于:结合驾驶疲劳的动态生成特性,基于GM-HMM方法构建疲劳检测模型并对模型中的相关重要参数进行合理界定,以提升利用HMM理论进行驾驶疲劳检测的准确性和可靠性。
徐志翔[3](2020)在《基于机器学习的非侵入式负荷监测技术研究》文中研究指明随着国家电网提出了建设泛在电力物联网的战略目标,用户内部设备的信息的感知和获取是提供智慧新业务的基础,而非侵入式负荷监测技术则是可以实现这一目的合适的智能感知方案。非侵入式负荷监测指的是将在用户总进线处获得的功耗聚合数据分解为各个电器设备运行功耗的技术。本文研究了两种不同类型的非侵入式负荷监测算法;基于事件的和基于状态的。针对于基于事件的非侵入式负荷监测算法的四个环节(事件检测、特征提取、负荷识别和能耗分解)提出了基于机器学习的不同的算法,并且都通过场景实验和公开数据集BLUED和ECO验证了算法的有效性。另外,本文还以隐马尔可夫模型为例研究了基于状态的非侵入式负荷监测,以探索两种不同类型方法的优劣势以及适用情况。整篇文章的工作具体由以下三部分组成。首先,本文针对基于事件的非侵入式负荷监测的事件检测环节提出了一种混合事件检测方法。它利用了多个不同方法的事件检测器以解决噪声对于事件检测的干扰。经过算例和实验分析,它比单一的事件检测方法在复杂的场景具有更好的检测效果。其次,在基于事件方法的负荷识别和能耗分解的环节中,本文分别提出了一种基于DBSCAN的无监督负荷识别方法和一种基于运行时间窗口的能耗分解方法。基于DBSCAN的无监督负荷识别方法在聚类的过程引入了对噪声的考虑,并将设备划分为周期型设备与用户驱动型设备。而基于运行时间窗口的能耗分解方法用以解决修复在能耗分解中被遗漏检测或是错误识别的事件产生不良影响。这两个算法的有效性都通过在公开数据集下得到了验证。最后,本文以隐马尔可夫模型为例,研究了基于状态的非侵入式负荷检测。通过实验,比较了它与基于事件的方法在不同采集频率下的监测效果,分析出它们分别适用的场景。
王宇琛[4](2019)在《噪声环境下连续语音识别技术研究》文中研究说明人工智能是目前最热门的科学研究领域之一,语音识别是人工智能的一个重要研究方向。随着科学技术的发展,连续语音识别技术已经取得了很大的进展。目前的连续语音识别系统,在实验室环境下,对纯净语音已达到很高的识别率,但在噪声环境下,识别率明显下降。在连续语音识别系统的实际应用中,噪声几乎是不可避免的,因此针对噪声环境下的连续语音识别技术研究显得尤为重要。本文从语音识别技术的理论基础出发,介绍了连续语音识别系统的各个组成部分,包括语音信号预处理、语音信号特征分析、连续语音切分、声学模型和语言模型等。最终实现了一个噪声环境下的中等词汇量汉语连续语音识别系统,并测试了该系统的性能。本文的主要研究内容如下:(1)语音信号特征分析。本文介绍了语音信号的预处理技术,包括以谱减法为主的语音增强技术,然后分析了语音信号在时域、频域和倒谱域的特征,提取了多种特征参数,着重研究了频域的语谱图特征和倒谱域的基音周期轨迹特征。(2)连续语音切分技术。连续语音的切分包含两个步骤,一是端点检测,二是语音段基元的切分。本文研究了基于时域特征参数的多阈值端点检测技术,然后在分析基音周期轨迹和语谱图的基础上,研究了一种具有一定抗噪性的汉语连续语音音节切分方法,实验表明该方法具有较高的准确率。(3)语音识别模型分析。连续语音识别系统分为两层,声学模型层和语言模型层,声学模型用于将语音信号识别为对应的音,本文研究了三种声学模型,分别是矢量量化模型、离散隐马尔科夫模型和连续隐马尔科夫模型,并通过实验对这三种模型的识别率和性能进行了对比分析,还研究了不同训练样本对连续隐马尔科夫模型识别率的影响。由于汉语广泛存在同音字现象,本文应用N元文法模型作为语言模型进行音-字的转换。最后,将声学模型与语言模型相结合,实现了一个完整的连续语音识别系统。
张辛宬[5](2019)在《基于隐马尔科夫模型及反向传播神经网络的音效素材分类》文中提出随着多媒体技术发展和计算机运算效率提高,多媒体信息数据呈现快速增长的趋势。目前在国内广播电影电视行业的音效剪辑仅依靠人工听辨音效素材,由于素材声源混杂,且具有丰富语义及听觉特性,要从海量的音效素材中找到目标文件耗时且低效,因此迫切需要一个音效素材自动分类系统。本研究首次在广播电影电视行业内部应用机器学习方法对音效素材的自动分类进行探索,通过对音效素材提取特征参数建立标准数据集,采用不同的算法对于数据集学习训练并建立了基于反向传播神经网络的音效分类原型系统。研究核心为音频数据的相似度匹配算法以及音频数据的标注处理。主要工作及研究成果如下:1、实验对4074个音频文件分别提取了短时能量、短时平均过零率以及梅尔频率倒谱系数及其差分这三类特征参数,根据不同类型算法建立了相应标准数据样本集。2、分别构建隐马尔科夫模型和反向传播神经网络模型对样本进行训练识别得到分类准确率并分别测试模型的性能;对两种算法及相关研究从算法结构、训练时间和识别率进行扩展讨论。结果表明:对于含有复杂声音来源且有较多易混淆元素的音效素材进行分类,反向传播神经网络训练方法更易实现效果,平均识别率接近90%左右。3、建立基于反向传播神经网络的音效分类原型系统,以便于今后音频工作者使用。
伍宏伟[6](2019)在《基于隐马尔可夫模型的交通流预测研究》文中指出伴随着城市化和道路交通运输载体的机动化的快速发展。由于土地资源的限制,道路的建设速度远远不能满足实际交通需求。随之带来的道路拥堵问题,已经成为制约城市迈向更高层次发展的核心阻力之一。为了缓解城市交通路况拥堵现象,精准、高效、稳定和实时的城市道路网交通流预测去刻画区域道路交通路况,对城市道路交通网以及轨道交通网络无缝对接和高质量的交通监控优化具有重要的战略意义。现有的交通是基于人、车、路、环境构建的集合体,由于人的出行活动驱动了大量的道路交通流数据产生,从而促使道路交通表现不同路况形态。鉴于交通流本身的波动性、非线性的特性极易受到外界因素的干扰,以往的交通流预测研究考虑到的数据特征比较单一、交通网络模型过于复杂或者简单,导致模型泛化能力弱,预测的道路交通流无法精确、高效实时地反映实际道路交通状态等缺陷。随着物联网、云计算等大数据技术不断完善更新发展,获取实时的城市区域交通多特征数据已经成为现实,海量的、多维度的传感器交通数据为城市的交通状态模式识别和监测系统的构建研究提供了源头保障。基于此,本文利用区域多特征交通数据,在特征工程阶段采用半监督学习方式,根据信息熵理论的决策树算法对特征进行重组融合,以此为基础,提出了一种优化的隐马尔可夫模型对交通流预测以及交通状态的模式识别的方法。结合山东省临淄区交通数据进行课题实验研究,主要工作内容过程如下:首先,研究分析交通流预测模型的国内外现状,认识影响交通流变化本质因素。根据客观事实,对实际获取的区域交通数据进行标注,同时进行特征工程操作处理。其次,为了减少模型算法受数据输入端潜在的噪声影响,在构建交通流预测模型之前添加决策树算法,筛选影响道路交通流状态的特征属性数据进行对应的重组融合。最后,针对原始的隐马尔可夫模型(Hidden Markov Model,HMM)最佳状态参数难以选择且参数训练过程中确定的状态数冗余导致模型过度拟合、泛化能力弱的问题。提出了一种优化的隐马尔可夫模型的交通流预测机制,结合贝叶斯信息准则与赤池信息准则理论,通过实际数据验证,有效增强了模型的泛化能力以及稳定性。
潘海燕,孔丹莉,胡利人,于海兵,丁元林[7](2012)在《多状态隐Markov统计模型的基本原理及其应用》文中指出隐马尔可夫模型(hidden Markov model,HMM)是一类统计模型,经典理论于20世纪60年代末70年代初由L.E.Baum等提出,20世纪70年代中期开始应用于语音识别领域。目前被广泛应用于基因关联分析和基因识别、图像识别、孤立词识别和目标
朱嘉瑜[8](2009)在《基于粒子群优化算法的隐马尔可夫模型优化及其应用研究》文中研究表明粒子群优化算法与其它的进化算法相比,其算法简单通用、需调整参数少、容易实现、具有较强的全局收敛性和鲁棒性,且不需要借助问题的特征信息,非常适于复杂环境中优化问题的求解。但是粒子群优化算法也存在算法初期容易陷入局部极值、进化后期收敛速度慢和精度低等缺点,对此,本文提出了一种带极值扰动的自适应调整惯性权重和加速系数的改进粒子群优化算法——adPSO算法。adPSO算法添加了极值扰动使粒子可以跳出局部极值;并且通过计算各粒子到全局最优点的平均距离与解空间对角线长度的比值来自适应控制惯性权重和加速系数,有效地提高了算法的收敛速度与精度。通过与其它两个算法分别对六个基准测试函数的仿真实验结果的对比,说明了adPSO算法具有良好的收敛速度与精度。隐马尔可夫模型在模式识别特别是在语音识别领域取得了巨大的成功,20世纪90年代中期以后,研究者们纷纷将隐马尔可夫模型引入到图像处理和识别的研究中来,并且取得了一些初步的研究成果。但是隐马尔可夫模型在训练中易收敛于局部极值的问题限制了隐马尔可夫模型对图像识别能力的进一步提升。因此本文将改进后的粒子群优化算法adPSO算法引入到隐马尔可夫模型的训练中,用adPSO算法与Baum-Welch算法结合分别对HMM中的状态数和参数进行优化,得到了adPSO-HMM算法。通过与Baum-Welch算法对手写数字识别的对比实验说明,本文提出的HMM训练方法有效地提高了HMM的训练效果,使得训练后的HMM具有较高的识别能力,有一定的实用价值。
李原[9](2008)在《小词汇量连续语音识别系统的研究》文中进行了进一步梳理现代信息科学的迅猛发展,智能化工具进入人们的生活,致使人们渴望人与机器的交互,甚至期盼人与机器的对话能达到人与人之间交流的那种自然的水平。在种种思潮的触动下,对人机交互的研究近几年来趋于活跃。实现对语音的识别是人机交互研究的核心之一,也是它的一个重要研究课题。作为一项具有广泛社会效益和经济效益的现代信息技术、语音识别技术虽然己经取得了很大的成就,但是面临实用化时还存在一系列的问题。要实现性能优良、实用化的语音识别系统,人们仍需要不断对语音识别的理论、算法进行研究,解决和完善语音识别中所存在的各种问题。另外,随着各种科学理论的不断发展和深入,一些新技术、新理论也不断出现,这些都为语音识别的研究奠定了基础。本文根据近期国内外对语音识别技术的集中研究方向,以及目前语音识别技术在实用性方面存在的一些问题,对语音识别技术在声学模型的改进以及语言学知识的引入方面进行了学习和研究。首先将代数算法和BP算法应用于孤立词的语音识别系统中,通过实验验证了代数神经网络的优越性。在此基础上,考虑到隐马尔可夫模型自身的一些缺陷和人工神经网络具有可以与隐马尔可夫模型互补的一些特点,用代数神经网络代替高斯混合器来计算隐马尔可夫模型的观测概率,以此提出了一种代数神经网络和HMM模型的混合模型。之后,文中对基于混合模型的连续语音识别系统进行了设计,将语言学知识引入到模型中,选取三音素作为基本声学单元,为训练语音数据中用到的所有三音素建立了隐马尔可夫模型,并采用了基于决策树的状态共享策略,以保证对声学模型参数的充分估计,最后将训练好的各个三音素模型根据本文中提出的混合模型的原理,构建了相应的代数神经网络,并用相应训练数据对其训练,最终实现了一个基于混合模型的连续语音识别系统。最后,本文在HTK平台的基础上,结合java语言实现了基于混合模型的连续语音识别系统。结果证明将混合模型结合语言学知识应用于语音识别系统是切实可行的。通过实验数据的对比可得知,依据此混合模型构建的非特定人连续语音识别系统克服了HMM模型自身的一些缺陷,识别率优于基于HMM模型构建的识别系统。
钟明辉[10](2008)在《基于HTK的汉语数码语音识别研究》文中研究表明随着计算机与信息技术的持续发展,语音交互必将成为人机交互的必要手段。语音识别技术经过了近半个世纪的发展,目前已日趋成熟,并得到广泛的应用,但还远不能说完美得没有任何值得研究、值得改进的地方。就算初看起来很简单的汉语数码语音识别,虽然它已经在电话自动拨号、家电产品的遥控、工业控制等领域中开始发挥作用,但是仍然有很大的深入研究空间,以提高识别系统的速度、稳健性和识别率。本文结合隐马尔可夫模型原理,用MATLAB语言编程实现了汉语离散数码语音识别系统;并利用HTK(HMM ToolKit)语音处理工具箱,实现了汉语离散数码和汉语连续数字语音识别系统。首先,本文介绍了语音识别技术的国内外发展状况,分析了汉语数码,特别是汉语连续数字语音识别中面临的困难,在此基础上阐明了本课题的研究背景和意义。其次,详细讨论了语音识别系统的基本原理构成模型,介绍了语音信号的数学模型、预处理和特征参数提取等过程,确定了MFCC参数作为识别参数。并讨论了本文语音识别系统采用的隐马尔可夫模型(Hidden Markov Model,HMM),介绍了HMM的定义,三个基本问题以及基本算法等问题。着重讨论了HMM在实际应用中的一些具体问题,通过实验确定了汉语数码语音识别系统的最佳状态数及混合度数。接着,简单介绍HTK的软件结构及HTK工具包,着重讨论了基于HTK的语音识别系统的搭建过程,通过汉语离散数码,以及连续数字语音识别系统证明识别单元、高斯混合分量的数目,MFCC维数的适当组合可提高系统的正确识别率。最后对汉语数字语音识别系统的总结及今后工作的展望。
二、语音识别中隐马尔可夫模型状态数的选取原则及研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、语音识别中隐马尔可夫模型状态数的选取原则及研究(论文提纲范文)
(2)基于GM-HMM的驾驶疲劳检测研究(论文提纲范文)
摘要 |
Abstract |
1.绪论 |
1.1 选题背景及意义 |
1.2 国内外研究现状及发展动态分析 |
1.2.1 驾驶疲劳特征分类及检测 |
1.2.2 驾驶疲劳状态识别方法 |
1.2.3 HMM分类及应用 |
1.2.4 综合评述 |
1.3 研究内容、技术路线及结构安排 |
2.驾驶疲劳典型工况构建及实验方案 |
2.1 实验环境搭建 |
2.1.1 实验设备 |
2.1.2 驾驶疲劳工况构建 |
2.2 实验方案 |
2.2.1 实验方案设计 |
2.2.2 实验人员招募 |
2.2.3 实验准备阶段 |
2.2.4 实验流程 |
2.3 实验数据预处理 |
2.4 本章小结 |
3.EEG特征指标提取和优选 |
3.1 脑电数据的预处理 |
3.2 特征提取 |
3.2.1 小波包分解与重构 |
3.2.2 能量特征提取 |
3.3 指标优选 |
3.4 本章小结 |
4.基于GM-HMM的驾驶疲劳模型构建 |
4.1 理论基础分析 |
4.1.1 HMM建模理论 |
4.1.2 HMM模型定义 |
4.1.3 HMM基本类型 |
4.1.4 HMM基本算法 |
4.2 基于GM-HMM的驾驶疲劳辨识模型构建 |
4.2.1 HMM模型结构选择 |
4.2.2 GM构建 |
4.2.3 CHMM的参数估计方法 |
4.3 本章小结 |
5.驾驶疲劳状态识别及结果分析 |
5.1 基于GM-HMM的驾驶疲劳状态识别 |
5.2 基于DHMM的驾驶疲劳识别模型 |
5.2.1 DHMM模型观测指标状态数分析 |
5.2.2 DHMM模型构建 |
5.3 基于Logistic回归的驾驶疲劳识别模型 |
5.4 模型对比分析 |
5.5 本章小结 |
结论 |
参考文献 |
附录 A |
攻读硕士学位期间发表学术论文情况 |
致谢 |
(3)基于机器学习的非侵入式负荷监测技术研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.2.1 非侵入式负荷监测方法的分类 |
1.2.2 基于事件的非侵入式负荷检测现状 |
1.2.3 基于状态的非侵入式负荷检测现状 |
1.3 本文研究内容 |
2 事件检测和特征提取 |
2.1 本章概要 |
2.2 负荷类型和常用事件检测方法 |
2.2.1 负荷类型和事件检测基本概念 |
2.2.2 基于经验规则的事件检测算法 |
2.2.3 基于统计检验的事件检测算法 |
2.3 混合事件检测方法 |
2.3.1 基础事件检测器 |
2.3.2 纠正检测器 |
2.3.3 混合事件检测方法的拓展 |
2.4 特征提取 |
2.5 算例分析 |
2.5.1 实验流程和数据来源 |
2.5.2 仿真场景实验 |
2.5.3 BLUED数据集验证 |
2.6 本章小结 |
3 负荷识别与能耗分解 |
3.1 本章概要 |
3.2 有监督和无监督负荷识别区别 |
3.3 基于DBSCAN的无监督负荷识别 |
3.3.1 常规的无监督负荷识别流程 |
3.3.2 DBSCAN介绍 |
3.3.3 DBSCAN应用于无监督负荷识别 |
3.3.4 设备命名 |
3.4 基于运行时间窗口的能耗分解 |
3.4.1 理想情况下的能耗分解 |
3.4.2 能耗分解中容易产生的错误 |
3.4.3 运行时间窗口 |
3.4.4 应用运行时间窗口于能耗分解 |
3.5 算例分析 |
3.5.1 实验流程和数据来源 |
3.5.2 基于DBSCAN的无监督负荷识别的效果分析 |
3.5.3 负荷分解结果评价 |
3.6 本章小结 |
4 基于隐马尔可夫模型的非侵入式负荷监测 |
4.1 本章概要 |
4.2 隐马尔可夫模型 |
4.2.1 隐马尔可夫模型的基本概念 |
4.2.2 隐马尔可夫模型的三个任务 |
4.2.3 因子隐马尔可夫模型 |
4.3 隐马尔可夫模型应用于非侵入式负荷监测 |
4.3.1 问题描述 |
4.3.2 设备的隐马尔可夫模型参数 |
4.3.3 简化的设备隐马尔可夫模型参数估计 |
4.3.4 使用因子隐马尔可夫模型进行能耗分解 |
4.4 算例分析 |
4.4.1 实验流程和数据来源 |
4.4.2 简化的设备模型参数估计的有效性 |
4.4.3 基于隐马尔可夫模型的负荷分解效果 |
4.5 本章小节 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
作者简历 |
(4)噪声环境下连续语音识别技术研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 引言 |
1.2 研究背景及意义 |
1.3 连续语音识别技术的发展及研究现状 |
1.3.1 国外连续语音识别技术的发展简介 |
1.3.2 国内连续语音识别技术的发展简介 |
1.3.3 语音识别技术的研究现状与发展趋势 |
1.4 噪声环境下连续语音识别技术的难点 |
1.5 论文的组织结构安排 |
2 语音信号特征分析 |
2.1 语音信号预处理 |
2.1.1 预加重 |
2.1.2 分帧 |
2.1.3 加窗 |
2.2 语音信号的时域特征分析 |
2.2.1 短时能量 |
2.2.2 短时平均过零率 |
2.3 语音信号的频域特征分析 |
2.4 语音信号的倒谱域特征分析 |
2.5 噪声处理 |
2.5.1 语音增强 |
2.5.2 绘制基音谱图 |
2.6 本章小结 |
3 汉语连续语音切分技术 |
3.1 语音信号的端点检测技术 |
3.1.1 双门限端点检测技术 |
3.1.2 多阈值端点检测技术 |
3.2 汉语语音音节切分 |
3.2.1 基音周期轨迹分析 |
3.2.2 语谱图分析 |
3.3 本章小结 |
4 汉语语音识别的声学模型 |
4.1 矢量量化 |
4.2 隐马尔可夫模型 |
4.2.1 隐马尔可夫模型的基本思想 |
4.2.2 隐马尔可夫模型的基本问题 |
4.2.2.1 前向-后向算法 |
4.2.2.2 Baum-Welch算法 |
4.2.3 离散型隐马尔科夫模型 |
4.2.4 连续型隐马尔可夫模型 |
4.3 本章小结 |
5 汉语语音识别的语言模型 |
5.1 统计语言模型 |
5.1.1 N元文法语言学模型 |
5.1.2 N元文法模型的数据平滑技术 |
5.1.2.1 加法平滑技术 |
5.1.2.2 Good-Turning估计 |
5.1.2.3 线性差值平滑技术 |
5.1.3 N元文法模型的搜索算法 |
5.2 汉语连续语音识别系统实现 |
5.2.1 系统框架设计 |
5.2.2 系统测试 |
5.2.2.1 实验环境 |
5.2.2.2 实验结果及分析 |
5.3 本章小结 |
6 总结与展望 |
致谢 |
参考文献 |
附录 |
(5)基于隐马尔科夫模型及反向传播神经网络的音效素材分类(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 问题的提出 |
1.2 国内外声音分类研究背景 |
1.2.1 国内外应用现状 |
1.2.2 国内外研究现状 |
1.3 本文设想与主要工作 |
1.4 本章小结 |
第二章 声音音效的数据处理 |
2.1 声音信号的预处理 |
2.2 声音的短时时域处理 |
2.2.1 短时能量 |
2.2.2 短时平均过零率 |
2.3 MEL频率倒谱系数—MFCC |
2.3.1 人耳听觉机理 |
2.3.2 Mel频率倒谱系数分析 |
2.3.3 Mel频率倒谱系数的提取过程 |
2.3.4 梅尔倒谱参数的衍生特征参数 |
2.4 实验音效素材选取及处理 |
2.5 本章小结 |
第三章 基于隐马尔科夫模型的音效识别 |
3.1 马尔科夫模型概述 |
3.2 隐马尔科夫模型主要参数 |
3.3 隐马尔科夫模型的三个问题 |
3.3.1 概率计算问题——前向算法和后向算法 |
3.3.2 参数估计问题—Baum-Welch算法 |
3.3.3 解码问题—Viterbi算法 |
3.4 基于隐马尔科夫模型的音效素材训练 |
3.4.1 实验数据样本预处理 |
3.4.2 隐马尔科夫模型的训练模型 |
3.4.3 隐马尔科夫模型的分类识别结果及讨论 |
3.5 本章小结 |
第四章 基于反向传播神经网络的音效识别 |
4.1 神经网络研究的基础 |
4.1.1 人工神经网络的基本概念和特性 |
4.1.2 单个神经元的工作过程 |
4.1.3 基本神经元间的互连 |
4.1.4 神经网络的相关学习法 |
4.2 BP神经网络原理 |
4.2.1 BP神经网络的结构 |
4.2.2 权重及偏置值的更新 |
4.2.3 迭代算法的收敛性 |
4.3 基于BP神经网络的音效特征参数训练 |
4.3.1 音效素材特征参数提取及合并 |
4.3.2 数据样本的分类标识 |
4.3.3 数据集的切分及归一化 |
4.3.4 BP神经网络模型构建及训练 |
4.3.5 BP神经网络验证测试 |
4.4 测试训练模型的性能 |
4.5 本章小结 |
第五章 隐马尔科夫模型和BP神经网络分析对比 |
5.1 实验结果分析对比 |
5.2 实验算法分析对比 |
5.3 相关实验研究分析 |
5.4 本章小结 |
第六章 基于BP神经网络的音效分类原型系统 |
6.1 原型系统总体架构 |
6.2 音效检索子系统 |
6.3 音频管理子系统 |
6.4 系统维护子系统 |
6.5 本章小节 |
总结 |
总结 |
展望 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
附件 |
(6)基于隐马尔可夫模型的交通流预测研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 课题的研究背景及意义 |
1.2 交通流预测国内外研究现状 |
1.2.1 交通流预测国内研究现状 |
1.2.2 交通流预测国外研究现状 |
1.3 研究思路和内容 |
1.4 论文主要结构框架 |
2 交通数据特性分析与提取 |
2.1 数据来源 |
2.2 交通数据相关特性预处理 |
2.2.1 区域交通数据特征分析 |
2.2.2 区域交通数据特征提取与选择 |
2.2.3 区域交通数据特征变换与归一化处理 |
2.3 构建交通流预测模型评价指标 |
2.4 本章小结 |
3 基于信息熵理论的多特征数据重组融合理论研究 |
3.1 交通特征数据重组融合的作用 |
3.1.1 交通多特征数据融合原理 |
3.1.2 交通多特征数据融合算法 |
3.2 半监督学习理论 |
3.2.1 半监督学习的技术路线基础 |
3.2.2 半监督学习算法分类 |
3.2.3 基于半监督学习的交通状态数据类别标签判定 |
3.3 基于信息熵的决策树理论的交通状态模式识别 |
3.3.1 决策树模型基本构成 |
3.3.2 基于信息熵在决策树模型中作用 |
3.3.3 基于平方误差和基尼指数策略的CART决策树算法研究 |
3.4 区域交通状态模式识别结果实现 |
3.4.1 多特征交通状态数据类别标签的划分 |
3.4.2 实例分析 |
3.5 本章小结 |
4 基于HMM的交通流预测网络研究 |
4.1 隐马尔可夫模型的概述 |
4.1.1 隐马尔可夫模型的应用研究现状 |
4.1.2 隐马尔可夫模型的优缺点 |
4.2 隐马尔可夫模型网络结构 |
4.2.1 HMM交通流网络结构参数 |
4.2.2 HMM交通流网络结构基本假设和类型 |
4.2.3 HMM交通流网络结构基本问题 |
4.3 隐马尔可夫模型的基本算法研究 |
4.3.1 基于Baum-Welch算法训练问题 |
4.3.2 基于Viterbi算法估值问题 |
4.4 HMM参数优化改进 |
4.4.1 AIC赤池信息准则 |
4.4.2 BIC贝叶斯信息准则 |
4.5 本章小结 |
5 基于优化的HMM交通流预测应用 |
5.1 交通流参数分析及数据说明 |
5.2 区域交通流时空特性可视化分布 |
5.2.1 交通流时间特性分布 |
5.2.2 交通流空间路网聚类分布 |
5.3 实例验证与结论分析 |
5.3.1 HMM交通流预测流程分析 |
5.3.2 交通流时空维度的预测 |
5.4 本章小结 |
6 总结与展望 |
6.1 研究总结 |
6.2 研究展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(7)多状态隐Markov统计模型的基本原理及其应用(论文提纲范文)
1 隐马尔可夫模型的基本原理 |
1.1 参数估计 |
1.2 |
2 隐马尔可夫模型的应用现状 |
2.1 语音识别 |
2.2 生物信息学 |
2.3 人脸识别 |
2.4 临床慢性病影响因素分析 |
2.5 其他领域 |
(8)基于粒子群优化算法的隐马尔可夫模型优化及其应用研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 相关背景 |
1.1.1 粒子群优化算法 |
1.1.2 隐马尔可夫模型 |
1.1.3 数字图像识别 |
1.2 本文的研究目的、意义 |
1.3 本文的组织方式 |
第二章 粒子群优化算法 |
2.1 标准粒子群优化算法 |
2.1.1 算法原理 |
2.1.2 算法流程 |
2.1.3 算法主要参数的作用 |
2.1.4 粒子群的拓扑结构 |
2.1.5 算法收敛性分析 |
2.2 粒子群优化算法的优点与缺点 |
2.3 粒子群优化算法的改进 |
2.3.1 增加速度的惯性权重 |
2.3.2 增加收敛因子 |
2.3.3 离散二进制粒子群优化算法 |
2.3.4 提高种群多样性 |
2.3.5 与其它优化算法结合 |
2.3.6 全信息粒子群 |
2.4 粒子群优化算法的应用 |
2.4.1 函数优化 |
2.4.2 神经网络训练 |
2.4.3 参数优化 |
2.4.4 工程领域优化 |
2.5 粒子群优化算法的发展展望 |
2.6 本章小结 |
第三章 带极值扰动的自适应粒子群优化算法 |
3.1 自适应粒子群优化算法的引入 |
3.2 极值扰动 |
3.3 自适应调整加速系数 |
3.4 自适应调整惯性权重 |
3.5 算法流程 |
3.6 仿真实验与结果分析 |
3.7 本章小结 |
第四章 隐马尔可夫模型 |
4.1 马尔可夫过程 |
4.2 隐马尔可夫模型 |
4.3 隐马尔可夫模型的基本元素 |
4.4 隐马尔可夫模型的三个基本问题 |
4.4.1 评价问题的解决:前向—后向(Forward-Backward Procedure)算法 |
4.4.2 解码问题的解决:维特比(Viterbi)算法 |
4.4.3 训练问题的解决:鲍姆—韦尔奇(Baum-Welch)算法 |
4.4.4 多个观察值序列训练 |
4.5 HMM的在模式识别领域的应用 |
4.5.1 HMM用于语音识别 |
4.5.2 HMM用于图像处理 |
4.6 本章小结 |
第五章 基于粒子群优化算法的隐马尔可夫模型优化 |
5.1 基于粒子群优化算法的隐马尔可夫模型优化的引入 |
5.2 adPSO-HMM算法对HMM状态数的优化 |
5.3 adPSO-HMM算法对HMM参数的优化 |
5.4 adPSO-HMM算法的仿真实验 |
5.5 本章小结 |
第六章 基于adPSO-HMM算法优化的HMM在识别MINST手写数字库的应用 |
6.1 手写字符与手写体阿拉伯数字识别的发展和研究现状 |
6.1.1 手写阿拉伯数字识别的意义 |
6.1.2 手写阿拉伯数字识别的难点 |
6.1.3 手写阿拉伯数字识别的一般方法 |
6.2 基于HMM的手写数字识别方法 |
6.2.1 学习和测试样本库的选择 |
6.2.2 图像预处理——图像二值化 |
6.2.3 图像预处理——基于数学形态学的提取骨架 |
6.2.4 基于2D DCT的图像特征提取 |
6.2.5 基于adPSO-HMM算法的HMM训练 |
6.2.6 手写数字的识别 |
6.3 实验结果与分析 |
6.3.1 大样本识别实验 |
6.3.2 小样本识别实验 |
6.4 本章小结 |
第七章 全文总结 |
参考文献 |
攻读学位期间发表论文 |
致谢 |
(9)小词汇量连续语音识别系统的研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 课题的背景与意义 |
1.2 语音识别技术发展的历史及现状 |
1.3 语音识别系统的应用及研究趋势 |
1.3.1 语音识别系统分类 |
1.3.2 语音识别技术的应用领域 |
1.3.3 实用性方面存在的主要问题和发展趋势 |
1.4 本文研究目的及内容 |
1.5 本章小结 |
2 语音识别系统概述 |
2.1 系统框架 |
2.2 语音声学分析 |
2.2.1 语音信号的预处理 |
2.2.2 特征参数的提取 |
2.3 识别系统的核心算法 |
2.3.1 模板匹配法 |
2.3.2 统计概率模型法 |
2.3.3 人工神经网络法 |
2.4 本章小结 |
3 将代数神经网络引入到HMM模型 |
3.1 引言 |
3.2 代数神经网络 |
3.2.1 网络的拓扑结构 |
3.2.2 代数算法 |
3.3 基于代数神经网络的孤立词语音识别系统模型 |
3.4 代数算法与传统BP算法的性能比较 |
3.5 代数神经网络与HMM的混合模型 |
3.5.1 模型的建立 |
3.5.2 状态观测概率的计算 |
3.5.3 混合模型的识别算法 |
3.6 本章小结 |
4 连续语音识别系统的设计 |
4.1 系统结构 |
4.2 声学单元的选取 |
4.3 识别网络的构建 |
4.3.1 语言模型 |
4.3.2 字典 |
4.3.3 识别网络 |
4.4 实验用语音库及声学分析 |
4.4.1 语音库 |
4.4.2 声学分析 |
4.5 混合模型的建立及训练 |
4.5.1 单音素模型的构建 |
4.5.2 三音素模型的建立 |
4.5.3 状态共享策略 |
4.5.4 混合模型的构建和训练 |
4.6 本章小结 |
5 实验设计及结果分析 |
5.1 实验环境 |
5.2 实验设计 |
5.2.1 语言模型的设计 |
5.2.2 字典的获取 |
5.2.3 语音库 |
5.2.4 问题集的设计 |
5.3 实验结果及分析 |
5.4 本章小结 |
6 结论与展望 |
6.1 主要结论 |
6.2 后续研究工作的展望 |
参考文献 |
附录 硕士期间发表的论文和参与的课题 |
致谢 |
(10)基于HTK的汉语数码语音识别研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 语音识别概述 |
1.2 语音识别的发展与现状 |
1.3 语音识别所面临的问题 |
1.4 汉语数码语音识别的意义及面临的问题 |
1.4.1 汉语数码语音识别的意义 |
1.4.2 汉语数码语音识别所面临的问题 |
1.5 论文结构 |
第2章 语音识别的基本原理 |
2.1 语音识别系统的构成 |
2.2 语音信号的获取 |
2.2.1 语音的产生 |
2.2.2 语音信号的A/D 转换 |
2.3 语音信号的产生模型 |
2.3.1 激励模型 |
2.3.2 声道模型 |
2.3.3 辐射模型 |
2.4 语音信号的预处理 |
2.4.1 预加重 |
2.4.2 语音信号的分帧加窗处理 |
2.5 语音端点检测 |
2.5.1 短时能量和短时过零率 |
2.5.2 基于短时能量和短时过零率的端点检测 |
2.6 特征参数提取 |
2.6.1 线性预测倒谱系数LPCC |
2.6.2 Mel 频率倒谱系数MFCC |
2.6.3 MFCC 参数与LPCC 参数对比 |
2.7 本章小节 |
第3章 隐马尔可夫模型(HMM) |
3.1 隐马尔可夫模型(HMM)的引入 |
3.2 隐马尔可夫模型(HMM)的定义 |
3.2.1 信号模型 |
3.2.2 隐马尔可夫模型的数学描述 |
3.3 HMM 的三个基本问题及其解决 |
3.3.1 “前向—后向”算法 |
3.3.2 最佳状态序列的确定(Viterbi 算法) |
3.3.3 Baum-Welch 算法 |
3.4 隐马尔可夫模型的类型 |
3.5 本章小结 |
第4章 HTK 语音识别原理和基于HTK 的语音识别系统搭建 |
4.1 HTK 的语音识别原理 |
4.1.1 HTK 的软件结构 |
4.1.2 HTK 工具包 |
4.2 基于HTK 的语音识别系统搭建 |
4.2.1 数据准备 |
4.2.2 特征提取 |
4.2.3 识别单元选取 |
4.2.4 汉语离散数码的训练与识别 |
4.2.5 连续数字的训练与识别 |
4.3 本章小节 |
第5章 实验仿真及性能分析 |
5.1 软硬件环境 |
5.2 语音数据库的建立 |
5.3 实验一:基于HMM 的汉语离散数码语音识别 |
5.3.1 实验用数据库 |
5.3.2 具体实现过程 |
5.3.3 实验结果及分析 |
5.4 实验二:基于HTK 的汉语离散数码语音识别 |
5.4.1 实验用数据库 |
5.4.2 具体实现过程 |
5.4.3 实验结果及分析 |
5.5 实验三:基于HTK 的汉语连续数字语音识别 |
5.5.1 实验用数据库 |
5.5.2 具体实现过程 |
5.5.3 实验结果及分析 |
5.6 本章小节 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间发表的论文 |
致谢 |
四、语音识别中隐马尔可夫模型状态数的选取原则及研究(论文参考文献)
- [1]基于混合模型的鲸鱼叫声识别[D]. 刘开金. 哈尔滨工程大学, 2021
- [2]基于GM-HMM的驾驶疲劳检测研究[D]. 吕星晨. 大连理工大学, 2020(02)
- [3]基于机器学习的非侵入式负荷监测技术研究[D]. 徐志翔. 浙江大学, 2020(12)
- [4]噪声环境下连续语音识别技术研究[D]. 王宇琛. 南京理工大学, 2019(01)
- [5]基于隐马尔科夫模型及反向传播神经网络的音效素材分类[D]. 张辛宬. 华南理工大学, 2019(01)
- [6]基于隐马尔可夫模型的交通流预测研究[D]. 伍宏伟. 兰州交通大学, 2019(03)
- [7]多状态隐Markov统计模型的基本原理及其应用[J]. 潘海燕,孔丹莉,胡利人,于海兵,丁元林. 中国药物经济学, 2012(02)
- [8]基于粒子群优化算法的隐马尔可夫模型优化及其应用研究[D]. 朱嘉瑜. 广州大学, 2009(S1)
- [9]小词汇量连续语音识别系统的研究[D]. 李原. 西南大学, 2008(09)
- [10]基于HTK的汉语数码语音识别研究[D]. 钟明辉. 广西师范大学, 2008(09)