智能声控小车毕业设计开题报告

河南理工大学本科毕业设计（论文）开题报告

ora汽车

中国第一辆汽车是什么品牌题目名称	基于单片机的智能声控小车设计
学生姓名		专业班级	学号
一、选题的目的和意义： 1．设计（论文）的主要目的通过本次设计，可以对国内、外的智能声控发展趋势及应用背景有所了解，并通过一些书籍、期刊，掌握单片机及声控工作原理，同时对一些基于单片机的智能声控小车的软、硬件设计及相关仿真软件进行了实践应用。 2. 意义机器人的应用越来越广泛，几乎渗透到所有领域。机器人的发展体现了一个国家技术水平的高低，现代机器人从其诞生到现在，己经发展到了第三代。第一代机器人是示教再现型机器人。它们装有记忆存储器，由人将作业的各种操作要求示范给机器人，使之记住操作的程序和要领。当它接到再现命令时，则自主地再现示教的动作。第二代机器人是装有小型计算机和简单传感器的离线编程的工业机器人。它能感知外界信息和进行“思维”，比第一代机器人更灵活、更能适应环境变化的需要。第三代是智能机器人。智能机器人是“具有感知、思维和动作的机器”。它装有多种传感器，能识别作业环境，能自主决策，具有人类大脑的部分功能，且动作灵活，是人工智能技术发展到高级阶段的产物。智能小车，也就是轮式机器人，具有广泛的用途，尤其适合那些人类无法工作的环境中工作，无人生产线，仓库，服务机器人，航空航天等领域。作为20世纪自动化领域的重大成就，机器人已经和人类社会的生产、生活密不可分。应此为了使智能小车工作在最佳状态，进一步研究及完善其速度和方向的控制是非常有必要的。其次学习智能小车的制作也是对大学4年学习的一个很好的检测，对今后的学习和工作具有很大的帮助。

二、国内外研究现状简述：

机器自动语音识别的研究工作起始于上世纪50 年代，1952 年Bell 实验室的Davis，Biddulph 等人建立了第一个可以识别孤立英文数字的语音识别系统。六十年代对语音信号的研究主要是特征分析与特征提取，人们发现人耳对声音中不同的频率有不同的分辨率和反应强度，从而提出临界频带理论(Critical Band Theory)。当时由于计算机技术的限制，只能用专用硬件进行谱分析再由计算机识别。1966年MIT 的Gold等人用16通道滤波器组、基音检测器、浊音检测器和一台计算机构成一个语音识别系统。语音识别从这一时期开始起步。

七十年代语音识别技术得到迅速发展，由于线性预测编码LPC (Linear Prediction Coding) 特征较好地解决了语音特征的提取问题，人们开始研究各种识别方法。人们把用于解决有序的优化问题的动态规划 (Dynamic Programming) 技术应用到语音识别中，由Sakoe(1972 ) 提出的动态时间弯曲DTW (Dynamic Time Warping) 算法有效地解决了语音两次发音间的时间变形问题。DTW算法对特定人的孤立词识别十分有效，从此基于LPC 分析及DTW算法的中、小字表孤立字特定人语音识别系统纷纷建立起来，语音识别开始走出实验室进入实用领域。

汽车中国网八十年代，不论在语音特征表示、距离度量、还是识别方法上均有较大发展。八十年代初Y. Linde将信息压缩理论中矢量量化(Vector Quantization) 技术应用于语音识别。矢量量化的作用是进行数据压缩，将连续的语音特征空间量化为一些离散点，降低系统在时间及存储上的开销。矢量量化的另一个作用是通过聚类获取多个话者或一个话者的多次发音所共有的语音特征。Bell实验室的Rabiner(1983)奔驰smart到底好不好等人将矢量量化与隐马尔可夫模型HMM (Hidden Markov Model) 结合起来，提出并建立了离散参数隐马尔可夫模型，从此采用离散参数隐马尔可夫模型的非特定人语音识别研究纷纷开展起来。

日本AT R 的电话翻译研究实验室 (Interpreting Telephony Research Laboratory)

是世界上最大的致力于语音识别研究的实验室，己经研制出语音翻译系统( 即SL-TRANS 系统) ，它能识别日语语音并翻译成英语再合成英语声音输出。1990年Nagata 和Kogure 介绍了 SL-TRANS 系统，SL-TRANS 由六部分组成。HMM 识别器生成多侯选词表，通过词和短语级的相关滤波操作将多余侯选词删除，然后由基于HPSG 的表达文法分析器生成一个文法分析表，再用一个转换模型重写该表，用基于规则的生成器生成英语句子，发音由语音合成器生成。整个系统能翻译测试句子的69% ，语法是特别为口语设计的，它包括一些实用的约束，如敬语的语法规则。语音识别部分的精度比整个翻译系统的高，非特定人的识别率为81.6% ，特定人为88.4% 。

ATR将神经元网络用于语音识别，1988年Waiter 用时延神经网络 TDNN 解决了难于区分的“B ”，“D ”和“G ”的问题。网络能自学一些特征，神经元的识别率是98.5% ，而HMM 方法的识别率为93.7% 。

1989年NEC的Sokoe 将神经元用于孤立词非特定人的语音识别，它利用动态萨博规划技术DTW (Dynamic Programming Technique)优点，通过自学习改进性能，其识别日语数字的识别率是99.3% 。东京的NTT 人机接口实验室 (The NTT Human Interface Lab) 用HMM匹配音节和DTW 匹配基音轮廓的混合技术识别孤立字，音节匹配法易于混淆的相似音节，用基音轮廓就很容易区分。NTT 使用HMM 方法，用三元音节作为语音基元研制出语音听写机，对特定人的279 个语调的测试其识别率为94.9% 。1990 年Matsunaga使用HMM 和二级语法：单个短语的短语结构语法和组合短语的语法研制出连续语音识别系统，短语识别率可达86.8% ，对216 个词的识别率为98.4% 。

1985年东京的Matsushita研究所研制了非特定人孤立词语音识别系统、该系统包括：LPC 倒谱系数、辅音分段、辅音识别、元音和半元音识别、音节序列生成和词的匹配。根据1985年Morii的报导，系统对274 个词的识别率为95.6% 。另外，Matsushita研制出 15个词组成的非特定人孤立词识别的商业用接插板，并己经用于VCR，视频通信系统。在Yamatokoriyama 的夏普信息系统实验室，根据日本语的特点：日语总共有大约100 个音节，并且语音是以音节为基础，用音节作语音识别基元，用音韵规则得到每个音节间的关系，并用 DTW方法作语音识别，对 300 个孤立字的特定人的识别率是94% 。 1985 年sharp 在超级市场放置了一个用声音操作的字处理系统，并引起人们对这一领域的关注。

1990年在kawasaki的Fujits。实验室的信息处理分部，将DP(Dynamic programming) 方法用于100, 000 字的字典( 大部分是名字) 的语音识别，由于词汇量大，计算时间极长，通过预处理完成快速选择。在 20个侯选字中，每次所选字的正确率为93.5% 。整个系统的性能比较差，第一侯选字的正确率只有55% 。起亚智跑

1989年DECIPHER 用25个Mel 滤波器，带宽为 100-6400Hz ，得到每帧12位的Mel CEP 系数(Mel-cepstra coefficients) ，使用矢量量化 VQ方法将特征压缩到每帧4 位：能量(energy) 、能量导数(energy derivative) 、Mel倒谱(Mel-cepstra) 和Mel倒谱导数(Mel-cepstra derivative) 。在字的结构中使用了音韵规则，使用混合的 HMM方法(The tied mixture HMMs) 锐化训练数据的音素，并能很好地将男人和女人说话者分成二组模板，所需的训练时间大约为 2-3 小时，混合的 HMM 能根据每个说话人的特点来修改参数。该系统用20 句作为自适应训练句子，可以使误识率从 7.4%降到6.1%。

智能声控小车毕业设计开题报告

发布评论取消回复

最近发表

热门文章

标签列表