题目
在语音识别中,按照从微观到宏观的顺序排列正确的是()。A. 帧-状态-音素-单词B. 帧-音素-状态-单词C. 音素-帧-状态-单词D. 帧-音素-单词-状态
在语音识别中,按照从微观到宏观的顺序排列正确的是()。
A. 帧-状态-音素-单词
B. 帧-音素-状态-单词
C. 音素-帧-状态-单词
D. 帧-音素-单词-状态
题目解答
答案
A. 帧-状态-音素-单词
解析
本题考查语音识别中的层级结构关系,需明确帧、状态、音素、单词四个概念的层级顺序。关键点在于理解:
- 帧是语音信号的最小时间单位;
- 状态用于描述音素的动态过程(如隐马尔可夫模型中的状态划分);
- 音素是语言的最小单位,由多个状态构成;
- 单词由多个音素组合而成。
核心思路:从时间维度的最小单位(帧)出发,逐步向语言的高层结构(单词)递进。
语音识别的处理流程遵循从局部到整体、从细粒度到粗粒度的逻辑:
- 帧:语音信号被切割为短时帧(如20-25毫秒),是分析的基本单位。
- 状态:每个音素的发音过程被划分为若干状态(如HMM中的状态转移)。
- 音素:状态的序列构成音素(如拼音中的“b”、“a”)。
- 单词:多个音素按顺序组合形成完整的单词。
错误选项分析:
- B:将“音素”置于“状态”前,混淆了状态属于音素内部结构的逻辑。
- C:从“音素”开始,未体现帧的微观基础。
- D:将“状态”放在最后,与层级关系矛盾。