题目
使用Word2Vec对词进行向量化[1]的时候,参数 window表示句子中上下文环境窗口的大小,课件 中该参数的设置值是( )。A. 4B. 5C. 6D. 7
使用Word2Vec对词进行向量化[1]的时候,参数 window表示句子中上下文环境窗口的大小,课件 中该参数的设置值是( )。
A. 4
B. 5
C. 6
D. 7
题目解答
答案
B. 5
解析
考查要点:本题主要考查对Word2Vec模型中window
参数的理解,以及课件中常见参数设置的记忆。
关键思路:
window
参数的作用:定义在训练过程中,当前词与上下文词之间的最大距离。例如,window=5
表示当前词的前5个词和后5个词都可能被纳入上下文窗口。- 常见设置:默认情况下,Word2Vec的
window
参数通常设置为5,但具体值可能因任务需求调整。 - 课件中的默认设置:题目明确指向课件中的参数值,需结合常见默认配置作答。
参数window
的作用
在Word2Vec训练中,window
参数决定了模型如何选取上下文词。例如,若当前词为句子中的第3个词,且window=2
,则上下文窗口可能包含前2个词(第1、2个词)和后2个词(第4、5个词)。
常见参数设置
- 默认值:Word2Vec的官方实现(如Gensim)中,
window
的默认值为5。 - 调整逻辑:
- 较大的窗口(如5~10)能捕捉更远的语义关系,但可能降低向量的区分度。
- 较小的窗口(如2~3)能聚焦局部上下文,但可能忽略长距离依赖。
课件中的默认配置
题目中未提供特殊说明,因此默认课件采用标准工具(如Gensim)的默认参数。结合上述分析,window=5
是合理答案。