题目
7.在自然语言处理中,将文本序列切分为独立的词汇单元的过程称之为______。识别文本中专有名词(如人名、地名、机构名)的任务称为______。
7.在自然语言处理中,将文本序列切分为独立的词汇单元的过程称之为______。识别文本中专有名词(如人名、地名、机构名)的任务称为______。
题目解答
答案
在自然语言处理中,将文本序列切分为独立的词单元的过程被称为分词。这是文本处理的基础步骤,尤其在中文等没有明显词边界的语言中尤为重要。
同时,识别文本中专有名词(如人名、地名、机构名等)的任务称为命名实体识别(Named Entity Recognition, NER),它是信息提取、知识图谱构建等应用的重要基础。
答案:
分词
命名实体识别