题目
在机器翻译任务中,以下哪个指标是通过比较 模型生成的翻译文本与参考译文之间的 n-gram 重 叠程度来评估翻译质量的? A. BLEUB. ROUGEC. CIDErD. mAP
在机器翻译任务中,以下哪个指标是通过比较 模型生成的翻译文本与参考译文之间的 n-gram 重 叠程度来评估翻译质量的?
- A. BLEU
- B. ROUGE
- C. CIDEr
- D. mAP
题目解答
答案
A
解析
在机器翻译任务中,BLEU(Bilingual Evaluation Understudy)是一种常用的评估指标,它通过比较模型生成的翻译文本与参考译文之间的 n-gram 重叠程度来评估翻译质量。BLEU 指标计算翻译文本与参考译文之间 n-gram 的匹配度,通常使用 1-gram 到 4-gram 的匹配度来计算,然后取几何平均值,并考虑翻译的长度惩罚。其他选项如 ROUGE、CIDEr 和 mAP 主要用于其他类型的自然语言处理任务,如文本摘要和图像描述生成等。