torchtext.data.metrics¶
bleu_score¶
- torchtext.data.metrics.bleu_score(candidate_corpus, references_corpus, max_n=4, weights=[0.25, 0.25, 0.25, 0.25])[source]¶
计算候选翻译语料库和参考翻译语料库之间的 BLEU 得分。基于 https://www.aclweb.org/anthology/P02-1040.pdf
- 参数:
candidate_corpus – 候选翻译的迭代器。每个翻译都是一个标记迭代器
references_corpus – 参考翻译的迭代器迭代器。每个翻译都是一个标记迭代器
max_n – 我们想要使用的最大 n 元语法。例如,如果 max_n=3,我们将使用一元语法,二元语法和三元语法
weights – 用于每个 n 元语法类别的权重列表(默认情况下为均匀分布)
示例
>>> from torchtext.data.metrics import bleu_score >>> candidate_corpus = [['My', 'full', 'pytorch', 'test'], ['Another', 'Sentence']] >>> references_corpus = [[['My', 'full', 'pytorch', 'test'], ['Completely', 'Different']], [['No', 'Match']]] >>> bleu_score(candidate_corpus, references_corpus) 0.8408964276313782