microsoft-translator - 基线模型的自定义翻译BLEU分数

我上传了培训/调整/测试集，并成功地培训了自定义翻译器。 Web UI的“模型”选项卡中的红色框中显示的BLEU得分为28.5。我可以从模型训练详细信息的“测试”选项卡中下载翻译后的测试集以及源数据和参考数据。

我想知道的是，该BLEU分数是比我使用非定制的Microsoft Translator可以达到的BLEU分数好还是差？多少钱？红色是否表示情况更糟？

我知道我可以调用Microsoft Translator API来获取测试集的非自定义翻译，然后运行BLEU评分器来获取差异，但是我希望在Web UI中看到这一点。

谢谢！