我上传了培训/调整/测试集,并成功地培训了自定义翻译器。 Web UI的“模型”选项卡中的红色框中显示的BLEU得分为28.5。我可以从模型训练详细信息的“测试”选项卡中下载翻译后的测试集以及源数据和参考数据。
我想知道的是,该BLEU分数是比我使用非定制的Microsoft Translator可以达到的BLEU分数好还是差?多少钱?红色是否表示情况更糟?
我知道我可以调用Microsoft Translator API来获取测试集的非自定义翻译,然后运行BLEU评分器来获取差异,但是我希望在Web UI中看到这一点。
谢谢!