400-123-4657

行业资讯分类

DeepMind发布提高翻译质量的算法ReST发布日期：2024-04-17 浏览次数：

　　谷歌DeepMind于8月21日发布论文，提出一种使LLM与人类偏好对齐更简单的算法ReST（Reinforced Self-Training）。168ty体育不同于RLHF（基于人类反馈的强化学习）使用人类反馈改进语言模型，ReST通过生成和使用离线数据进行训练，从而使得LLM与人类偏好保持一致。研究团队表示，虽然ReST可用于所有生成任务，但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验，测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明，ReST可以极大地提高翻译质量。

400-123-4657

周一至周五 : 08:00-17:30

邮箱 :

地址 : 广东省广州市天河区某某工业园88号

在线咨询关注微博

: 微信扫一扫
即刻关注我们公众号

友情链接:

XML地图| txt地图| html地图

400-123-4657

关于我们

产品中心

新闻资讯

技术研发

400-123-4657