首页>资讯 > 正文

DeepMind发布提高翻译质量的算法ReST

2023-08-26 04:05:26    出处:鞭牛士


(相关资料图)

谷歌DeepMind于8月21日发布论文,提出一种使LLM与人类偏好对齐更简单的算法ReST(Reinforced Self-Training)。不同于RLHF(基于人类反馈的强化学习)使用人类反馈改进语言模型,ReST通过生成和使用离线数据进行训练,从而使得LLM与人类偏好保持一致。研究团队表示,虽然ReST可用于所有生成任务,但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验,测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明,ReST可以极大地提高翻译质量。

关键词:

消费
产业
法比奥:我不是梅西C罗不可能场场进球 我的哲学是专注踢好每一场 直播吧8月25日讯在8月19日北京国安主场对阵上海申花的比赛中,北京国安
防伪溯源标签制作厂家 防伪溯源标签制作厂家点击查看联系电话防伪溯源标签的制作过程可以分为
“掐点”乘公交!武汉首批线路试行“挂表运营” 长江日报大武汉客户端8月25日讯(记者刘海锋通讯员龚姣)为改善乘客乘
ETF创新产品加速涌现 首批4只科创100ETF获批 证监会官网8月21日晚信息显示,首批申报的4只科创100ETF(交易型开放式
基金