AI能读懂40种语言,15个语种拿22项第一,身后是中国团队22年坚守
发布时间:2021-11-27 09:42 所属栏目:18 来源:互联网
导读:今年9月,微软凭借最新的图灵通用语言表示模型(T-ULRv5),成功刷新了XTREME榜单总分和4个单项任务的SOTA。 为了达到这一最新成就,微软在大规模的多语言数据集上对模型进行了平行文本语料的训练,并同时结合了最新的XLM-E研究和XTune微调技术。 由此诞生的T
今年9月,微软凭借最新的图灵通用语言表示模型(T-ULRv5),成功刷新了XTREME榜单总分和4个单项任务的SOTA。 为了达到这一最新成就,微软在大规模的多语言数据集上对模型进行了平行文本语料的训练,并同时结合了最新的XLM-E研究和XTune微调技术。 由此诞生的T-ULRv5 XL有48个transformer层,隐藏维度大小为1536,24个注意力头,多语言词汇量为50万个,总参数量达到22亿,并且能够处理94种不同的语言。 不过,在上个月的最新排名中,哈工大讯飞联合实验室(HFL)团队以总平均分84.1分的成绩再次刷新了这个记录。 HFL的CoFe模型在四项任务中,有三项都超过了微软T-ULRv5 XL模型创造的记录,另外一项则与其持平。 对此,哈工大讯飞联合实验室提出了三项技术,从而让模型具有多语言理解与跨语言迁移能力。 (编辑:ASP站长网) |
相关内容
网友评论
推荐文章
热点阅读