Neural Fuzzy Repair: Integrating Fuzzy Matches into Neural Machine Translation
2019-08-05
Reference
None
摘要
本文提出了一个数据增广方法,利用模糊翻译记忆(Translation Memory)匹配(fuzzy TM matches)提升NMT的表现。
背景
- 翻译记忆(TM),猜测是一个数据库,包含了...
Python笔记
多继承与super()
继承了多个父类的类,在父类中调用super()时,不会直接调用父类的父类。这是因为super()实际上是沿MRO来调用方法的。
MRO是一个类在调用方法时,用来查找定义了这个方法的类列表。在目前的python中,这个列表是采用...
Incrementality in Deterministic Dependency Parsing
2019-08-02
Read More
Modeling Coverage for Neural Machine Translation
Read MoreBERT: Pre-training of Deep Bidirectional Transformers for Langua Understanding
摘要
BERT被设计用于预训练深度双向表示,基于无标签文本并以在全层依赖于左右上下文的方式学习。预训练的BERT模型只需一层额外的输出层就可以微调至特定任务,产生SOTA模型,不需要修改模型架构。
背景
- 有两种将预训练语言表示应用于下游任务的策略:基于特征(feature-based)和微...
BPE计算的优化
Neural Machine Translation of Rare Words with Subword Units 这篇paper里给出的BPE代码只能用来阐述BPE的概念,实际使用时效率过低。本文记录几个可以优化的地方。
优化点一
BPE每次合并一对subword a和b,只影响了a,b以及ab相关的pair的...
Neural Machine Translation of Rare Words with Subword Units
方法
Byte Pair Encoding(BPE)
- 词语结尾添加特殊符号
·或</w>,以便BPE...
