https://leemeng.tw/neural-machine-translation-with-transformer-and-tensorflow2.html
抄的这篇
就3w笔资料 跑了一个晚上 效果差,也有点那个意思了
还是得用预训练模型,效果好一些
nth233 是 这个主要是拿来熟息一下结构