亚洲国产爱久久全部精品_日韩有码在线播放_国产欧美在线观看_中文字幕不卡在线观看

Skip to content

microsoft/MPNet

MPNet

MPNet: Masked and Permuted Pre-training for Language Understanding, by Kaitao Song, Xu Tan, Tao Qin, Jianfeng Lu, Tie-Yan Liu, is a novel pre-training method for language understanding tasks. It solves the problems of MLM (masked language modeling) in BERT and PLM (permuted language modeling) in XLNet and achieves better accuracy.

News: We have updated the pre-trained models now.

Supported Features

  • A unified view and implementation of several pre-training models including BERT, XLNet, MPNet, etc.
  • Code for pre-training and fine-tuning for a variety of language understanding (GLUE, SQuAD, RACE, etc) tasks.

Installation

We implement MPNet and this pre-training toolkit based on the codebase of fairseq. The installation is as follow:

pip install --editable pretraining/
pip install pytorch_transformers==1.0.0 transformers scipy sklearn

Pre-training MPNet

Our model is pre-trained with bert dictionary, you first need to pip install transformers to use bert tokenizer. We provide a script encode.py and a dictionary file dict.txt to tokenize your corpus. You can modify encode.py if you want to use other tokenizers (like roberta).

1) Preprocess data

We choose WikiText-103 as a demo. The running script is as follow:

wget https://s3.amazonaws.com/research.metamind.io/wikitext/wikitext-103-raw-v1.zip
unzip wikitext-103-raw-v1.zip

for SPLIT in train valid test; do \
    python MPNet/encode.py \
        --inputs wikitext-103-raw/wiki.${SPLIT}.raw \
        --outputs wikitext-103-raw/wiki.${SPLIT}.bpe \
        --keep-empty \
        --workers 60; \
done

Then, we need to binarize data. The command of binarizing data is following:

fairseq-preprocess \
    --only-source \
    --srcdict MPNet/dict.txt \
    --trainpref wikitext-103-raw/wiki.train.bpe \
    --validpref wikitext-103-raw/wiki.valid.bpe \
    --testpref wikitext-103-raw/wiki.test.bpe \
    --destdir data-bin/wikitext-103 \
    --workers 60

2) Pre-train MPNet

The below command is to train a MPNet model:

TOTAL_UPDATES=125000    # Total number of training steps
WARMUP_UPDATES=10000    # Warmup the learning rate over this many updates
PEAK_LR=0.0005          # Peak learning rate, adjust as needed
TOKENS_PER_SAMPLE=512   # Max sequence length
MAX_POSITIONS=512       # Num. positional embeddings (usually same as above)
MAX_SENTENCES=16        # Number of sequences per batch (batch size)
UPDATE_FREQ=16          # Increase the batch size 16x

DATA_DIR=data-bin/wikitext-103

fairseq-train --fp16 $DATA_DIR \
    --task masked_permutation_lm --criterion masked_permutation_cross_entropy \
    --arch mpnet_base --sample-break-mode complete --tokens-per-sample $TOKENS_PER_SAMPLE \
    --optimizer adam --adam-betas '(0.9,0.98)' --adam-eps 1e-6 --clip-norm 0.0 \
    --lr-scheduler polynomial_decay --lr $PEAK_LR --warmup-updates $WARMUP_UPDATES --total-num-update $TOTAL_UPDATES \
    --dropout 0.1 --attention-dropout 0.1 --weight-decay 0.01 \
    --max-sentences $MAX_SENTENCES --update-freq $UPDATE_FREQ \
    --max-update $TOTAL_UPDATES --log-format simple --log-interval 1 --input-mode 'mpnet'

Notes: You can replace arch with mpnet_rel_base and add command --mask-whole-words --bpe bert to use relative position embedding and whole word mask.

Notes: You can specify --input-mode as mlm or plm to train masked language model or permutation language model.

Pre-trained models

We have updated the final pre-trained MPNet model for fine-tuning.

You can load the pre-trained MPNet model like this:

from fairseq.models.masked_permutation_net import MPNet
mpnet = MPNet.from_pretrained('checkpoints', 'checkpoint_best.pt', 'path/to/data', bpe='bert')
assert isinstance(mpnet.model, torch.nn.Module)

Fine-tuning MPNet on down-streaming tasks

Acknowledgements

Our code is based on fairseq-0.8.0. Thanks for their contribution to the open-source commuity.

Reference

If you find this toolkit useful in your work, you can cite the corresponding papers listed below:

@article{song2020mpnet,
    title={MPNet: Masked and Permuted Pre-training for Language Understanding},
    author={Song, Kaitao and Tan, Xu and Qin, Tao and Lu, Jianfeng and Liu, Tie-Yan},
    journal={arXiv preprint arXiv:2004.09297},
    year={2020}
}

Related Works

About

MPNet: Masked and Permuted Pre-training for Language Understanding https://arxiv.org/pdf/2004.09297.pdf

Resources

License

Code of conduct

Contributing

Security policy

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published
亚洲国产爱久久全部精品_日韩有码在线播放_国产欧美在线观看_中文字幕不卡在线观看

    
    

    9000px;">

      
      

      一级特黄大欧美久久久| 99视频一区二区| 玉足女爽爽91| 欧美激情在线看| 久久久久久久av麻豆果冻| 91精品婷婷国产综合久久性色 | 精品日韩一区二区三区| 欧美美女直播网站| 欧美综合久久久| 欧美午夜精品免费| 欧美日韩一区二区三区四区五区| 91免费视频网| 色悠悠亚洲一区二区| 日本电影亚洲天堂一区| 欧美性受xxxx| 欧美一区二区在线播放| 91精品国产色综合久久久蜜香臀| 欧美群妇大交群中文字幕| 欧美精品一卡二卡| 91精品在线麻豆| 精品国产91九色蝌蚪| 国产亚洲精品久| 国产精品女主播在线观看| 国产精品国产三级国产专播品爱网| 一色桃子久久精品亚洲| 国产精品国产三级国产三级人妇 | 亚洲一区在线看| 天天综合色天天综合色h| 亚洲1区2区3区4区| 国产一区二区视频在线播放| 国产精品一区二区视频| 99久久婷婷国产综合精品电影 | 天天综合天天做天天综合| 久久激情五月婷婷| 不卡一区二区三区四区| 欧美亚洲一区二区在线| 精品美女一区二区三区| 国产女主播一区| 一区二区三区视频在线观看| 美女视频黄久久| 91色综合久久久久婷婷| 日韩一区二区三区av| 国产精品传媒视频| 老鸭窝一区二区久久精品| 不卡高清视频专区| 9191成人精品久久| 亚洲私人黄色宅男| 韩国在线一区二区| 欧美在线观看视频一区二区三区| 久久久久久久久久看片| 午夜精品影院在线观看| 成人福利在线看| 精品乱码亚洲一区二区不卡| 亚洲一区免费视频| 国产传媒久久文化传媒| 欧美一卡在线观看| 亚洲精品网站在线观看| 成人免费观看视频| 日韩欧美一区二区免费| 洋洋av久久久久久久一区| 国产一区91精品张津瑜| 在线成人午夜影院| 亚洲黄色av一区| 成人福利视频网站| www精品美女久久久tv| 亚洲一区二区不卡免费| av在线不卡电影| 久久综合九色综合欧美98| 青青青爽久久午夜综合久久午夜 | 91麻豆精品国产91久久久资源速度| 亚洲欧洲www| 成人小视频在线| 久久久精品2019中文字幕之3| 日本人妖一区二区| 欧美日韩免费不卡视频一区二区三区| 中文字幕在线播放不卡一区| 国产毛片精品视频| 精品国产一区二区精华| 久久精品国产免费| 日韩一级免费一区| 国产乱子伦视频一区二区三区| 欧美一区二区三区在线观看| 天堂在线一区二区| 日韩一区二区在线观看| 美女免费视频一区| 欧美一区二区免费观在线| 亚洲3atv精品一区二区三区| 欧美日韩精品一区二区三区蜜桃| 亚洲一区二区视频| 欧美日韩不卡一区二区| 蜜桃视频一区二区三区在线观看| 欧美影片第一页| 日韩成人免费电影| 欧美成人aa大片| 久久激情综合网| 亚洲国产成人自拍| 欧洲激情一区二区| 美女脱光内衣内裤视频久久网站 | 精品久久久三级丝袜| 国产剧情在线观看一区二区| 日韩欧美激情四射| 国产美女一区二区| 成人欧美一区二区三区白人| 色香色香欲天天天影视综合网| 亚洲人快播电影网| 欧美精品在线一区二区三区| 蜜臂av日日欢夜夜爽一区| 欧美电影免费提供在线观看| 东方欧美亚洲色图在线| 亚洲欧洲国产日本综合| 欧美午夜免费电影| 看电视剧不卡顿的网站| 欧美经典一区二区三区| 在线观看91精品国产入口| 五月婷婷激情综合| 久久久综合精品| 日本精品视频一区二区| 男人的天堂久久精品| 国产色综合久久| 在线视频一区二区三| 韩国午夜理伦三级不卡影院| 国产精品传媒入口麻豆| 日韩欧美一级在线播放| av中文字幕不卡| 精品在线亚洲视频| 亚洲桃色在线一区| xfplay精品久久| 欧美日韩免费电影| 不卡在线观看av| 琪琪久久久久日韩精品| 亚洲日本va在线观看| 欧美电视剧免费观看| 91麻豆产精品久久久久久 | 亚洲国产精品t66y| 日韩一区二区电影网| 成人动漫在线一区| 久草中文综合在线| 天堂精品中文字幕在线| 亚洲人精品一区| 国产精品欧美综合在线| 久久综合中文字幕| 日韩一区二区在线免费观看| a级高清视频欧美日韩| 国产成人在线观看| 免费久久99精品国产| 亚洲与欧洲av电影| 亚洲免费观看在线观看| 国产日本欧美一区二区| 日韩精品一区二| 日韩欧美视频在线| 欧美日韩国产三级| 色网综合在线观看| 色综合久久综合中文综合网| 蜜臀av性久久久久蜜臀aⅴ流畅 | 欧美日韩一区二区三区免费看 | 精品国产一区a| 精品欧美乱码久久久久久| 在线电影欧美成精品| 欧美老女人在线| 欧美性猛片xxxx免费看久爱| 成人黄色小视频| a美女胸又www黄视频久久| www.日韩精品| 99精品欧美一区| 欧美综合一区二区| 欧美性感一类影片在线播放| 欧美日本国产视频| 欧美在线小视频| 91精品福利在线一区二区三区| 欧美日韩高清不卡| 欧美一区中文字幕| 日韩视频不卡中文| 精品国产精品网麻豆系列| 精品福利二区三区| 精品国产百合女同互慰| 久久久久久亚洲综合影院红桃| 久久人人97超碰com| 国产精品毛片久久久久久久| 国产精品不卡视频| 亚洲一区二区三区四区中文字幕| 亚洲国产精品久久久久婷婷884| 亚洲二区在线视频| 久久精品理论片| 波多野结衣中文字幕一区| 91久久精品一区二区二区| 欧美在线观看一区| 日韩小视频在线观看专区| 精品对白一区国产伦| 亚洲国产精品99久久久久久久久| 亚洲欧美综合网| 日韩综合在线视频| 国产成人av一区| 欧美日韩高清在线| 国产精品入口麻豆九色| 亚洲五码中文字幕| 国产高清不卡一区二区| 欧美色精品在线视频| 亚洲国产精品成人综合色在线婷婷| 一区二区三区视频在线看| 国产一区在线看|