亚洲国产爱久久全部精品_日韩有码在线播放_国产欧美在线观看_中文字幕不卡在线观看

Skip to content

microsoft/MPNet

MPNet

MPNet: Masked and Permuted Pre-training for Language Understanding, by Kaitao Song, Xu Tan, Tao Qin, Jianfeng Lu, Tie-Yan Liu, is a novel pre-training method for language understanding tasks. It solves the problems of MLM (masked language modeling) in BERT and PLM (permuted language modeling) in XLNet and achieves better accuracy.

News: We have updated the pre-trained models now.

Supported Features

  • A unified view and implementation of several pre-training models including BERT, XLNet, MPNet, etc.
  • Code for pre-training and fine-tuning for a variety of language understanding (GLUE, SQuAD, RACE, etc) tasks.

Installation

We implement MPNet and this pre-training toolkit based on the codebase of fairseq. The installation is as follow:

pip install --editable pretraining/
pip install pytorch_transformers==1.0.0 transformers scipy sklearn

Pre-training MPNet

Our model is pre-trained with bert dictionary, you first need to pip install transformers to use bert tokenizer. We provide a script encode.py and a dictionary file dict.txt to tokenize your corpus. You can modify encode.py if you want to use other tokenizers (like roberta).

1) Preprocess data

We choose WikiText-103 as a demo. The running script is as follow:

wget https://s3.amazonaws.com/research.metamind.io/wikitext/wikitext-103-raw-v1.zip
unzip wikitext-103-raw-v1.zip

for SPLIT in train valid test; do \
    python MPNet/encode.py \
        --inputs wikitext-103-raw/wiki.${SPLIT}.raw \
        --outputs wikitext-103-raw/wiki.${SPLIT}.bpe \
        --keep-empty \
        --workers 60; \
done

Then, we need to binarize data. The command of binarizing data is following:

fairseq-preprocess \
    --only-source \
    --srcdict MPNet/dict.txt \
    --trainpref wikitext-103-raw/wiki.train.bpe \
    --validpref wikitext-103-raw/wiki.valid.bpe \
    --testpref wikitext-103-raw/wiki.test.bpe \
    --destdir data-bin/wikitext-103 \
    --workers 60

2) Pre-train MPNet

The below command is to train a MPNet model:

TOTAL_UPDATES=125000    # Total number of training steps
WARMUP_UPDATES=10000    # Warmup the learning rate over this many updates
PEAK_LR=0.0005          # Peak learning rate, adjust as needed
TOKENS_PER_SAMPLE=512   # Max sequence length
MAX_POSITIONS=512       # Num. positional embeddings (usually same as above)
MAX_SENTENCES=16        # Number of sequences per batch (batch size)
UPDATE_FREQ=16          # Increase the batch size 16x

DATA_DIR=data-bin/wikitext-103

fairseq-train --fp16 $DATA_DIR \
    --task masked_permutation_lm --criterion masked_permutation_cross_entropy \
    --arch mpnet_base --sample-break-mode complete --tokens-per-sample $TOKENS_PER_SAMPLE \
    --optimizer adam --adam-betas '(0.9,0.98)' --adam-eps 1e-6 --clip-norm 0.0 \
    --lr-scheduler polynomial_decay --lr $PEAK_LR --warmup-updates $WARMUP_UPDATES --total-num-update $TOTAL_UPDATES \
    --dropout 0.1 --attention-dropout 0.1 --weight-decay 0.01 \
    --max-sentences $MAX_SENTENCES --update-freq $UPDATE_FREQ \
    --max-update $TOTAL_UPDATES --log-format simple --log-interval 1 --input-mode 'mpnet'

Notes: You can replace arch with mpnet_rel_base and add command --mask-whole-words --bpe bert to use relative position embedding and whole word mask.

Notes: You can specify --input-mode as mlm or plm to train masked language model or permutation language model.

Pre-trained models

We have updated the final pre-trained MPNet model for fine-tuning.

You can load the pre-trained MPNet model like this:

from fairseq.models.masked_permutation_net import MPNet
mpnet = MPNet.from_pretrained('checkpoints', 'checkpoint_best.pt', 'path/to/data', bpe='bert')
assert isinstance(mpnet.model, torch.nn.Module)

Fine-tuning MPNet on down-streaming tasks

Acknowledgements

Our code is based on fairseq-0.8.0. Thanks for their contribution to the open-source commuity.

Reference

If you find this toolkit useful in your work, you can cite the corresponding papers listed below:

@article{song2020mpnet,
    title={MPNet: Masked and Permuted Pre-training for Language Understanding},
    author={Song, Kaitao and Tan, Xu and Qin, Tao and Lu, Jianfeng and Liu, Tie-Yan},
    journal={arXiv preprint arXiv:2004.09297},
    year={2020}
}

Related Works

About

MPNet: Masked and Permuted Pre-training for Language Understanding https://arxiv.org/pdf/2004.09297.pdf

Resources

License

Code of conduct

Contributing

Security policy

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published
亚洲国产爱久久全部精品_日韩有码在线播放_国产欧美在线观看_中文字幕不卡在线观看

    
    

    9000px;">

      
      

      国产中文字幕久久| 无码人妻aⅴ一区二区三区| 国产三级漂亮女教师| 国产探花在线免费观看| 免费的毛片视频| 日韩视频在线观看一区| 午夜视频免费在线| 一级黄色大片网站| 国产又黄又爽又色| 男人天堂av电影| 一区二区在线免费看| 亚洲一区二区三区日韩| www.色小姐com| 精品在线免费观看视频| 日韩三级小视频| 自拍视频一区二区| 国产精品777777| 男人的天堂av网| 中文字幕在线2021| 国产成人精品亚洲男人的天堂| 久久激情免费视频| 少妇一级淫免费放| 911亚洲精选| 久久高清内射无套| 午夜视频在线网站| www.色天使| 女人18毛片水真多18精品| 中文字幕av影视| 国产人妻精品一区二区三| 日本黄色不卡视频| 91在线视频观看免费| 可以免费看av的网址| 在线观看av大片| 国产成人麻豆精品午夜在线| 日本成人在线免费| 91精品国自产在线偷拍蜜桃| 狠狠热免费视频| 在线观看国产精品入口男同| 国产裸体永久免费无遮挡| 色天使在线视频| wwwww黄色| 熟女人妻一区二区三区免费看| 91精品国产高清一区二区三密臀 | 在线观看成人毛片| 国产美女免费网站| 手机看片日韩av| 国产伦精品一区二区三区视频女 | 亚洲中文字幕一区| 久草福利资源在线观看| 最近中文字幕在线视频| 精品少妇一二三区| ,一级淫片a看免费| 日本在线不卡一区二区| 国产精品久久久久毛片| 在线观看免费成人av| 美女被艹视频网站| av五月天在线| 午夜免费一级片| 久久精品日韩无码| 一级黄色片在线观看| 日本成人免费视频| 国产亚洲成人av| 亚洲精品一区二区二区| 日本高清不卡免费| 国产一级淫片久久久片a级| 亚洲精品无码久久久久| 婷婷综合在线视频| 久久久久无码精品| 国产激情第一页| 亚洲国产成人精品一区二区三区| 久久久久成人精品无码| jizz欧美性20| 亚洲激情视频小说| 污污污www精品国产网站| 久久精品无码人妻| 丰满人妻一区二区三区免费| 中文在线最新版天堂| 人妻无码中文字幕免费视频蜜桃| 国产午夜精品久久久久| 97人人爽人人爽人人爽| 中文字幕一二三区| 四虎成人永久免费视频| 欧美激情国内自拍| 精品一区二区视频在线观看| 粉嫩av蜜桃av蜜臀av| 亚洲一区二区乱码| 中文字幕精品一区二| 色姑娘综合天天| 强迫凌虐淫辱の牝奴在线观看| 黄色av一区二区三区| 99这里有精品视频| 5566中文字幕| 亚洲色图欧美日韩| 最近中文字幕在线免费观看| 午夜美女福利视频| 无码人妻精品一区二区三区温州| 日韩成人免费观看| 欧美三级视频网站| 欧美精品一区二区蜜桃| 久久久久亚洲av无码a片| 久草视频在线免费看| 黄色av网站免费| 精品深夜av无码一区二区老年| 国产一二三区精品| 波多野结衣一区二区在线| 97超碰在线免费观看| av老司机久久| 成人黄色一级大片| 东京热一区二区三区四区| 大吊一区二区三区| 国产情侣av在线| 激情五月婷婷基地| 免费黄色在线网址| 日韩欧美亚洲另类| 天堂av网手机版| 中国特级黄色片| 亚洲永久精品ww.7491进入| 91精品999| 国产精品密蕾丝袜| 加勒比综合在线| 欧美日韩精品亚洲精品| 色婷婷在线视频| 在线免费视频a| 91极品尤物在线播放国产| 国产精品suv一区二区| 黄色免费一级视频| 欧美一级淫片aaaaaa| 天堂在线中文视频| 亚洲国产欧美日韩在线| 波多野结衣不卡| 久久r这里只有精品| 日韩av免费播放| 最近免费中文字幕大全免费版视频 | 亚洲一区二区三区网站| 91杏吧porn蝌蚪| 国产亚洲欧美久久久久| 欧美精品久久久久久久久46p| 天堂中文在线观看视频| 亚洲女人久久久| 国产日韩欧美在线观看视频 | 中文字幕a级片| 成人午夜视频精品一区| 久久久久久久麻豆| 性欧美丰满熟妇xxxx性久久久| 一级特黄特色的免费大片视频| 国产无遮挡又黄又爽又色| 日本黄色大片视频| 亚洲永久无码7777kkk| 国产亚洲欧美久久久久| 日韩精品一卡二卡| 91精品少妇一区二区三区蜜桃臀 | 亚洲狼人综合干| 国产亚洲精品精品精品| 日韩福利视频在线| 一级黄色片网站| 麻豆久久久久久久久久| 中文在线第一页| 国内外成人免费在线视频| 婷婷五月精品中文字幕| www.色婷婷.com| 日本特黄一级片| 99热在线观看精品| 日本一二三不卡视频| 18禁一区二区三区| 欧美精品一区二区蜜桃| 亚洲自拍一区在线观看| 欧美 日韩 成人| av影片在线播放| 日产亚洲一区二区三区| 国产91在线播放九色| 天天操天天舔天天射| 国产黄色网址在线观看| 五月天六月丁香| 国产亚洲欧美久久久久| 最新一区二区三区| 免费观看毛片网站| 北岛玲一区二区| 视频区 图片区 小说区| 国产午夜精品一区二区理论影院| 亚洲大片免费观看| 久久久久精彩视频| a一级免费视频| 午夜福利一区二区三区| 精品小视频在线观看| 一二三四区在线| 无码人妻丰满熟妇精品| 精品人妻一区二区免费视频| 亚洲视频在线观看免费视频| 日韩精品在线免费看| 国产三级短视频| 中文字幕在线网站| 日本成人免费视频| 黄色av小说在线观看| 一本在线免费视频| 午夜成人免费影院| 毛片视频网站在线观看| 国产精品嫩草69影院| 97人妻一区二区精品免费视频| 五月天福利视频| 情侣偷拍对白清晰饥渴难耐|