BERT模型:https://github.com/google-research/bert#fine-tuning-with-bert

环境:linux+python3+tensorflow,也有pytorch版。

1、下载:

  • BERT-Base, Chinese: Chinese Simplified and Traditional, 12-layer, 768-hidden, 12-heads, 110M parameters

解压到指定目录。

2、Git Clone下https://github.com/google-research/bert.git

3、输入句子到指定文件:

echo '如图,a、b、c分别是数轴上A、B、C所对应的实数,试化简' > edp/input.txt

4、执行:

python3 bert/extract_features.py \--input_file=edp/input.txt \--output_file=edp/output.json \--vocab_file=chinese_L-12_H-768_A-12/vocab.txt \--bert_config_file=chinese_L-12_H-768_A-12/bert_config.json \--init_checkpoint=chinese_L-12_H-768_A-12/bert_model.ckpt \--layers=-1 \--max_seq_length=128 \--batch_size=8

具体参数参考github上解释。

5、如果有自己特定预料,可以在谷歌训练的模型上再预训练。

参考:https://daiwk.github.io/posts/nlp-bert-code.html#pretrained-model

由于句子长度不一样,token数不一样,每个token的向量长度一样,但token数不一样,一个句子的总体向量长度也就不一样。

Google BERT模型提取句子Token特征相关推荐

  1. 使用transformers框架导入bert模型提取中文词向量

    导言 在笔者的上一篇文章大白话讲懂word2vec原理和如何使用中提到了如何将词语转变成计算机能够识别的语言,即将文本数据转换成计算机能够运算的数字或者向量这个概念,并详细阐述了word2vec这个模 ...

  2. 使用bert模型做句子分类

    使用bert模型微调做下游任务,在goole发布的bert代码和huggingface的transformer项目中都有相应的任务,有的时候只需要把代码做简单的修改即可使用.发现代码很多,我尝试着自己 ...

  3. Pytorch+Google BERT模型(RoBERTa+LSTM+GRU)实战

    Pytorch+Google BERT模型(RoBERTa+LSTM+GRU)实战 BERT(Bidirectional Encoder Representations from Transforme ...

  4. (连载)词向量的理解——BERT模型的句子向量表示

    文章均从个人微信公众号" AI牛逼顿"转载,文末扫码,欢迎关注! word embedding的出现提升了自然语言处理的效果.典型的使用场景就是把高质量的词向量输入到的模型中,通过 ...

  5. BERT模型—5.BERT模型在句子分类任务(意图识别)上的微调

    文章目录 引言 一.项目环境配置 二.数据集介绍 三.代码介绍 四.测试结果 1.代码执行流程 2. 预测流程 数据代码见:https://gitee.com/lj857335332/bert_fin ...

  6. BERT模型—7.BERT模型在句子分类任务上的微调(对抗训练)

    文章目录 引言 二.项目环境配置 二.数据集介绍 三.代码介绍 四.测试 1.代码执行流程 数据代码见:https://gitee.com/lj857335332/bert_finetune_cls_ ...

  7. bert模型简介、transformers中bert模型源码阅读、分类任务实战和难点总结

    bert模型简介.transformers中bert模型源码阅读.分类任务实战和难点总结:https://blog.csdn.net/HUSTHY/article/details/105882989 ...

  8. [Python人工智能] 三十四.Bert模型 (3)keras-bert库构建Bert模型实现微博情感分析

    从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章开启了新的内容--Bert,首先介绍Keras-bert库安装及基础用法及文本分类工作.这篇文章将通过keras- ...

  9. 利用albert模型提取文本标签

    在上文中提到,从文本中提取标签一个多标签多分类的问题.用传统的机器学习分类器,需要通过OneVsRestClassifier进行分类器的转换. bert模型一统NLP问题江湖后,很多研究者也尝试用他解 ...

最新文章

  1. 《OpenCV3编程入门》学习笔记8 图像轮廓与图像分割修复(四)图像的矩
  2. 1行代码搞定Latex公式编写,这个4.6M的Python小插件,堪称论文必备神器
  3. TLE207x低噪声高速JFET-输入运算放大器的噪声特性测量
  4. html DOCUMENT
  5. boost::mp11::mp_less相关用法的测试程序
  6. C/C++ 中嵌入汇编总结
  7. MySQL基础篇(06):事务管理,锁机制案例详解
  8. 求最大公约数c语言代码_辗转相除求最大公约数原理
  9. sqlserver limit
  10. oracle 表复制 long,关于oracle的数据库的数据Long和Number的转化字段
  11. es6-3.webpack应用
  12. 电脑重启只剩下c盘怎么办_电脑突然只剩下c盘了怎么办?
  13. python程序设计基础课后答案-python语言程序设计基础(第2版)课后答案嵩天
  14. 计算机页面尺寸,网页页面尺寸一般设置多大才合适?
  15. 这个机器人还原魔方,只需八秒!
  16. 电池的使用误区、电池损耗修复方法以及笔记本电脑使用注意事项
  17. 声纹识别(一)——简介
  18. ng-content、ng-template、ng-container使用及区别
  19. 中小型电子商务网站架构
  20. 给20块钱买可乐,每瓶可乐3块钱,喝完之后退瓶子可以换回1块钱,问最多可以喝到多少瓶可乐。

热门文章

  1. 哈工程计算机学院领导门志国,电气学院“钥匙工程”第二季:赵洪教授为2018级新生打开专业之门...
  2. Python 里面如何生成随机数?
  3. 解决django配合nginx部署后admin样式丢失
  4. BiliBili 第三方 Android 客户端应用源码
  5. msm8953+android8.1接听电话时声音由默认听筒输出改为外放输出
  6. 不动产登记证书曝光 一个“改变”必须注意(图)
  7. Mtk Android 打包解包*.img
  8. Android Activity形象描述
  9. android 六边形简书,深入理解六边形架构
  10. pythoninput函数作用_学习python之input()函数