基本操作就是将要分类的文本用正则匹配一下
之后迭代成列表去重一下,得到 vocab
(后期训练的时候也要使用,这个正则表达式,否则字符不在vocab中无法编码)
接着进行编码,就是一个字符也就是中文和标点符号用一个数字代表
形成一个字典word2id 例如 { “你”:0}
其实各种格式和存储方式的训练数据集,考验的就是你的python 基本功好不好
也就是数据结构的和数据类型的处理.本人因为从事过RPA ,经常要爬虫处理各种数据,练就了超强的基本功,所以对于任何文件都能处理成想要的格式
接下来就秀一波代码:

import math
import torch
import numpy as np
import torch.nn as nn
import torch.optim as optim
import torch.utils.data as Data

大话中文文本分类之前数据处理相关推荐

  1. 大话中文文本分类之TextRCNN

    # coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...

  2. 大话中文文本分类之Transformers

    import torch import torch.nn as nn import torch.nn.functional as F import numpy as np import copycla ...

  3. 大话中文文本分类之TextRNN_ATT

    # coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...

  4. 大话中文文本分类之TextRNN

    # coding: UTF-8 import torch import torch.nn as nn import numpy as npclass Config(object):"&quo ...

  5. 大话中文文本分类之fastText

    # coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...

  6. 大话中文文本分类之DPCNN

    # coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...

  7. 大话中文文本分类之textCNN

    # coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...

  8. TensorFlow使用CNN实现中文文本分类

    TensorFlow使用CNN实现中文文本分类 读研期间使用过TensorFlow实现过简单的CNN情感分析(分类),当然这是比较low的二分类情况,后来进行多分类情况.但之前的学习基本上都是在英文词 ...

  9. Pytorch TextCNN实现中文文本分类(附完整训练代码)

    Pytorch TextCNN实现中文文本分类(附完整训练代码) 目录 Pytorch TextCNN实现中文文本分类(附完整训练代码) 一.项目介绍 二.中文文本数据集 (1)THUCNews文本数 ...

最新文章

  1. 数据结构与算法:01 绪论
  2. 小型服务器的操作系统,小型机服务器的操作系统
  3. 迷宫(信息学奥赛一本通-T1215)
  4. [转]数据中心网络虚拟化 隧道技术
  5. 预备作业03 20162316刘诚昊
  6. iot会议纪要 20180105
  7. python画两条曲线_python 实现将多条曲线画在一幅图上的方法
  8. 我只用了3步,实现了一个逼真的3D场景渲染
  9. c语言中1%3c%3c2 什么意思,c语言练习题
  10. Java实现一个订餐外卖系统
  11. 大学计算机未来五年规划,大学生活评价与未来五年计划(8页)-原创力文档
  12. 黑苹果常见问题博文及网页部分集锦
  13. GEE_List基础总结
  14. 第十届蓝桥杯单片机组(省赛)——试题解答
  15. 数据预处理Part2——数据标准化
  16. 大电流导电滑环用途的介绍
  17. jenkins自动构建部署vue
  18. linux上的社交软件下载,探探交友app免费版-探探交友真实app下载v4.2.9.2-Linux公社...
  19. 同比环比日期计算、本周一、本周日、上周一、上周日(mysql)
  20. Android 应用内多进程实现 单APK应用多进程

热门文章

  1. 吴恩达深度学习代码_吴恩达深度学习笔记(58)-深度学习框架Tensorflow
  2. python安装方法32位_Python-3.9.0 安装教程【64位/32位】
  3. linux mysql解锁账号密码忘了怎么办,linux下mysql忘记密码怎么办
  4. 安卓连接mysql客户端_安卓客户端与mysql服务器端数据交互
  5. 长连接测试_如何选择好一根测试电缆组件?
  6. python中rand和randn_rand、randn、randi区别及用法
  7. git 合并代码_git的几种实用操作(合并代码与暂存复原代码)
  8. zabbix mysql 8g优化_Zabbix分区优化
  9. mysql 指定日期条件求和_如何在mysql中按每个日期对字段进行求和-问答-阿里云开发者社区-阿里云...
  10. 如何更改jupyter notebook默认存储路径