大话中文文本分类之前数据处理
基本操作就是将要分类的文本用正则匹配一下
之后迭代成列表去重一下,得到 vocab
(后期训练的时候也要使用,这个正则表达式,否则字符不在vocab中无法编码)
接着进行编码,就是一个字符也就是中文和标点符号用一个数字代表
形成一个字典word2id 例如 { “你”:0}
其实各种格式和存储方式的训练数据集,考验的就是你的python 基本功好不好
也就是数据结构的和数据类型的处理.本人因为从事过RPA ,经常要爬虫处理各种数据,练就了超强的基本功,所以对于任何文件都能处理成想要的格式
接下来就秀一波代码:
import math
import torch
import numpy as np
import torch.nn as nn
import torch.optim as optim
import torch.utils.data as Data
大话中文文本分类之前数据处理相关推荐
- 大话中文文本分类之TextRCNN
# coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...
- 大话中文文本分类之Transformers
import torch import torch.nn as nn import torch.nn.functional as F import numpy as np import copycla ...
- 大话中文文本分类之TextRNN_ATT
# coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...
- 大话中文文本分类之TextRNN
# coding: UTF-8 import torch import torch.nn as nn import numpy as npclass Config(object):"&quo ...
- 大话中文文本分类之fastText
# coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...
- 大话中文文本分类之DPCNN
# coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...
- 大话中文文本分类之textCNN
# coding: UTF-8 import torch import torch.nn as nn import torch.nn.functional as F import numpy as n ...
- TensorFlow使用CNN实现中文文本分类
TensorFlow使用CNN实现中文文本分类 读研期间使用过TensorFlow实现过简单的CNN情感分析(分类),当然这是比较low的二分类情况,后来进行多分类情况.但之前的学习基本上都是在英文词 ...
- Pytorch TextCNN实现中文文本分类(附完整训练代码)
Pytorch TextCNN实现中文文本分类(附完整训练代码) 目录 Pytorch TextCNN实现中文文本分类(附完整训练代码) 一.项目介绍 二.中文文本数据集 (1)THUCNews文本数 ...
最新文章
- 数据结构与算法:01 绪论
- 小型服务器的操作系统,小型机服务器的操作系统
- 迷宫(信息学奥赛一本通-T1215)
- [转]数据中心网络虚拟化 隧道技术
- 预备作业03 20162316刘诚昊
- iot会议纪要 20180105
- python画两条曲线_python 实现将多条曲线画在一幅图上的方法
- 我只用了3步,实现了一个逼真的3D场景渲染
- c语言中1%3c%3c2 什么意思,c语言练习题
- Java实现一个订餐外卖系统
- 大学计算机未来五年规划,大学生活评价与未来五年计划(8页)-原创力文档
- 黑苹果常见问题博文及网页部分集锦
- GEE_List基础总结
- 第十届蓝桥杯单片机组(省赛)——试题解答
- 数据预处理Part2——数据标准化
- 大电流导电滑环用途的介绍
- jenkins自动构建部署vue
- linux上的社交软件下载,探探交友app免费版-探探交友真实app下载v4.2.9.2-Linux公社...
- 同比环比日期计算、本周一、本周日、上周一、上周日(mysql)
- Android 应用内多进程实现 单APK应用多进程
热门文章
- 吴恩达深度学习代码_吴恩达深度学习笔记(58)-深度学习框架Tensorflow
- python安装方法32位_Python-3.9.0 安装教程【64位/32位】
- linux mysql解锁账号密码忘了怎么办,linux下mysql忘记密码怎么办
- 安卓连接mysql客户端_安卓客户端与mysql服务器端数据交互
- 长连接测试_如何选择好一根测试电缆组件?
- python中rand和randn_rand、randn、randi区别及用法
- git 合并代码_git的几种实用操作(合并代码与暂存复原代码)
- zabbix mysql 8g优化_Zabbix分区优化
- mysql 指定日期条件求和_如何在mysql中按每个日期对字段进行求和-问答-阿里云开发者社区-阿里云...
- 如何更改jupyter notebook默认存储路径