从xml中提取的,文件格式为tsv,和csv差不多,可以转为其他格式

链接:https://pan.baidu.com/s/1lDiuvpbT5qPc_uJJs0cPUQ
提取码:t5i7

import  xml.dom.minidom
import csv
import pandas as pd# 1. 创建文件对象
f = open('Nlpcc2013Train.tsv','a+',encoding='utf-8',newline='')# 2. 基于文件对象构建 csv写入对象
csv_writer = csv.writer(f)
csv_writer.writerow(['标签','文本'])#打开xml文档
dom = xml.dom.minidom.parse('Nlpcc2013/微博情绪样例数据V5-13.xml')#得到文档元素对象
root = dom.documentElement
wb=dom.getElementsByTagName('weibo')for i in range(len(wb)):wbi=wb[i]sens=wbi.getElementsByTagName('sentence')for j in range(len(sens)):senj=sens[j]if senj.firstChild is None:continueif senj.hasAttribute('emotion-1-type'):em=senj.getAttribute('emotion-1-type')else:em='none'text=senj.firstChild.datacsv_writer.writerow([em,text])f.close()
在这里插入代码片

NLPcc2013-2014微博文本情感分类数据集相关推荐

  1. 疫情微博文本情感分类 (简化版SMP2020赛题)

    编者按 代码仅供参考,欢迎交流:请勿用于任何形式的课程作业.如有任何错误,敬请批评指正~ Pytorch系列文章: Pytorch实验一:从零实现Logistic回归和Softmax回归 Pytorc ...

  2. 学习微博中情感分类的句子表达(NLPCC2013)

    学习微博中情感分类的句子表达(NLPCC2013) Learning sentence representation for emotion classification on microblogs ...

  3. 中文文本情感分类实战(weibo_senti_100k为数据集)

    中文文本情感分类 数据准备 加载数据集 搭建模型结构 训练脚本的搭建 测试脚本的编写 数据准备 使用jieba分词 data_processing.py import jiebadata_path = ...

  4. bert中文文本情感分类 微博评论挖掘之Bert实战应用案例-文本情感分类

    Bert模型全称Bidirectional Encoder Representations from Transformers,主要分为两个部分:1训练语言模型(language model)的预训练 ...

  5. python微博文本分析_微博评论挖掘之Bert实战应用案例-文本情感分类

    Bert模型全称Bidirectional Encoder Representations from Transformers,主要分为两个部分:1训练语言模型(language model)的预训练 ...

  6. 中文文本情感分类及情感分析资源大全

    摘要:20世纪初以来,文本的情感分析在自然语言处理领域成为了研究的热点,吸引了众多学者越来越多的关注.对于中文文本的情感倾向性研究在这样一大环境下也得到了显著的发展.本文主要是基于机器学习方法的中文文 ...

  7. 基于Bert的文本情感分类

    详细代码已上传到github: click me 摘  要:     情感分类是对带有感情色彩的主观性文本进行分析.推理的过程,即分析说话人的态度,推断其所包含的情感类别.传统机器学习在处理情感分类问 ...

  8. 基于pytorch的Bi-LSTM中文文本情感分类

    基于pytorch的Bi-LSTM中文文本情感分类 目录 基于pytorch的Bi-LSTM中文文本情感分类 一.前言 二.数据集的准备与处理 2.1 数据集介绍 2.2 文本向量化 2.3 数据集处 ...

  9. 循环神经网络实现文本情感分类之使用LSTM完成文本情感分类

    循环神经网络实现文本情感分类之使用LSTM完成文本情感分类 1. 使用LSTM完成文本情感分类 在前面,使用了word embedding去实现了toy级别的文本情感分类,那么现在在这个模型中添加上L ...

最新文章

  1. python能不能连等赋值_javascript 连等赋值问题
  2. Error In Work
  3. Windows保护模式学习笔记(三)—— 长调用/短调用/调用门
  4. eclipse的任务列表
  5. su - 提示失败问题[su方式]
  6. I/O----复制文本文件
  7. add in Web.config
  8. Python 之操作so动态库
  9. VLC框架总结(二)VLC源码及各modules功能介绍
  10. 解析数论 1: Fourier积分和Fourier变换
  11. uniapp 即时通讯_uniapp中与webview的即时通讯
  12. 如何在网上挣钱,这几个项目让你月入过万元
  13. Unity透明度不叠加
  14. 12.3 文本查询程序
  15. 分形吧matlab,使用matlab画分形图.pdf
  16. C/C++路面导航系统[2023-01-16]
  17. android自定义大括弧
  18. thinkpad e450 win7黑苹果macos 10.10.5(网/显/声卡驱动)安装成功
  19. 函数模板和类模板详解
  20. 发帖添加作者水印插件无法发帖问题-缺少GD库支持,php如何安装gd库-一颗优雅草科技伊凡

热门文章

  1. oracle时间相减得到天_oracle中计算两个日期之间得天数、月数、年数
  2. 微软的exchange服务器和域怎么填,配置远程域属性: Exchange 2010 帮助 | Microsoft Docs...
  3. 【官方文档】Fluent Bit 简介
  4. Bootstrap(包括scss)复习
  5. 剑指offe——61序列化二叉树(Python)
  6. Springboot简便的配置微信小程序
  7. 小试ESP8266(一) 一只电阻, 几条语句, 摆脱深度睡眠反复重启的困扰
  8. 2022年北京首店补贴及首店首发项目征集申报情况介绍,补贴200万
  9. 龙威ol服务器维护是什么意思,《龙威OL》六大职业定位介绍
  10. Kubernetes Egress 网络策略指南