1. 使用大数据,了解怎么处理数据不能一次全部加载到内存的情况。如果你内存充足,当我没说
  2. 训练好的模型的保存和使用
  3. 使用的模型没变,还是简单的feedforward神经网络(update:添加CNN模型)
  4. 如果你要运行本帖代码,推荐使用GPU版本或强大的VPS,我使用小笔记本差点等吐血
  5. 后续有关于中文的练习《TensorFlow练习13: 制作一个简单的聊天机器人》《TensorFlow练习7: 基于RNN生成古诗词》《TensorFlow练习18: 根据姓名判断性别》

在正文开始之前,我画了一个机器学习模型的基本开发流程图:

TensorFlow练习2: 对评论进行分类

使用的数据集

使用的数据集:http://help.sentiment140.com/for-students/ (情绪分析)

数据集包含1百60万条推特,包含消极、中性和积极tweet。不知道有没有现成的微博数据集。

数据格式:移除表情符号的CSV文件,字段如下:

  • 0 – the polarity of the tweet (0 = negative, 2 = neutral, 4 = positive)
  • 1 – the id of the tweet (2087)
  • 2 – the date of the tweet (Sat May 16 23:58:44 UTC 2009)
  • 3 – the query (lyx). If there is no query, then this value is NO_QUERY.
  • 4 – the user that tweeted (robotickilldozr)
  • 5 – the text of the tweet (Lyx is cool)

training.1600000.processed.noemoticon.csv(238M)
testdata.manual.2009.06.14.csv(74K)

数据预处理

上面代码把原始数据转为training.csv、和tesing.csv,里面只包含label和tweet。lexcion.pickle文件保存了词汇表。

如果数据文件太大,不能一次加载到内存,可以把数据导入数据库

Dask可处理大csv文件

开始漫长的训练

上面程序占用内存600M,峰值1G。

运行:

TensorFlow练习2: 对评论进行分类

训练模型保存为model.ckpt。

使用训练好的模型

上面使用简单的feedfroward模型,下面使用CNN模型

使用了CNN模型之后,准确率有了显著提升。

TensorFlow练习2: 对评论进行分类相关推荐

  1. TensorFlow 系列案例(3): 使用TensorFlow DNN分类器对数据进行分类

    TensorFlow 卷积神经网络系列案例(1):猫狗识别 https://blog.csdn.net/duan_zhihua/article/details/81156693 TensorFlow ...

  2. 4.使用Keras和Tensorflow Hub对电影评论进行文本分类

    使用Keras和Tensorflow Hub对电影评论进行文本分类 本指南使用tf.keras(一个在TensorFlow中用于构建和训练模型的高级API)和tensorflow_hub(一个用于在一 ...

  3. python电影评论情感分析_20行Tensorflow代码实现电影评论情感分析

    原标题:20行Tensorflow代码实现电影评论情感分析 背景 情感分析有很多的应用场景,比如做一个电商网站,卖家需要时刻关心用户对于商品的评论是否是正面的.再比如做一个电影的宣传和策划,电影在键盘 ...

  4. Tensorflow搭建LSTM对文本进行分类

    rnn_model.py: #!/usr/bin/python # -*- coding: utf-8 -*-import tensorflow as tfclass TRNNConfig(objec ...

  5. Tensorflow(2.0+) 对五类医学图像进行分类

    文章目录 前言 一,导入 TensorFlow 和其他库 二,加载并探索数据集 1,浏览数据集 2,加载图像的路径 3,可视化一些图像 三, 创建数据集 1,为加载器定义一些参数: 2,在开发模型时, ...

  6. 端到端机器学习_端到端机器学习项目:评论分类

    端到端机器学习 In this article, we will go through a classification problem that involves classifying a rev ...

  7. 基于Tensorflow的神经网络解决用户流失概率问题

    沙韬伟,苏宁易购高级算法工程师. 曾任职于Hewlett-Packard.滴滴出行. 数据学院特邀讲师. 主要研究方向包括风控.推荐和半监督学习.目前专注于基于深度学习及集成模型下的用户行为模式的识别 ...

  8. 【Keras】Win10系统 + Anaconda+TensorFlow+Keras 环境搭建教程

    1. 安装 Anaconda 打开 Anaconda 的官方下载地址:https://www.anaconda.com/download/ 选择 Python 对应的version 下载.下载完成后直 ...

  9. Win10系统Anaconda+TensorFlow+Keras 环境搭建教程

    红色石头的个人网站:redstonewill.com 前天我在公众号推荐了<Python Deep Learning>这本书.该书是由 Keras 作者写的,所以全书基本围绕着 Keras ...

最新文章

  1. 聚焦与发散——浅谈编程的发展方向
  2. 基于Flume的美团日志收集系统(二)改进和优化
  3. redis的多路复用是什么鬼
  4. 2015-2月的小程序们
  5. Nginx学习之十二-负载均衡-加权轮询策略剖析
  6. Java实现 给定三个 int 变量, 求其中的最大值和最小值
  7. C#点滴 – 内建基本类型
  8. 【渝粤教育】电大中专药剂学基础知识作业 题库
  9. 游戏动作3d模型素材推荐 精品 小众
  10. 【95】太空射击游戏——玩家代码
  11. CSS基础教程 -- 媒体查询屏幕适配
  12. windows各类密码搜集
  13. (转)通过Net-Speeder为***提升网速
  14. 10月各国最新签证及入境政策汇总
  15. 再谈GC1:GC简介,分代与回收算法
  16. iphone描述文件
  17. c语言指数爆炸月球,指数爆炸带来的震撼
  18. 全面预算管控 提升企业运营管理竞争力
  19. php代码审计备忘录
  20. linux 无线上网 命令

热门文章

  1. mysql去掉两个最高分_从MySQL中的单列获取最高得分值,从两列获取最高得分值...
  2. 网页中的盒模型css属性,详解CSS中的Box Model盒属性的使用
  3. [转帖]在SQL SERVER中实现RSA加密算法
  4. TensorFlow固化模型+打包程序+web API
  5. SwiftStack迎来v5.0,向混合IT规则张开怀抱
  6. Python学习(10)元组
  7. 部署ArcGIS JS API 离线包(Tomcat与IIS)
  8. aix-syslog
  9. jQuery JavaScript库达到新的里程碑
  10. 关于OpenGL ES 3D 光晕如何产生的自我理解