这里讲解如何使用KH Coder。整个过程不需要编程知识。

有两种导入数据的方式,第一种是将所有的文字放到一个txt文件中;第二种是将文字放到多个txt文件中,这些文件放到一个文件夹下。因为第二种更加常见,所以这里以后者作为例子来说明。

软件下载路径请看本人这一篇哦:https://liangyihuai.blog.csdn.net/article/details/104373581
本软件默认是英文界面的,按照下图方式设置中文,重启该软件即可。

本人将多个中文新闻数据保存在多个txt文件中,所有的文件都在一个文件夹中。如下图所示。

打开其中一个,结果如下图所示。这里文字的格式不重要,只要是中文的,每一个句子不超过65535个就ok。

导入数据,选中txt文件所在的文件夹。


有一些词是我们必须包含进来的,因为该软件不识别某一些词,比如新冠病毒,新冠肺炎

不勾选形容词,副词,介词

设置中断词或者中断符号,比如“的”,“啊”,这些对我们文本分析是没有意义的词语。可以从文末找到下载中文中断词的下载链接。


到这里,准备工作已经做好了,我们需要执行一下预处理。

等了几分钟

接下来我们就可以看到一些美丽的漂亮的可爱的结果了。一般是在“工具”,“词汇”中,如下图,读者可以自个儿点击查看。这里我们点击“网络”。


下图中默认的“绘图数”是60,我把它设置为200,结果如下图。


看看多维尺度构成发,结果如下图。

请读者自行探索其它的功能吧。更多图片还可以参考本人的上一篇文章哦 https://liangyihuai.blog.csdn.net/article/details/104373581

总结:
上面的所有操作无需编程,简单易懂;
缺点嘛,有点慢,因为这个软件是使用java语言写的。
本人一次性预处理四千个新闻数据,花了半个小时,嗯 …

中文stopwords的下载地址:https://download.csdn.net/download/liangyihuai/13994713
如果不使用stopwords的话,会影响文本分析的效果哦

不需编程/无需写代码的中文英文文本分析教程,免费傻瓜式,多图预警相关推荐

  1. 无需写代码的高颜值富集分析神器

    富集分析是了解一个基因集功能倾向性的一个方式,在组学研究领域应用广泛.常见的有基于差异基因的Over-representation分析,也就是常说的GO.KEGG富集分析和Functional cla ...

  2. 在学习计算机编程不写代码_使用代码创建:通过制作游戏来学习和教授计算机编程

    在学习计算机编程不写代码 Create with Code is Unity Education's new, free program for teaching and learning compu ...

  3. python可视化拖拽平台_PythonEditor可视化拼插编辑器:编程不用写代码,拖拖拽拽就可以!...

    <新一代人工智能发展规划>明确指出人工智能成为国际竞争的新焦点. 应逐步全民智能教育项目, 在中小学阶段设置人工智能相关课程, 逐步推广编程教育, 鼓励社会力量参与寓教于乐的编程教学软件. ...

  4. 写代码用什么笔记本_1—2千预算,编程、写代码、办公、PS修图笔记本推荐/选购指南...

    程序员老鸟都说,学编程任何电脑都可以,有屏幕能打字就行.用记事本都能写. 一哥认为,如果大一大二学基础,学算法,数据结构,学习相关的软件/框架使用,又不用跑大的IDE,服务器,虚拟机,编程语言只是写写 ...

  5. RPA(影刀)无需写代码抓取某东的商品信息

    大家好,我是翔宇! 有的小伙伴不会写代码,但也想采集一些数据,RPA就是一个最好的选择.今天我就带大家用RPA(影刀)无需写代码抓取某东的商品信息,主要采集到的数据有以下字段,数据达到近5000条. ...

  6. 使用google的bert结合哈工大预训练模型进行中文/英文文本二分类,基于pytorch和transformer

    使用bert的哈工大预训练模型进行中文/英文文本二分类,基于pytorch和transformer 前提 简要介绍 开始 导入必要的包和环境 准备并读取数据 导入模型的tokenizer 对数据进行t ...

  7. 中文/英文 文本相似度/文本推理/文本匹配数据集汇总(SNLI、MSRP、MultiNLI、Quora、SciTail、SICK、STS、CCKS2018、LCQMC、OCNLI、XNLI)

    中文/英文 文本相似度/文本推理/文本匹配数据集汇总(SNLI.MSRP.MultiNLI.Quora.SciTail.SICK.STS.CCKS2018.LCQMC.OCNLI.XNLI) 1. 所 ...

  8. What-If 工具:无需写代码,即可测试机器学习模型

    文 / Google AI 软件工程师 James Wexler 构建有效的机器学习 (ML) 系统需要提出许多问题.仅仅训练一个模型,然后放任不管,是远远不够的.而优秀的开发者就像侦探一样,总是不断 ...

  9. 无需写代码!谷歌推出机器学习模型分析神器,代号What-If

    铜灵 编译整理 量子位 出品 | 公众号 QbitAI 今天,谷歌推出了已开源的TensorFlow可视化工具TensorBoard中一项新功能:What-If Tool,用户可在不编写程序代码的情况 ...

最新文章

  1. Web网站的性能测试工具
  2. 五大常用算法之五:分支限界法
  3. Flex 当鼠标悬停在DataGrid某行上时用datatoolField显示当前行
  4. webpack --- html-webpack-plugin
  5. linux之 !!命令
  6. 日志-周报-月报(2019年2月)
  7. java 析构函数_C++虚函数
  8. OpenVR——驱动接口之IClientTrackedDeviceProvider简介
  9. 如何看待小米10的葫芦屏?
  10. 重要且紧急:总以为这是最后一个短板,新的短板又出现了
  11. 软考中级数据库系统工程师备考经验分享
  12. java 高斯投影_贡献高斯投影坐标与经纬度转换的java源码
  13. 【转】专利申请前的技术交底书是什么?怎么写?
  14. python图像的手绘效果代码_Python项目1:实现将图片转化为手绘效果
  15. Google快讯-UTStarcom
  16. 深入探究 null 和 undefined 区别
  17. 三层交换技术——精确匹配、最长前缀匹配与最长前缀匹配+主机直接路由
  18. 让windows保持常亮(不息屏,不锁屏,不进入屏保)
  19. MakeFile入门详解
  20. 使用Git向Github上传项目(包含大文件>25mb)

热门文章

  1. linux下mysql日志配置_Linux下MySQL 5.5.21 服务器日志配置
  2. python量化策略代码_手把手教你用三行python 代码做一个动量策略「量化投资系列」...
  3. 用指针、子函数的方法去一维数组中所有元素的平均值,并放在a[0]处
  4. python三维数据转换成二维_Python科学计算全生态工具锦集
  5. Python学习之路29-序列的修改、散列和切片
  6. sharding jdbc sql路由日志
  7. linux文件描述符
  8. python深浅拷贝
  9. 功能强大的 C++ redis 客户端库增加至 acl 项目中
  10. Flume Sinks官网剖析(博主推荐)