一、什么是文本挖掘?

讨论文本挖掘之前,我们要先说一下数据挖掘的概念,因为文本挖掘是数据挖掘的一个分支。数据挖掘(Data Mining)指从大量的数据中通过算法搜索隐藏在其中信息的过程。而文本挖掘就是从文本数据中获取有价值的信息和知识的过程,最基本的应用就是实现文本的分类和聚类。

二、文本挖掘有什么用?它和 NLP 有关系吗?

也许有人会疑惑,文本挖掘和 NLP 领域有关系吗?这是必然的!

文本挖掘最基本的应用是文本(文档)的分类、聚类与相似度;信息检索与信息抽取,这两个任务相比大家都很熟悉;同时,文本挖掘子啊文本摘要生成、自动问答等任务中也有所应用,而这些任务也是 NLP 的主要任务。

可见,文本挖掘虽然和 NLP、知识图谱等属于不同的研究方向,但是在技术应用中,很多借鉴与融合之处。文本挖掘涉及很多自然语言处理的模块,同时它也应用于 NLP 领域中多个任务中,利用自然语言处理技术,自动化处理海量文本数据,提升文字处理效率与挖掘深度。

那么,文本挖掘主要的方法有哪些?在工程中又是如何运用这些方法的?


想了解更多,可以参加7月11日20点的《文本挖掘的技术解读与实践》在线公开课,回复:文本挖掘加入课程交流群,领取福利~


三、工程中,文本挖掘怎么做?有哪些方法?

或许有些方法大家有所接触,比如:关键词提取的方法,词频统计与 TF-IDF;用于潜在关系、主题的 LDA 主题建模;上面提到的文本分类工作就可以用统计学习和机器学习的算法实现;文本聚类则是一种无监督机器学习方法;到深度学习时代,深度学习方法自然被运用在文本挖掘中。

不过,从早期的方法、传统机器学习方法到深度学习方法,这么多方法,我们要怎么梳理清他们彼此之间的逻辑?在实际工程中,又是如何运用这些方法的?传统方法和深度学习方法独立运行时发挥哪些作用?什么情况需要把两种方法结合提升效果?

四、文本挖掘怎么学?要掌握哪些必备技能和工具(包)?

刚入门或者想学习这方面的小伙伴们来说,要如何学习文本挖掘?

正在在这个领域中学习,以后要从事相关工作时,企业需要哪方面的技能?

面对这些问题,我们将一一为大家解答!

五、我们为你准备了... ...

2019 年已经进入下半年,AI科技大本营特此为大家准备一系列专业、深度的 AI公开课。

本期公开课,关于《文本挖掘的技术解读与实践》的内容,我们为大家邀请到了达观数据的高翔老师,带领大家深入工程中的文本挖掘技术,他还将带领团队中专门负责传统机器学习、深度学习的小伙伴们为大家逐一攻破困扰你们的算法!

课程信息

主题:深入文本挖掘的技术与实践分享

时间:7 月 11 日 20 点

主讲人:高翔,达观数据联合创始人、文本挖掘组总负责人

课程大纲

1、文本挖掘的基本概念介绍

2、抽取算法概况

3、深入传统抽取算法:算法解读与应用

4、深入深度学习算法:重要模型解读与应用

5、工程实践案例分享:企业落地如何利用这些算法与技术

AI科技大本 2019·下半年 技术公开课正式开启,我们策划了十个技术专题、几十节公开课大礼包,等你来学习,还有学习奖品等你来领~

更多课程学习信息,可扫描下方小助手二维码,回复:文本挖掘加入课程交流群,领取福利~

从0到1 | 文本挖掘的传统与深度学习算法相关推荐

  1. 基于深度学习算法和传统立体匹配算法的双目立体视觉

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 01 立体视觉是什么? 在开始之前,我相信很多站友都会有这个疑问, ...

  2. 传统与深度学习遥感变化监测遥感技术路线与方法

    传统与深度学习遥感变化监测遥感技术路线与方法 基于多时相影像进行地表覆盖变化监测是遥感的一个重要应用,在城市违法建设监测.水政违法建设监测.森林砍伐监测等领域得到广泛应用.由于遥感算法.数据源质量等原 ...

  3. 传统与深度学习图像分割算法

    Blog:https://blog.csdn.net/qq314000558/article/details/81632693 1998年以来,人工神经网络识别技术已经引起了广泛的关注,并且应用于图像 ...

  4. 资源|2019 年 11 月最新《TensorFlow 2.0 深度学习算法实战》中文版教材免费开源(附随书代码+pdf)...

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送 2019 年 10 月,谷歌正式宣布,开源机器学习库 TensorFlow 2.0 现在 ...

  5. 400页《TensorFlow 2.0 深度学习算法实战》中文版教材免费下载(附随书代码+pdf)...

    Tensorflow自谷歌提出以来就成为最受欢迎的深度学习框架之一,到目前为止也已经被下载超过 4000 万次.其中TensorFlow2.0更是修复之前非常多的不人性的特性,备大家欢迎. 今天给大家 ...

  6. TensorFlow 2.0深度学习算法实战 第一章 人工智能绪论

    第一章 人工智能绪论 1.1 人工智能 1.1.1 人工智能 1.1.2 机器学习 1.1.3 神经网络与深度学习 1.2 神经网络发展简史 1.2.1 浅层神经网络 1.2.2 深度学习 1.3 深 ...

  7. 第0章【序】--动手学深度学习【Tensorflow2.0版本】

    项目地址:https://github.com/TrickyGo/Dive-into-DL-TensorFlow2.0 这个项目将<动手学深度学习> 原书中MXNet代码实现改为Tenso ...

  8. CV中,传统视觉算法 vs 深度学习算法

    计算机视觉中, 传统视觉算法,侧重于提取,识别容易量化的特征:颜色.面积.圆度.矩形度,角度.长度等. 深度学习算法,侧重于难于量化的特征:例如瑕疵. 传统视觉算法都是基于人为特征提取得到样本特征库去 ...

  9. 计算机视觉 | 面试题:06、ReLU函数在0处不可导,为什么在深度学习网络中还这么常用?

    问题 ReLU函数在0处不可导,为什么在深度学习网络中还这么常用? 问题背景 这是在阿里的机器学习岗一面的时候问的一个问题,最开始的问题是"为什么机器学习中解决回归问题的时候一般使用平方损失 ...

最新文章

  1. 磁盘驱动读取系统MATLAB仿真,matlab读写..doc
  2. 2_2 递归与分治策略(分治法的基本思想)
  3. Yolov5目标检测模型运行遇到的相关问题汇总
  4. .Net开发WebApi如何使用JObject对象接收参数
  5. 【洛谷P1774】最接近神的人
  6. 2 snippets vue 修改配置_VsCode从零开始配置一个属于自己的Vue开发环境
  7. 图片异步加载框架 Android-Universal-Image-Loader
  8. 如何向普通人解释机器学习、数据挖掘
  9. UML建模与软件开发设计(三)——UML常用开发工具
  10. 软件测试——透过表象看本质
  11. 单片机和4G模块通信总结(EC20)
  12. Vue 浏览器兼容性
  13. 百度地图集成骑行导航和驾车导航
  14. 剑英陪你玩转图形学(一)打通任督二脉
  15. hive 配置参数说明大全
  16. java jacob pdf_java-使用Jacob实现office转换成pdf
  17. metasploit msfvenom与veil绕过杀毒软件
  18. 软件流水和循环展开的区别
  19. autocad2008中文版
  20. Solidity 智能合约入门

热门文章

  1. 编译android不再需要jdk1.5
  2. arcgis server 开发
  3. 如何让li中的标签内容横向排列
  4. php pkcs 1格式的公钥,解说--2--微信支付RSA公钥PKCS1格式转化成PKCS8格式的公钥
  5. c语言逐步搜索法求有根区间,[C语言第五章.ppt
  6. python 图像处理模块pillow
  7. matlab中cumsum函数的使用
  8. PX4修改线程内存大小
  9. 系统动力学_System Dynamics
  10. 阶段1 语言基础+高级_1-3-Java语言高级_02-继承与多态_第5节 final关键字_5_final关键字用于修饰成员变量...