大数据文本分析的应用场景有哪些?
https://www.pmcaff.com/discuss/index/480966354177088?from=related&pmc_param%5Bentry_id%5D=1000000000167873
自问自答一发。之前写过2篇相关的文章:
【数据运营】在运营中,为什么文本分析远比数值型分析重要?(上)
【数据运营】在运营中,为什么文本分析远比数值型分析重要?一个实际案例,五点分析(下)
除了上面那几种应用,这种基于大数据的文本分析还有如下实际应用:
1 传播分析
检索对象在传播趋势和传播渠道上的分析。
- 传播走势
- 传播渠道
2 情感分析
情感分析指的是对文本中情感的倾向性和评价对象进行提取的过程。
基于上百万条社交网络平衡语料和数十万条新闻平衡语料的机器学习模型,结合自主开发的半监督学习技术,正负面情感分析准确度达到80%以上,可以轻松的识别网民对于某一检索对象的好恶倾向,最直接的应用就是品牌口碑检测领域。
3 信息分类
文本信息分类将文本按照预设的分类体系进行自动区分。常见的商业应用前景有:
通过社交网络挖掘商业情报和潜在销售机会;
- 企业内文本数据分析;
- 海量数据筛选;
- 资讯分类;
- 自动标签预测等。
4 典型意见提取
- 微博评论典型意见
- 网民典型评论
典型意见引擎将消费者意见进行单句级别的语义聚合,提取出有代表性的意见。常见的商业应用前景有:
- 消费者调研;
- 电商点评分析;
- 社会热点事件的意见整理。
5 文本聚类
相似文本聚类指的是机器自动对给定的文本进行话题聚类,将语义上相似的内容归为一类。常见的商业应用前景有:
- 海量文档、资讯的整理;
- 话题级别的统计分析。
6 关键词抽取
- 文章关键词抽取
- 用户评论关键词抽取
关键词提取引擎从一篇或多篇文本中提取出有代表性的关键词。关键词提取技术综合考虑词语在文本中的频率,和词语在千万级背景数据中的频率,选择出最具有代表性的关键词并给出相应权重。
可以使用户在如恒河沙数的文本数据中提炼出有价值的信息,节省阅读时间。
7 语义网络分析、知识图谱
通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法引入文本数据分析领域,并结合共现分析手段,可视化语义网络呈现各类文本/信息之间的内在相关关系,时间维度上的动态关系(传播路径)。
- 知识图谱网络
- 传播网络
- 商品关联网络
1.锤子新发布的功能“BigBang”分词功能。也算是大数据文本分析的应用,通过大数据文本分析,才能实现对词义的准确分析,从而做到更准确的分词。
2.网络舆情监控。这也当然是大数据文本分析的产物,提取网络文本的关键词,组成语义网络之后分析语义倾向,达到舆情监控的目的。
3.社交网络情绪监控。相信大家都看到了很多网络上直播自杀、发自杀预报的这样的事情,和舆情监控相同,就是对个人社交网络的信息进行监控,通过文本分析和机器学习的技术,分析出此人的情绪状况,一旦出现极端的负面情绪,可以通过一定的措施避免极端行为的发生。
4.证券行业投资情报获取。可以基于积累的大数据做进一步深层次的分析与挖掘,整合各社交网络、证券讨论社区群体信息提取加工成有价值的证券投资情报,对证券投资行为做辅助分析和预报。
转载于:https://www.cnblogs.com/fengff/p/9930322.html
大数据文本分析的应用场景有哪些?相关推荐
- [转载] Python大数据文本分析及应用
参考链接: 使用Python的SQL 3(处理大数据) 实践课题报告: 大数据文本分析与应用 学 校:xxx 学 院:大数据与智能工程学院 专 业:信息工程(数据科学与大数据技术) 年 级:2017级 ...
- 云小课 | 大数据融合分析:GaussDW(DWS)轻松导入MRS-Hive数据源
摘要:通过建立GaussDB(DWS)与MRS的连接,支持数据仓库服务SQL on Hadoop,以外表方式实现Hive数据的快捷导入,满足大数据融合分析的应用场景. 本文分享自华为云社区<[云 ...
- 《文本大数据情感分析》读书报告
<文本大数据情感分析>(高凯 徐华 王九硕 岳重阳 高成亮著)一书介绍社交网络等海量异构信息采集算法:对文本挖掘与自然语言处理中涉及到情感分析.微博情绪诱因分析.电商产品评价与意见挖掘等内 ...
- 医疗数据治理——构建高质量医疗大数据智能分析数据基础
医疗数据治理--构建高质量医疗大数据智能分析数据基础 阮彤,邱加辉,张知行,叶琪 华东理工大学计算机科学与技术系,上海 200237 摘要:以专病真实世界研究为背景,分析了医疗数据治理和数据可用性 ...
- 一文读懂大数据漏斗分析!
下面我将为您介绍漏斗分析的概念,以及组织及其数据如何使用它来分析大数据集.希望能够帮到你们. 很多时候我们发现我们的业务数据看起来很不错,但最终的转换量却很低,这就说明业务转换率这里有问题.而在数 ...
- 网络优化正在从经验型优化向大数据关联分析优化转变
大数据技术的快速发展,不仅推动通信业务的创新,同时也在给传统网络的建设和运维带来变革.近几年,大数据技术正在越来越多地应用到网络优化中,成为提升网络优化效率,降低网络运营成本的新手段.在日前召开的&q ...
- 大数据在银行业的应用场景
随着银行业务的载体与社交媒体.电子商务的融合越来越紧密,仅对原有15%的结构化数据进行分析已经不能满足发展的需求.企业需要借助大数据战略打破数据 边界,囊括85%的大数据分析,来构建更为全面的企业运营 ...
- 开源大数据查询分析引擎
引言 大数据查询分析是云计算中核心问题之一,自从Google在2006年之前的几篇论文奠定云计算领域基础,尤其是GFS.Map-Reduce.Bigtable被称为云计算底层技术三大基石.GFS.Ma ...
- GitChat · 大数据 | 一步一步学习大数据:Hadoop 生态系统与场景
目录(?)[-] Hadoop概要 Hadoop相关组件介绍 HDFS Yarn Hive HBase Spark Other Tools Hadoop集群硬件和拓扑规划 硬件配置 软件配置 Hado ...
最新文章
- webpack入门(二)what is webpack
- 30个 Web 设计者 必备的免费 PSD UI 工具包
- 数据库事务以及事务的隔离级别
- Linux系统下 Apache+PHP 环境安装搭建
- 数据结构_树与二叉树(mindmap)+LeetCode_100.相同的树(C语言)
- MySql为查询结果添加前、后缀
- 静态HTML网页设计作品——动漫电影《你的名字》(7页) HTML+CSS大作业_ 动漫电网页制作作业_动漫电网页设计...
- How to craw the Info of BiliBIli with python
- 应用锁(AppLocker)原理及代码实现
- laravel 中 使用闭包查询 分开whereIn
- easyui treegrid php,jQuery中关于EasyUI的TreeGrid查询功能的实现
- 黑马程序员还收费 兄弟会都是免费的
- 微软账号登陆不上_登录微软账号的Windows电脑如何远程?
- 位运算相关题目-一些小trick 1bit代表独立数字 求只出现一次的数字 无进位n进制数 n(-n) Boyer-Moore 投票算法 n(n-1)
- 自动上传视频到B站和西瓜视频
- 顺丰笔试-赏金猎人2020-08-20(参考时间最大利益)
- 堆、栈、队列的区别和联系
- 转载:24岁了,做个精致的电子工程师
- 小型数控雕刻机制作Arduino_基于Arduino DIY的激光雕刻机
- python实现整数从低位到高位输出与从高位到低位输出
热门文章
- android parcel空指针,android - intent.hasExtra(“ meta”)抛出错误的可包裹异常 - 堆栈内存溢出...
- cascade=CascadeType.ALL的深坑
- 以普通用户启动的Vim如何保存需要root权限的文件
- 2019后工作机会会更少_在2019年更多地参与和更少地命令
- 如何充分利用开源项目_5个技巧:在开源项目中利用以用户为中心的设计
- (17)css3新增背景属性
- c# c均值聚类及DBSCAN聚类
- 面试 | 程序猿面试,Elasticsearch被坑被虐的体无完肤...
- Bootstrap下拉菜单标题
- HTML mark元素