【阶段总结】《非结构化信息分析应用与实践(筹)》
《非结构化信息分析应用与实践(筹)》
Part 1.知识储备
一、机器学习
1.几种常见的有监督学习算法
2.几种常见的无监督学习算法
3.数据挖掘基础知识 30 问
二、神经网络与深度学习
1.MP神经网络模型(附实例代码讲解)
2.图解LSTM和GRU
3.图解机器翻译模型:基于注意力机制的 Seq2Seq
三、应用与实践(一)
1.基于时间序列的预测方法
2.利用机器学习算法进行预测分析(一):移动平均(Moving Average)
3.利用机器学习算法进行预测分析(二):线性回归(Linear Regression)
4.利用机器学习算法进行预测分析(三):最近邻(K-Nearest Neighbours)
5.利用机器学习算法进行预测分析(四):自回归差分移动平均模型(AutoARIMA)
6.利用机器学习算法进行预测分析(五):Prophet
7.利用机器学习算法进行预测分析(六):长短时记忆网络(LSTM)
8.基于Streamlit制作的时间序列数据分析APP(上手简单,附可运行源码)
9.如何量化时间序列之间的相似性?
10.利用时间序列聚类细分客户(以电力行业为背景)
Part 2.非结构化信息分析
四、文本分析
1.文本表示(一):One-Hot、BOW、TF-IDF、N-Gram
2.BOW和TF-IDF详解
3.词袋模型在文本分类中的用法
4.文本相似度算法:TF-IDF与BM25
5.利用TextRank算法提取关键词
6.基于TextRank算法的文本摘要
7.图解Word2Vec
8.Gensim核心概念
9.Gensim中的Word2Vec
10.主题建模评估:连贯性分数(Coherence Score)
11.主题建模:基于 LDA 实现
12.主题建模:BERTopic(理论篇)
13.主题建模:BERTopic(实战篇)
14.基于 LDA 和 BERTopic 的 COVID-19 论文内容分析
15.从 “文本” 到 “知识”:信息抽取(Information Extraction)
16.基于scattertext的 “十二五和十三五规划” 文本分析
五、应用与实践(二)
1.基于NLP的电影评论情感分析模型比较
2.情感分析(一):基于 NLTK 的 Naive Bayes 实现
3.情感分析(二):基于 scikit-learn 的 Naive Bayes 实现
4.情感分析(三):基于 Word2Vec 的 LSTM 实现
5.情感分析(四):基于 Tokenizer 和 Word2Vec 的 CNN 实现
6.情感分析(五):基于 BERT 实现
如果有机会,我想写本书,书名如题所示,哈哈!持续更新中!
【阶段总结】《非结构化信息分析应用与实践(筹)》相关推荐
- 非结构化信息-》半结构化-》结构化-》关联数据体系-》数据挖掘-》故事化呈现-》决策导向
非结构化数据介绍来源: 非结构化信息_百度百科 https://baike.baidu.com/item/%E9%9D%9E%E7%BB%93%E6%9E%84%E5%8C%96%E4%BF%A1%E ...
- 2018-3-8(论文--网络评论中的非结构化信息表示与研究)笔记-----基于证据理论的网络评论综合方法
Why 综合评价?? (1)实际的生活中,我们队网络评论进行结构化处理的目的不仅在存储而是试图利用这些信息对产品进行综合的评定 (2)通过综合评定企业可以知道产品在客户心中的地位以及受欢迎的程度,从 ...
- 2018-3-10论文(网络评论非结构化信息表示与应用研究)笔记-----基于证据理论的综合评价模型建立
证据理论证据合成问题 运用证据理论对商品进行综合评价,在对每一条评论给出就决策矩阵的类别值进行分析合成,让后将其看成不同的证据,然后兼顾不同的一家内进行合成 模型表述----评语等级 (2)评论分类 ...
- 分析非结构化数据和非结构化处理
文章目录 一.非结构化数据的定义 二.非结构化处理的重要性 三.数据类型 四.非结构化处理的方法和手段 1. 采集 2. 查询 3. 存储 4. 前景 一.非结构化数据的定义 非结构化数据是数据结构不 ...
- 分析非结构化数据的10个步骤
如今,数据分析正在成为企业发展的重要组成部分.企业必须对结构化和非结构化数据有所了解,才能更好地为业务发展做出正确决策.以下是帮助企业分析非结构化数据的10个步骤: 0 1 确定一个数据源 了解有利于 ...
- 2018-3-12论文(非结构化网络中有价值信息数据挖掘研究)笔记一总体思路以及三种目前进行价值信息挖掘的研究思想
文章主要的内容: 提出了基于关联规则的非结构化网路中有价值信息数据挖掘的方法 总体的思想: (1)利用特征提取的方法进行初步的分类与识别,提取出不同文本类型的特征, (2)利用关联规则方法计算各个类型 ...
- 非结构化数据定义、处理方法及重要性
一.非结构化数据定义 不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档. 文本.图片. 标准通用标记语言下的子集 XML. HTML.各类报表.图像和音频/视频信息等等. ...
- 详解非结构化数据(文档)安全管理解决方案
随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位.日常的业务过程中,需要处理的大量电子文档.图片.音频.视频等,都属于内容数据范畴. 例如,某银行的无人营业网点的远程业务办理中, ...
- 非结构化数据治理方案
随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位.日常的业务过程中,需要处理的大量电子文档.图片.音频.视频等,都属于内容数据范畴. 例如,某银行的无人营业网点的远程业务办理中, ...
最新文章
- Error creating bean with name 'messageSource' defi
- 增删改查 HTML表格页面,表格增删改查.html
- 有关绑定没有数据显示的问题
- 魔兽世界高法伤技能列表
- 数据源配置和自动管理
- java asin_Java asin()方法
- 前端学习(2798):实现图片预览的效果
- lambda python_Python | Lambda和filter()与示例
- Spring Boot 项目的这些文件都是干啥用的?
- 李飞飞新动向:创建斯坦福“以人为本AI研究院”,担任共同院长
- 【Notification】屏蔽特定应用的通知提示
- WEB前端(4)—— CSS经典案例(DIV+CSS布局)
- Trying to create too many scroll contexts. Must be less than or equal to: [500]
- indesign用于产品排班_怎样利用Indesign来进行高效的排版ID:30077776
- java毕业设计基于ssm框架的生鲜超市进销存管理系统
- java implode函数_PHP警告:implode():传递的参数无效
- 你真的理解了MVC, MVP, MVVM吗?
- R语言——数据格式和数据读取
- win10计算机打开之后隐藏3d对象视频,Win10 3D对象文件夹如何隐藏?手把手教你隐藏3D对象文件夹...
- LangChain vs Semantic Kernel