python提取关键词前后原文_python提取文本关键词
python提取关键词textrank算法,将数据库中的数据提取出来,然后进行分析,代码如下
import pymysql
import jieba
from textrank4zh import TextRank4Keyword,TextRank4Sentence
import logging
jieba.setLogLevel(logging.INFO)
#消除日志
def get_key_words(text,num=3):
tr4w=TextRank4Keyword()
tr4w.analyze(text,lower=True)
#分析文本
key_words=tr4w.get_keywords(num)
#提取关键词,num是指关键词的个数
return [item.word for item in key_words]
db = pymysql.connect(host='localhost', port=3306, user='root', passwd='root', db='cs', charset='utf8')
#连接数据库
cursor = db.cursor()
#使用cursor方法创建一个游标
sql = "select shuzi from 单位"
cursor.execute(sql)
data = cursor.fetchall()
#fetchall()方法为查询多条数据,fetchone()为查询一条数据
for i in data:
if i[0] != None:
words = get_key_words(i[0])
print(words)
在编写过程中出现了这种错误'NoneType' object has no attribute 'split',在网上找了好长时间为什么会出现这样的错误,错误出现在最后通过循环对数据库中的数据进行提取的时候,我通过这种方法,查看了每条数据的类型,发现在第六条数据类型为NoneType,说明第六条数据为空,所以才会报错
for i in data:
print(type(i[0]))
当遇到为空的数据时候,只要跳过就可以了,所以加了一条判断语句,只有不为空的时候,才执行函数进行关键词提取,最开始使用的是:
for i in data:
if len(i[0])>0:
# if i[0] != None:
words = get_key_words(i[0])
print(words)
出现了如下的错误:TypeError: object of type 'NoneType' has no len()
这就说明这种判断是否为空的方法是错误的,后发现Nonetype类型,其实就是值为None,所以直接判断值就可以了直接可以用:
if i[0] != None:最后错误解决,成功提取了关键词。
python提取关键词前后原文_python提取文本关键词相关推荐
- python txt提取特定数据_Python提取列表中的内容 用“python”怎么提取文件里的指定内容?...
用"python"怎么提取文件里的指定内容? python读取文件内容的方法: 一.最方便的方法是一次性读取文件中的所有内容并放置到一个大字符串中: all_the_text = ...
- python关键词提取源码_Python 结巴分词 关键词抽取分析
关键词抽取就是从文本里面把跟这篇文档意义最相关的一些词抽取出来.这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语.因此,目前依然可以在论文中看到关键词这一项. ...
- python获取图片名称_python提取图像的名字*.jpg到txt文本的方法
如下所示: # -*- coding:utf-8 -*- import sys sys.path.append('E:\\Anaconda\\libs') import os #os:操作系统相关的信 ...
- python语句结束符号_Python从文本中提取hashtags;以标点符号结尾
对于我的编程类,我必须根据以下描述创建一个函数:The parameter is a tweet. This function should return a list containing all ...
- python中的结束用语,python语句结束符号_Python从文本中提取hashtags;以标点符号结尾...
对于我的编程类,我必须根据以下描述创建一个函数:The parameter is a tweet. This function should return a list containing all ...
- python输入文字字符串、如何提取某个汉字_python提取字符串中的汉字数字字母
原博文 2019-07-04 15:09 − #\d 匹配一个数字字符.等价于 [0-9] #\D 匹配一个非数字字符.等价于 [^0-9] #提取汉字 import re string = &quo ...
- python文字提取关键信息_Python提取图片中的文字信息,腾讯内部技术,一行代码搞定!...
用过手机QQ就知道,点击一个图片会弹出一个小功能,那就是提取图片中的文字.非常方便实用,那么很难实现吗? 利用Python提取图片中的文字信息,只需要一行代码就能搞定! 当然,这是吹牛皮的,但是真正的 ...
- python提取数据段_python提取数据段 python数据分析
如何在python中用slice分段取数据? 执行以下操作:>> a=range(6)>> a[0, 1, 2, 3, 4,5]>& ...
- python 二维码_Python提取支付宝和微信支付二维码
本文首发于我的个人博客,更多 Python 和 django 开发教程,请访问 追梦人物的博客. 支付宝或者微信支付导出的收款二维码,除了二维码部分,还有很大一块背景图案,例如下面就是微信支付的收款二 ...
最新文章
- 【拾贝】版本控制-git 建立Team项目
- 实战Cacti网络监控(1)——基础安装配置
- CentOS下Clonezilla通过网络自动备份还原系统
- 关于正则表达式,我所知道的都在这里
- Linux文本处理tr命令笔记
- 重新认识Docker Compose之Sidecar模式
- python中的颜色_Python中常见颜色记录
- 好公司和差公司的对比
- labview利用USB-6341数据采集卡采集发动机传感器信号(总结篇)
- 使用CCRenderTexture来创建动态纹理
- win10打开计算机黑屏怎么办,win10开机黑屏原因【解决方法】
- 武林传奇之七剑下天山java游戏开发商_宝3武林传奇之七剑下天山的配方
- MOOS-ivp 实验四 MOOS编程入门(1)
- 学习笔记——进程间通信之管道详解
- 新浪采集内容数据自动发布
- Java之父——詹姆斯·高斯林
- Matlab之函数参数nargin和nargout
- MATLAB中 feval 函数的用法
- 如何使用Git进行团队协作开发
- android studio assets 添加,Android studio 添加assets文件夹的方法
热门文章
- Python实现链表反转
- 浅谈TabLayout的使用
- python的读取微信界面_GitHub - lchb000/WechatPCAPI: 微信PC版的API接口,可通过Python调用微信获取好友、群、公众号列表,并收发消息等功能。...
- 2020年全球及中国体外诊断行业现状及竞争格局分析,新冠带来全球体外诊断市场的扩容「图」
- Ogre下的OpenVR开发(1)---Openvr的缺陷
- 动态规划经典题目——最大子矩阵和
- 微信小程序js页面调用函数
- 《Confident Learning: Estimating Uncertainty in Dataset Labels》论文讲解
- win10安装MinGW-64安装版
- PostgreSQL 慢查询获取