使用python计算分词结果的准确率,召回率和F值

测试文件output.txt格式如下:

团 B B

圆 E E

是 BE BE

春 B B

节 E E

千 B B

年 E E

不 B B

变 E E

的 BE BE

... ... ....

python代码如下:

1、读入output.txt文件,并建立相应的列名为‘character‘,‘train‘,‘test‘的dataframe

importpandas

line=[]

file=open(r‘E:\大三下\王东波\CRF 相关\CRF 相关\crf++ tools\output.txt‘,‘r‘,encoding=‘utf-8‘)for i infile.readlines():

i=i[0:-1]if len(i)!=0 and len(i)!=1:

line.append(i.split(‘\t‘))

df=pandas.DataFrame(line,columns=[‘character‘,‘train‘,‘test‘])

【注:使用df.loc添加新行的速度太慢,因而使用列表向dataframe转化】

2、构建新的dataframe保存分词准确的部分

correct=df[df.train==df.test]

3、计算召回率、准确率和F值

for i in (‘B‘,‘C‘,‘E‘,‘BE‘):

R=sum(correct.test==i)/sum(df.train==i)

P=sum(correct.test==i)/sum(df.test==i)

F=R*P*2/(R+P)print(i,‘:\n‘,‘R=‘,R,‘P=‘,P,‘F=‘,F)

计算结果如下:

B :

R= 0.915480621852 P= 0.87615255658 F= 0.895384944855C :

R= 0.674981658107 P= 0.757201646091 F= 0.713731574864E :

R= 0.919001751313 P= 0.879715004191 F= 0.898929336188BE :

R= 0.865064695009 P= 0.940703517588 F= 0.901299951854

用python计算准确率_分词结果准确率、召回率计算-python(示例代码)相关推荐

  1. python合并音频和视频_ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码

    安装 官网下载 选择需要的版本 将解压后得到的以下几个文件放置在E:\FFmpeg下 环境变量 此电脑--属性--高级系统设置--环境变量 在系统变量(也就是下面那一半)处找到新建,按如下所示的方法填 ...

  2. python计算召回率_分词结果准确率、召回率计算-python

    原博文 2016-06-19 13:01 − 使用python计算crf根据模型的分词结果的准确率,召回率和F值 测试文件output.txt,第一列是字,第二列是人工标注的分词结果,第三列是根据模型 ...

  3. python计算召回率_序列标注的准确率和召回率计算

    最近在用BiLSTM+CRF做命名实体识别问题.关于模型效果评估,很多提到用conlleval.pl来实现,conlleval.pl是perl语言写的,原谅我没看懂.最后还是决定自己写个程序算一算准确 ...

  4. python计算召回率代码_序列标注的准确率和召回率计算

    最近在用BiLSTM+CRF做命名实体识别问题.关于模型效果评估,很多提到用conlleval.pl来实现,conlleval.pl是perl语言写的,原谅我没看懂.最后还是决定自己写个程序算一算准确 ...

  5. 【机器学习】二分类问题中的混淆矩阵、准确率、召回率等 (Python代码实现)

    文章目录 混淆矩阵 召回率与准确率 准确度Accuracy sklearn代码示例 混淆矩阵 混淆矩阵(Confusion Matrix):将分类问题按照真实情况与判别情况两个维度进行归类的一个矩阵, ...

  6. 准确率(precision)、召回率(recall)和F值

    摘要: 数据挖掘.机器学习和推荐系统中的评测指标-准确率(Precision).召回率(Recall).F值(F-Measure)简介. 引言: 在机器学习.数据挖掘.推荐系统完成建模之后,需要对模型 ...

  7. python ide 最好_我在iPad上最好的Python IDE

    python ide 最好 Having finished my first year at university, and being left with very little to do thi ...

  8. 准确率(Precision)、召回率(Recall)以及综合评价指标(F1-Measure )

    在信息检索和自然语言处理中经常会使用这些参数,下面简单介绍如下: 准确率与召回率(Precision & Recall) 我们先看下面这张图来加深对概念的理解,然后再具体分析.其中,用P代表P ...

  9. python 字符串拼接_面试官让用 3 种 python 方法实现字符串拼接 ?对不起我有8种……...

    点击上方 蓝字关注我们 点击上方"印象python",选择"星标"公众号重磅干货,第一时间送达!之前发过很多关于 Python 学习的文章,收到大家不少的好评, ...

最新文章

  1. Spring MVC框架有哪些优点
  2. 华为诺亚方舟加拿大实验室提出BANet,双向视觉注意力机制用于单目相机深度估计...
  3. BetaBot 木马分析
  4. 初学WPF,做一款小游戏练习一下
  5. boolean android.content.SharedPreferences.getBoolean(String key, boolean defValue)
  6. python 驱动级鼠标_罗技各系鼠标测评(2020年12月更新)
  7. Java核心知识点学习----多线程中的阻塞队列,ArrayBlockingQueue介绍
  8. java线程池测试,Java线程池【测试Markdown样式】
  9. Android内存泄漏分析心得
  10. 对文字颜色从左到右(横向)渐变的一点理解(坑)
  11. 谭晓生:如何面对IoT时代的安全新挑战?
  12. 组装台式计算机配置清单,diy之家 - 2017组装电脑配置清单_电脑diy主机配置推荐...
  13. response设置token
  14. SpringBoot 使用validation数据校验-超级详细 - 第406篇
  15. 2022年1~10月语音合成(TTS)和语音识别(ASR)论文月报
  16. PokerNet-poker recognition: 扑克识别 (6)
  17. 芯准TSN系统的测试与验证(1)——测试环境配置
  18. redis基数树rax源码分析(1)
  19. 小米手机6如何刷成开发版获取root权限
  20. 我相信,一定有那么一句话可以温暖你的心

热门文章

  1. 【Python】Matplotlib使用字符串代替变量绘制散点图
  2. ****** 三十三 ******、软设笔记【存储器系统】-主存储器、辅存储器
  3. rabbitmq中文教程python版 - Topics
  4. IP地址的网络位与主机位
  5. jqgrid下载,引入
  6. PIC18F中断定时器
  7. 巧妙喝水打败多种疾病(节选)
  8. 01-第一章 Java开发中通用的方法和准则
  9. Base64编码及其作用
  10. 企业数字化新战场:低代码究竟是“毒瘤”还是“良药”?