python 统计.txt中比较句个数,五元组的个数、以及有多少重复的op(以五元组为统计单位)
问题描述:
给定一个按规定存储的txt文本,统计其比较句个数、五元组个数,以及选定某一个元素之后,统计有多少个重复的opinion个数。
原始txt存储数据格式如下图:
程序实现
#Function: 统计多比较句中,五元组的个数,以及有多少个重复的op(以五元组为统计单位)
w_file = "/data/qtxu/COQE/COQE_main/data/Multi_comparasion/Ele-COQE/test.txt"with open(w_file, "r", encoding="utf8") as f:#temp_sent, _ = f.readline().strip().split("\t")temp_pairs = []total_num = 0 # op重复的总个数,以五元组为统计单位total_five_num = 0total_comsent = 0for line in f.readlines(): try:sent, ispair = line.strip().split("\t")if ispair == ' 1':# print("**")total_comsent = total_comsent +1if len(temp_pairs) > 1:op_list = []for pair in temp_pairs:pair_str = pair[1:-1]sub, obj, asp, op, num = pair_str.split(";")op_list.append(op)total_five_num = total_five_num + len(op_list)op_set = set(op_list) # 用set判断list中是否有重复元素all_num = 0if len(op_list) > len(op_set):# print("op_list", op_list)# print("op_set", op_set)all_num = all_num + len(op_list) - len(op_set) #计算list和cet的差值,all_num即为一个多比较句中,重复的op个数total_num = total_num + all_num #total_num:即为整个txt中op重复的个数 # temp_sent = senttemp_pairs = []except:pairs = line.strip()temp_pairs.append(pairs)print("txt中比较句总数为: %d, 五元组总数为: %d, opinion重复的五元组个数为: %d" % (total_comsent, total_five_num, total_num))# print("total_five_num", total_five_num)# print("total_comsent",total_comsent)
python 统计.txt中比较句个数,五元组的个数、以及有多少重复的op(以五元组为统计单位)相关推荐
- 题目:分别统计字符串中大写字母和小写字母的个数。
题目:分别统计字符串中大写字母和小写字母的个数. 代码如下: #include <conio.h> #include <stdio.h>void fun(char *s, in ...
- 从键盘输入一行英文字符串,只统计字符串中出现的每个英文字母的个数。
不要原版抄袭,可查看逻辑.题目非原创... 问题描述: 从键盘输入一行英文字符串,只统计字符串中出现的每个英文字母的个数.大小写字母算相同的字符,不做区分,例如a和A,算相同字符. [输入形式] 输入 ...
- (java)从键盘输入一行英文字符串,只统计字符串中出现的每个英文字母的个数。大小写字母算相同的字符,不做区分,例如a和A,算相同字符。
问题描述] 从键盘输入一行英文字符串,只统计字符串中出现的每个英文字母的个数.大小写字母算相同的字符,不做区分,例如a和A,算相同字符. [输入形式] 输入一行英文字符串. [输出形式] 以合适的形式 ...
- [Java]从键盘输入一行英文字符串,只统计字符串中出现的每个英文字母的个数。
从键盘输入一行英文字符串,只统计字符串中出现的每个英文字母的个数. [问题描述] 从键盘输入一行英文字符串,只统计字符串中出现的每个英文字母的个数.大小写字母算相同的字符,不做区分,例如a和A,算相同 ...
- Python读入txt中的数组(下三角矩阵)
Python读入txt中的数组(下三角矩阵) 最近写遗传算法作业要用老师给的数据进行测试,于是学习了一些方法-- txt数据格式 提供的数据为城市间距离的下三角矩阵,直观显示大概为如下形式: 0 63 ...
- 输入一个正整数,统计整数中各位数字值为零的个数,并把该整数中各位上最大的数字值找出和零的个数组成一个新数字输出
/*** 输入一个正整数,统计整数中各位数字值为零的个数,并把该整数中各位上最大的数字值找出和零的个数组成一个新数字输出*/import java.util.Scanner;public class ...
- python执行txt中代码_【技术分享】文件解压之过 Python中的代码执行
预估稿费:200RMB 投稿方式:发送邮件至linwei#360.cn,或登陆网页版在线投稿 一.前言 Python中负责解压压缩文件的代码实现上并不安全,存在目录遍历漏洞,攻击者可以利用该漏洞覆盖_ ...
- python读取txt中的一列称为_python读取中文txt文本的方法
对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...
- python读取txt中的一列称为_Python读取文本中的数字
作者:金良(golden1314521@gmail.com) csdn博客:http://blog.csdn.net/u012176591 1.例程1 先看文本内容形式: 1404796773468 ...
最新文章
- 清华唐杰团队造了个“中文AI设计师”,效果比Dall·E好,可在线试玩
- EntityFramework用法探索(二)CodeFirst
- Hyperledger Fabric 管道(1) 基本概念
- es6 数组找最大值_JavaScript 查找数组中最大值与最小值
- k8s强制删除一直处于terminating状态的pod
- bzoj 3209: 花神的数论题
- Github Actions 中 Service Container 的使用
- 网易云音乐上市首日收跌2.49% 盈利困境仍待解
- webpack4.0学习笔记
- 建立一个中文名字的文件夹Python
- 虚拟服务器排行榜,虚拟服务器排行榜
- 【华为设备开启TELNET】
- win10 修改git账号密码
- HttpRunner3使用
- python算法1加1_【Python爬虫作业】- 第一周01 笨方法0-10加分题
- Building 'xxx' Gradle project info
- opencms初级课程-郗旭光-专题视频课程
- 汇编原理自我总结(一)
- 实记JLink-V8刷固件方法
- php文本书写格式,在PHP中读/写MS Word文件