新浪微博热门话题(字符串处理)
新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题放在醒目的位置推荐大家关注。
本题目要求实现一个简化的热门话题推荐功能,从大量英文(因为中文分词处理比较麻烦)微博中解析出话题,找出被最多条微博提到的话题。
输入格式:
输入说明:输入首先给出一个正整数N(≤10^5 ),随后N行,每行给出一条英文微博,其长度不超过140个字符。任何包含在一对最近的#中的内容均被认为是一个话题,输入保证#成对出现。
输出格式:
第一行输出被最多条微博提到的话题,第二行输出其被提到的微博条数。如果这样的话题不唯一,则输出按字母序最小的话题,并在第三行输出And k more …,其中k是另外几条热门话题的条数。输入保证至少存在一条话题。
注意:两条话题被认为是相同的,如果在去掉所有非英文字母和数字的符号、并忽略大小写区别后,它们是相同的字符串;同时它们有完全相同的分词。输出时除首字母大写外,只保留小写英文字母和数字,并用一个空格分隔原文中的单词。
输入样例:
4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic
输出样例:
Hot
2
And 1 more ...
这一题有坑 比如hello hi与hello@hi是同一个话题
思路:对于话题字符串进行处理,所有的大写字母都处理成小写字母,数字字符不变,其他字符换成空格,注意有多个空格的话要换成一个空格,首尾不能有空格,这需要注意。
另外,在同一个微博里面出现的相同话题,只能算一次,不能重复加,最开始我想着用标志变量去写,发现不行,可以用map去处理
代码:
#include<bits/stdc++.h>
using namespace std;
map<string,int>p;
int main()
{int n;cin>>n;getchar();for(int i=0;i<n;i++){string s;getline(cin,s);map<string,int>q;for(int j=0;j<s.size();j++){ int k;if(s[j]=='#'){string t="";int flag=0;for(k=j+1;k<s.size();k++){if(isalpha(s[k])) t+=tolower((s[k])),flag=0;else if(isdigit(s[k])) t+=s[k],flag=0;else if(!flag) t+=' ',flag=1;if(s[k]=='#') break;}if(t!=""){if(t[t.size()-1]==' ') t.erase(t.end()-1);t[0]=toupper(t[0]);j=k;if(!q[t]) p[t]++,q[t]++;}}}}string h;int maxx=0,k=0;map<string,int>::iterator it;for(it=p.begin();it!=p.end();it++){if(it->second >maxx){maxx=it->second;k=0;h=it->first;}else if(it->second==maxx) k++;// cout<<it->first<<" "<<it->second<<endl;}cout<<h<<endl<<maxx<<endl;if(k>0)cout<<"And "<<k<<" more ..."<<endl;return 0;
}
新浪微博热门话题(字符串处理)相关推荐
- 7-46 新浪微博热门话题(字符串)
题目链接:7-46 新浪微博热门话题 考查知识:字符串 题意描述: 给定n条微博,每条微博里有若干话题,试统计被最多条微博提到的话题. 思路简析: 首先对#号位置进行记录,然后用a.substr(开始 ...
- 数据结构PTA 进阶实验5-3.2 新浪微博热门话题
进阶实验5-3.2 新浪微博热门话题 题目 解法 题目 新浪微博可以在发言中嵌入"话题",即将发言中的话题文字写在一对"#"之间,就可以生成话题链接,点击链接可 ...
- 数据结构PTA习题:进阶实验5-3.2 新浪微博热门话题 (30分)
进阶实验5-3.2 新浪微博热门话题 (30分) 新浪微博可以在发言中嵌入"话题",即将发言中的话题文字写在一对"#"之间,就可以生成话题链接,点击链接可以看到 ...
- PAT结构与算法7-46 新浪微博热门话题 (50行精简 测试点分析)
7-46 新浪微博热门话题 (30 分) 新浪微博可以在发言中嵌入"话题",即将发言中的话题文字写在一对"#"之间,就可以生成话题链接,点击链接可以看到有多少人 ...
- 5-46 新浪微博热门话题 (30分)
5-46 新浪微博热门话题 (30分) 新浪微博可以在发言中嵌入"话题",即将发言中的话题文字写在一对"#"之间,就可以生成话题链接,点击链接可以看到有多少人在 ...
- 7-46 新浪微博热门话题 (30 分)(思路+详解+set + map)pta逐个点过的 来呀兄弟们
一 :题目 新浪微博可以在发言中嵌入"话题",即将发言中的话题文字写在一对"#"之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题 ...
- 7-46 新浪微博热门话题
➳ENTRY 新浪微博可以在发言中嵌入"话题",即将发言中的话题文字写在一对"#"之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话 ...
- python爬取新浪微博热门话题保存到excel等文件
第一步 在网页上登录新浪微博,获取登录cookie 先把它复制好先,进行第二步 第二步 废话不多说,直接上代码,把刚刚复制好的值,赋给co变量 # -*- coding: utf-8 -*- &quo ...
- PTA新浪微博热门话题(题面毒瘤)
这道题的题目描述非常容易让人误解 测试点1容易过掉 一般没有问题 测试点2会出现k等于0的情况 这个时候最后一行是不输出的(题目没有写清楚) 测试点3容易出现PE 实际上是中间的处理过程存在问题 这里 ...
- 7-46 新浪微博热门话题 (30分)--map
1 #include<iostream> 2 #include <map> 3 #include <string> 4 #include <cstring&g ...
最新文章
- Python基本类型-列表
- Linux 使用记录
- Web服务(Apache、Nginx、Tomcat、Jetty)与应用(LAMP、CMS-WordPressGhost、Jenkins、Gitlab)
- 与WebXR共同创建者Diego Marcos一起探讨沉浸式Web的未来(下)
- HTML 中的特殊字符
- python3.4 or 3.x xlwt replaced with xlwt-future
- rs232转usb驱动_RS232的使用 最少需要3根线
- EndnoteX9修改风格
- 转文:KA波段卫星地面关口站异地备份,规避雨天链路中断
- mysql两版本共存
- STM32单片机的学习方法(方法大体适用所有开发版入门)
- 小学语文三年级阅读理解专项练习附答案~水上飞机
- [论文阅读笔记31]UER: An Open-Source Toolkit for Pre-training Models
- IIR无限冲激响应和FIR有限冲激响应数字滤波器有什么区别?
- STM8 时钟寄存器
- 浅谈CPU位数和操作系统位数
- 江城子·己亥年戊辰月丁丑日话凄凉
- 17计算机一级,全国计算机等级考试一级17
- Matlab制作局部放大图——magnify源码
- 解密体育背后AI黑科技:花样滑冰动作识别、多模视频分类和精彩片段剪辑
热门文章
- 从百度世界大会2014中所看到,所感受到的
- 七脉轮位置_[转载]地球的七大脉轮位置
- 达拉斯大学计算机硕士专业排名,美国名校之德克萨斯大学达拉斯分校研究生专业排名榜单 优势专业你选对了...
- Linux14.04安装Mysql Linux公社
- C程序~一元二次方程求解
- 操作系统:作业调度算法--先来先服务
- ajax异步提示对号,jQuery Ajax显示对号和错号用于验证输入验证码是否正确
- C++ priority_queue 用法详解
- C9高校,博士生一作发Nature!
- pip安装超时,Exception:Traceback(most recent call last)