重名剔除(Deduplicate)

描述
Epicure先生正在编撰一本美食百科全书。为此,他已从众多的同好者那里搜集到了一份冗长的美食提名清单。既然源自多人之手,其中自然不乏重复的提名,故必须予以筛除。Epicure先生因此登门求助,并认定此事对你而言不过是“一碟小菜”,相信你不会错过在美食界扬名立万的这一良机

输入
第1行为1个整数n,表示提名清单的长度。以下n行各为一项提名

输出
所有出现重复的提名(多次重复的仅输出一次),且以其在原清单中首次出现重复(即第二次出现)的位置为序

样例
输入

10
brioche
camembert
cappelletti
savarin
cheddar
cappelletti
tortellni
croissant
brioche
mapotoufu
输出

cappelletti
brioche

限制
1 < n < 6 * 10^5

提名均由小写字母组成,不含其它字符,且每项长度不超过40

时间:2 sec

空间:256 MB

提示
散列

分析

  1. 如何将字符串映射到槽位上?推荐的方法是把26个字母(题目是小写字母)当作27进制来计算得出散列码,以表示每一个字符串独一无二的数值,理论上60w个不重复的菜名是可以一一对应地放入60w个槽位的。然而遗憾的是40位长的字符串,如果以27进制来计算其值,势必大大超过长整型无符号数的表示范围。(来小小验证一下,41^{27} - 1 > 2^{5*27} - 1 > 2^{65} - 1)因此处理好冲突是关键。
  2. 根据散列码进行哈希映射,由于重点不在此,哈希函数就随便写啦,最简单的方式就是模散列表长度,hash(x) = x % MAXSLOTS即可。我们的重心放在处理冲突。MAXSLOTS的取值有讲究,下面来说。
  3. 采用双平方探测法可以完美解决冲突,在空间上我们仅需要60w个槽位,MAXSLOTS取模4余3的素数即可。(数学证明参见费马定理)不妨取600011。
  4. 码就完事儿。

流程

  1. 获取字符串(关键码),计算散列码,使用散列码计算哈希值。
  2. 尝试放入槽位。如果有冲突&&槽位关键码与当前串相同&&该关键码也未打印过,转3。如果有冲突&&关键码相同&&打印过,转1。如果有冲突&&关键码不同,转4。如果没有冲突,转5。
  3. 打印当前字符串,标记槽位为已打印。转1。
  4. 进行双平方试探,转2。
  5. 字符串放入槽位,标记为未打印,转1。

核心代码

unsigned int hashCode( struct hash_string s ){ // 计算字符串散列码的近似解法,左移5位是实验统计的结果unsigned int h = 0;for ( int n = strlen(s),i = 0; i < n; i++ ){h = ( h << 5 ) | ( h >> 27 );h += (unsigned int) s.name[i];}return h;
}unsigned int hash( unsigned int x ){return x % M;
}

伪代码

Input : strdes = calculate hash code of strif slot[des] is empty:put str in slotelse slot[des] is full:probe slots:if slot is full and the str has been printed:retunelse if slot is full but the str has not been printed:print the strelse if slot is full but not the str:go on probeelse:empty slot! put the str in


上榜了嘻嘻嘻

TsinghuaOj Programming Assignment #3.3 重名剔除(Deduplicate)相关推荐

  1. 重名剔除(Deduplicate)

    重名剔除(Deduplicate) 描述 Epicure先生正在编撰一本美食百科全书.为此,他已从众多的同好者那里搜集到了一份冗长的美食提名清单.既然源自多人之手,其中自然不乏重复的提名,故必须予以筛 ...

  2. PA9题解报告——重名剔除(Deduplicate)

    数据结构与算法实验2020夏第二批(中国石油大学) PA9题解报告--重名剔除(Deduplicate) 目录 题目描述 题目分析 编码实现 一.题目描述 1. 描述 Epicure先生正在编撰一本美 ...

  3. 清华OJ重名剔除(Deduplicate)

    重名剔除(Deduplicate) Description Mr. Epicure is compiling an encyclopedia of food. He had collected a l ...

  4. MOOC数据结构(下)(自主模式)-重名剔除(Deduplicate)

    重名剔除(Deduplicate) Description Mr. Epicure is compiling an encyclopedia of food. He had collected a l ...

  5. 清华数据结构重名剔除AC100

    1.首先需要找打大于600000的最大素数,寻找素数的方法,我用的是比较笨的方法,就是用x的平方根以下的数y去除,若x%y全部都不为0,则为素数. 2.对每一个菜谱进行编码,我的编码方法如下,具体的编 ...

  6. C++中局部变量可以和全局变量重名吗?

     C++中局部变量可以和全局变量重名吗? 这是一个作用域的问题.一个声明将一个名字引进一个作用域:局部变量(通常在函数中定义)的作用域是从声明的那一点开始,直到这个声明所在的块结束为止(一个块就是 ...

  7. 不同模块下包重名怎么解决_模块

    模块 1. 模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py.模块可以被别的程序引入,以使用该模块中的函数等功能. 2. 当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导 ...

  8. android id 重名_Android App 自定义权限重名不能安装解决办法

    场景1. A 应用 有两个版本 第一个 正式版 第二个测试版    测试版的包名 = 正式版+test ,在Android studio 中 也就是 applicationId  . 两个版本都可以成 ...

  9. Ajax实现简单用户名重名查询

    很早就想发布这篇POST了,Ajax实现简单用户名重名查询,引用了xmlhttprequest object pool,如下: XMLHttpRequest Object Pool /**  * XM ...

最新文章

  1. 2020 年最具潜力 44 个顶级开源项目,涵盖 11 类 AI 学习框架、平台(值得收藏)
  2. PHP操作MYSQL--PDO
  3. 如何查看数据库索引的利用率?
  4. C#中PostMessage和SendMessage的参数传递实例
  5. HDU-水饺基情 二维树状数组
  6. 当过爱因斯坦助理,参加过曼哈顿计划,他还发明受欢迎的编程语言 | 人物志...
  7. 开好会议有诀窍------(转)
  8. 长虹发布AI 3.0 引领电视行业跨入AI3.0时代
  9. [debug] 开源项目的本地使用:使用pip安装的函数库不能被anaconda和pycharm使用+visdom使用 +路径问题
  10. tornado-ioloop-async-io
  11. OmniPlan Pro 4 for Mac(项目流程管理工具)
  12. asp.net937-图书馆座位管理系统
  13. 虚拟机屏幕分辨率修改
  14. OSChina 十一乱弹 —— 前女友 is Null
  15. WIN2016远程桌面服务配置和授权激活
  16. Kali开机后的初始化配置
  17. 怀孕期间准妈妈多吃西红柿
  18. java计算机毕业设计临港新片区招商引资项目管理系统源代码+数据库+系统+lw文档
  19. 微服务架构 基础(三)
  20. 瑞星linux 服务器安全狗,网站安全狗插件_网站安全狗官方下载_网站安全狗4.0官方iis版-PC下载网...

热门文章

  1. 分享几个python有趣代码
  2. 9. React 高阶组件是什么, 和普通组件有什么区别, 适用什么场景?
  3. Linux 系统语言切换 ---- Linux Ubuntu 系统语言切换为英文
  4. 5-羧基荧光素标记Fe3O4四氧化三铁纳米粒5-PEG-FAM-PEG-Fe3O4
  5. python中一些函数使用(tile,排序,搜索,计数)
  6. 2020年起重机司机(限桥式起重机)考试技巧及起重机司机(限桥式起重机)实操考试视频
  7. Java List按大小分片,平均切分
  8. angularjs 连接mysql_使用AngularJS连接到数据库
  9. 俞敏洪成功语录15条
  10. Navicat连接Mysql时 1251 - client does not support ...的问题