3g和4g的跨越时间

This post is a loving tribute to my daughter, whose eyes are shining stars in these dark and troubled nights.

这篇文章向我的女儿致以深深的敬意,在这片漆黑的夜晚中,她的眼睛闪耀着星星。

Names evolve. Parents would take a name from pop culture, history, sports, current events, or sacred texts and add their own spin to it. The act of naming both evokes the meaning of the original name but also leaves blank pages for the newborn to write.

名字在演变。 父母会从流行文化,历史,体育,时事或神圣文本中取一个名字,并为其添加一个名称。 命名不仅唤起了原始名称的含义,而且还留下了空白页供新生儿书写。

Take Cassandra for example. There are shorter variants such as Cass. Some consonants might be replaced. In some countries, ‘c’ can be replaced with ‘k’, like Kassandra. Interestingly, it is common in the Philippines, for example, to add an ‘h’ to the spelling (Cassandhra). Here’s a quick plot of the variants over time.

以卡桑德拉(Cassandra)为例。 有较短的变体,例如Cass。 一些辅音可能会被替换。 在某些国家/地区,可以将“ c”替换为“ k”,例如Kassandra。 有趣的是,例如在菲律宾很常见,在拼写上加上“ h”(Cassandhra)。 这是随时间变化的快速图表。

Read on to see how I did it! Here’s the Kaggle Notebook, if anyone’s interested.

继续阅读,看看我是如何做到的! 如果有人感兴趣,这是Kaggle笔记本。

识别变体 (Identifying Variants)

With data, we can see a glimpse of how names and their variants move in popularity over time. I used the US Baby Names dataset which is gathered from US Social Security data. I then use the Double Metaphone algorithm to group together words by their English pronunciation. Designed by Lawrence Phillips in 1990, the original Metaphone algorithm does its phonetic matching through complex rules for variations in vowel and consonant sounds. Since then, there have been two updates to the algorithm. Fortunately for us, there is a Python port from C/C++ code, the fuzzy library. The result is a grouping of words like:

通过数据,我们可以看到名称及其变体如何随时间流行。 我使用了从美国社会保障数据收集的美国婴儿名字数据集。 然后,我使用Double Metaphone算法将单词按其英语发音分组。 最初的Metaphone算法是由Lawrence Phillips在1990年设计的,它通过复杂的元音和辅音变化规则进行语音匹配。 从那时起,对该算法进行了两次更新。 对我们来说幸运的是,有一个来自C / C ++代码的Python端口,即模糊库。 结果是像这样的单词分组:

Mark -> MRK Marc -> MRK Marck -> MRK Marco -> MRK

In the following code, we first get the fingerprint (a.k.a. hash code) of all the names in the data:

在下面的代码中,我们首先获取数据中所有名称的指纹(也称为哈希码):

names = df["Name"].unique()fingerprint_algo = fuzzy.DMetaphone()

list_fingerprint = []for n in names:    list_fingerprint.append(fingerprint_algo(n)[0])

The result is having an index for each of the names. Then with simple filtering, we can extract variants of both Cassandra and Cass.

结果是每个名称都有一个索引。 然后,通过简单的过滤,我们可以提取Cassandra和Cass的变体。

def get_subset(df, df_fp, names):    fingerprint_candidates = []    for name in names:        matches = df_fp[df_fp["name"] == name]["fingerprint"]        fingerprint_candidates.extend(matches.values.tolist())

    name_candidates = df_fp.loc[df_fp["fingerprint"].isin(fingerprint_candidates), "name"]

    df_subset = df[(df["Name"].isin(name_candidates)) & (df["Gender"] == "F")]    return df_subset

# using my functiondf_fp_names = pd.DataFrame([list_fingerprint, names]).T df_fp_names.columns=["fingerprint", "name"] df_subset = get_subset(df, df_fp_names, ["Cass", "Cassandra"])

卡桑德拉的变种 (Variants of Cassandra)

We can then plot the most popular variants of Cassandra throughout the 20th century. I also plot a log scale version so we can see better those in the middle of the pack. I’m using the plotnine library so I can do ggplot-style code.

然后,我们可以绘制整个20世纪最受欢迎的Cassandra变体。 我还绘制了对数刻度版本,以便我们可以更好地看到中间的那些版本。 我正在使用plotnine库,因此可以执行ggplot样式的代码。

ggplot(df_top_n_global, aes(x = "Year", y = "Count", colour = "Name")) + \    geom_text(aes(label = "Name"), show_legend = False) +\    geom_line() +\    labs(y = 'Number of babies', title = 'Cass: 1900\'s and beyond') +\    scale_y_continuous(trans='log10') +\    theme(panel_grid_minor_y=element_blank(),           panel_grid_major_y=element_blank())

It looks like the name Cassandra and nearly all its most popular variants have peaked in the ’90s but has since then decreased sharply. I have read that at one point, the name has even reached the top 70 in the United States in the ’90s. Other popular variants include Casey, Cassie, and Kassandra, all of which have been decreasing in popularity.

看起来像卡桑德拉(Cassandra)这个名字,几乎所有最受欢迎的变种都在90年代达到顶峰,但此后急剧下降。 我读过,这个名字曾经在90年代甚至达到美国前70名。 其他受欢迎的变体包括Casey,Cassie和Kassandra,所有这些变体的受欢迎程度都在下降。

佐伊(Zoe)最受欢迎的变体 (Most Popular Variants of Zoe)

The story is different for Zoe, where we find a very sharp uptick in popularity in the 2000s. Perhaps the show Zoey 101 had to do with it? There is also that classic rom-com, 500 Days of Summer in 2009…

对于佐伊来说,情况就不同了,在2000年代,佐伊的人气急剧上升。 也许Zoey 101的演出与此有关? 还有经典的rom-com,2009年的夏季500天…

An identified variant, Sue, however, has sharply reduced in popularity since the 1950s. I’m quite sure that they have different pronunciations. Double Metaphone has mistakenly indexed them together.

但是,自1950年代以来,已确定的变体Sue的受欢迎程度急剧下降。 我很确定他们有不同的发音。 Double Metaphone错误地将它们索引在一起。

It’s very interesting to study how names evolve, get more popular, and become rarer over time. Famous people and events always have a hand in it so names become a reflection of the times. I remember a trend where parents were naming their children Danaerys or adding a Jon in the name somewhere. I’m guessing that as of the time of this post’s writing, there may be a lot of Anthony’s being born. Even X Æ A- 12 is a sign of the times.

研究名称如何随着时间演变,变得越来越流行以及变得越来越稀有非常有趣。 名人和事件总是有帮助的,因此名称成为时代的反映。 我记得有一种趋势,父母在给他们的孩子命名Danaerys或在某个地方添加一个Jon的名字。 我猜到撰写本文时,可能有很多安东尼出生。 甚至XÆA- 12也代表了时代。

Since I’m only using data from the US, it will be more fascinating to see each country’s trends and variants. What are each country’s naming styles? What does cross-pollination of naming styles look like? Are gender-neutral names becoming more in favor? These are all fascinating questions to explore!

由于我仅使用来自美国的数据,因此看到每个国家的趋势和变化会更令人着迷。 每个国家的命名方式是什么? 命名方式的异花授粉是什么样的? 不分性别的名字越来越受到青睐吗? 这些都是令人着迷的问题!

Originally published at http://itstherealdyl.com on September 19, 2020.

最初于2020年9月19日发布在http://itstherealdyl.com上。

翻译自: https://towardsdatascience.com/a-name-across-time-and-numbers-a9f432c3981b

3g和4g的跨越时间


http://www.taodudu.cc/news/show-4495906.html

相关文章:

  • python多边形的绘制教程_绘制最新:python绘制封闭多边形教程_爱安网 LoveAn.com
  • Week12—最大匹配括号数
  • 设置控件评分星星控件
  • mysql分表动态扩展_小星星 的动态 - SegmentFault 思否
  • LeetCode 09:回文数(Java实现)
  • 《An Industrial-Strength Audio Search Algorithm》译文
  • upc Buy an Integer#二分
  • 星星下落_与星星共舞
  • 11.拼数(c++)
  • 平均数,初学
  • 拿数问题II
  • FZU2109 数位dp 含前导零
  • 树状数组的进阶运用(Stars 数星星)
  • 2020.5.9测试 T3 数星星
  • URAL 1028 数星星 题解
  • 我对于互联网发展的看法和一些理解
  • 中国互联网发展总结
  • 计算机网络(2)--- 因特网的发展阶段与组织
  • 网络层协议(1):Internet 发展简史(上)
  • 因特网的发展大致分为哪几个阶段?请指出这几个阶段的主要特点。
  • 因特网的发展历程
  • python泰坦尼克号生存预测论文_用Python预测泰坦尼克号生存情况
  • python泰坦尼克号案例分析_Python机器学习案例-泰坦尼克之灾
  • Keras神经网络实现泰坦尼克号旅客生存预测
  • kaggle 泰坦尼克事件——随机森林算法实现
  • 贝叶斯网络python实战(以泰坦尼克号数据集为例,pgmpy库)
  • Matlab粒子群算法神经网络泰坦尼克号
  • Matlab遗传算法神经网络泰坦尼克号
  • 利用tensorflow神经网络进行泰坦尼克的生存预测
  • 机器学习算法源码

3g和4g的跨越时间_跨越时间和数字的名字相关推荐

  1. 工作占用了太多私人时间_私人时间

    原标题:私人时间 苹果新发布,有双卡手机了 不过我不会看好,现在打电话 不是推销就是快递,越来越少了 捏着俩手机的还有吗?不多见 尤其下班,手机功能是实用 打车.支付.阅读,不是打电话 在私人时间随便 ...

  2. c语言计算日出日落时间_日出日落时间 计算软件 日出日落时间计算公式

    计算日出时间. 日落时间. 昼长. 夜长的公式或方法 是时间计算最简单的. 昼半球的平分线上是12点. 对应的夜半球平分经线就是零点. 希望能对你有所帮助. 这些只跟经度有关系. 如果是半球俯视图就是 ...

  3. af dns 刷新时间_第一时间上手Redmi K30 Pro,有些想法不吐不快

    今天(3月24日)Redmi举行线上发布会,这也是小米今年第二场发布会,会上卢伟冰发布了Redmi最新旗舰手机K30 Pro系列.之前发布的K30 5G相信大家记忆犹新,硬是把5G手机从高高在上一下子 ...

  4. c语言计算日出日落时间_日出日落时间计算程序(C语言)

    实用标准文档 文案大全 // 日出日落时间计算 C 语言程序 #define PI 3.1415926 #include #include using namespace std; int days_ ...

  5. 今天小暑是什么时间_小暑时间 小暑是几月几日代表什么

    公历每年7月7日或8日时太阳到达黄经105°时为小暑. 今年"小暑"的时间是在7月7日. "小暑"是农历二十四节气之第十一节气,每年7月7日或8日视太阳到达黄经 ...

  6. R语言ggplot2可视化:可视化所有日期不同时段任务的持续时间、将持续时间绘制成一条线(起始时间到结束时间),y轴表示活动发生的日期,x轴表示以小时为单位的时间、适应时间段跨越多天的情况

    R语言ggplot2可视化:可视化所有日期不同时段任务的持续时间.将持续时间绘制成一条线(起始时间到结束时间),y轴表示活动发生的日期,x轴表示以小时为单位的时间.适应时间段跨越多天的情况(例如,当天 ...

  7. 3G与4G到底有何区别?

    对每一个手机用户来说,3G和4G都是手机术语词典中最神秘的词汇,然而在任何卖手机和平板电脑的地方你都能发现它们的身影.当你想买一部手机的时候,通常不清楚该选择哪一种,但有一点要明确--不要随便追求高的 ...

  8. 2G,3G,4G网络架构浅谈——4G(LTE)

    原文章地址:http://blog.sina.com.cn/s/blog_64827e4c010105nl.html 3G技术带给人们的高速网络体验是史无前例的.然而网速是没有最快,只有更快的.随后4 ...

  9. 3G、4G、5G有何不同之处,你真的懂吗?

    3G.4G.5G有何不同之处,你真的懂吗? 3G技术还未远去,4G技术方兴未艾,5G技术已蓄势待发.本文从技术层面全面解析了关于3G.4G.5G的不同之处:1.无线通信传递媒介:电磁波,2.无线通信传 ...

最新文章

  1. 结构化方法与面向对象方法之比较
  2. Codeforces Beta Round #6 (Div. 2)【未完结】
  3. 什么叫时钟漂移(Wander)?时钟漂移与时钟抖动(jitter)的区别
  4. POJ - 3662 Telephone Lines(分层图最短路)
  5. 解决Maven工程中报 Missing artifact jdk.tools:jdk.tools
  6. MySQL数据库主从同步的3种一致性方案实现,及优劣比较
  7. div垂直,水平居中
  8. 二本院校女毕业生,想去北漂,求建议
  9. java 类里面对象共享_Java并发编程 - 对象的共享
  10. char,varchar,nvarchar以及datetime和smalldatetime的区别
  11. 电脑运行c语言时错误,电脑出现microsoft visual c++ runtime error 解决方法(多图)
  12. android视频教程地址
  13. 观3b1b线性代数本质系列视频的思考感悟
  14. python 字符串转ASCII码
  15. Laravel防范xss攻击
  16. Flutter 图片和多行文本中的第一行对齐,文字行高、行距、偏移设置
  17. redis-使用Java代码操作
  18. ##MyfifthLog
  19. Red Hat Enterprise Linux Server 7.3 离线安装Podman
  20. linux 查看网络流量来源_Linux查看网络流量

热门文章

  1. 江南style印证法国大预言家诺查丹玛斯世界末日预言?
  2. IDEA 读取maven本地仓库jar包,而不是读取module项目代码的解决方案
  3. SaaS服务模式下的电商ERP遇到企业仓库分布于多组织下的管理
  4. git apply 打补丁
  5. 哈工大软件构造自我复习总结Part1
  6. MJ12bot 蜘蛛爬虫 屏蔽垃圾SEO蜘蛛
  7. 火狐查看html页面大小,利用火狐浏览器测试自适应网页
  8. 【JS】【掘金】看看你所有粉丝的掘友值排行榜
  9. PDARTS 网络结构搜索程序分析
  10. 移动游戏性能优化建议与字体剥离精简工具