今天是感恩节,不知道这个话题合适不合适。我们经常会提到『死而无憾』这个词。这个词似乎是一种理想状态,几乎100%的人还是做不到的。那么我们的『憾』在哪里?这个问题看似不是难题,不过仔细想想是永远没答案的,人只有在死前的一刻才知道自己的遗憾在哪里,而这个感觉是永远不可能模拟的。当然我们没这么较真儿,也没必要。可能我们经常会假想,假设明天是世界末日,那此时此刻我们想说点儿什么?这个话题被提及太多次,以至于都有点儿俗了,我们很多人都是活的挺随性的人,在大原则不失的前提下,没什么干不出来的事儿,所以也没有太多想干不敢干的壮举。然而有时候可能忽略了上帝给咱们最直接的能力,那就是语言。很多人都说,如果自己下一秒钟生命结束,最大的遗憾就是没能跟他/她/他们说声谢谢,或者,说句我爱你。

美国德州刑事司法部(Texas Department of Criminal Justice)定期更新维护着一个让人无比压抑的数据库,这个数据库整合了1982年至今的531位死囚的临终遗言,还记录下了每一位死囚的名字、性别、人种、罪行等一系列信息。

记录在册的531位死囚来自不同的地区,年龄从20岁跨越到60岁以上,人种、宗教也千差万别。他们中有亲手杀死了自己三个女儿的“杀人狂魔”,也有至死都不肯认罪在遗言中大抱不平的“喊冤人”。然而对死亡的恐惧让最穷凶极恶的死囚也平静下来,在生命的最后时刻,他们想要留给世界的话惊人的一致。

人之将死其言也善?

大数据文摘利用Python编写了网页抓取程序(对用Python抓取网页感兴趣的同学,可以参考大数据文摘已经发布过的《初学指南|用Python进行网页抓取》一文),抓取了所有死囚的遗言及相关信息,部分遗言截图如下所示:

除此之外,我们还抓取了跟死囚相关的个人信息,部分信息截图如下所示:

简单的分析后可以看到,即使最穷凶极恶的死囚面对死亡也表现出了内心最深处的“善意”。

用python爬下了531条死囚的遗言的基础之上,我们提取了除掉类似“I”,”this”等词的实词,对其余的词进行了排序,并制作了相关词云,部分结果显示如下:

从词云图中我们清楚的看到,在死囚遗言中“Love(爱)”是提及最多的词,共被提及739次,“家庭(famili)”、“感谢(thank)”、“道歉(sorry)”、“原谅(forgiv)”、“和平(peac)”是依次提及频率最高的词。

没有不甘心,没有仇恨,“人之将死,其言也善。”这句古老东方的谚语在几百年后地球另一端这531位死囚身上得到了完美的验证。

面对死亡,他们说了什么

此外,我们还对遗言进行了情感分析。通过sentiment将其分为“积极(positive),”“消极(negative)”,和“中立(neutral)”这三类。从分析结果看,所分析的临终遗言几乎都被归为第三类“中立”。

似乎一切风波起落在死亡面前都变成了不值一提的小事,逐条读完这些遗言,我们发现这些被算法识别成neutral的遗言却比任何充斥着抒情词的文章更直指人心。

我们也对这些遗言做了筛选,选取了最短的遗言(1个词、2个字母)、最长的遗言(1268个词)、最混乱的遗言、最“宽容”的遗言、包含高频词最多的遗言、最感人的遗言,并跟大家分享。

最短的遗言

最短的遗言来自一位18岁入狱的死囚Peter Anthony Cantu,他和另外4位同伙奸杀了一位14岁和一位16岁的少女。在遗言中,他只留下了“NO”这个词。

最长的遗言

最长的遗言有1268个词,这份长长的遗言来自一位38岁入狱的黑人Graham Gary。他被指控在一家超市外抢劫并射杀了一位白人男士。

在生命的最后一刻,Gary依然在努力为自己辩解,“我没有杀人,我是无罪的。”

部分遗言:Iwould like to say that I did not kill Bobby Lambert. That I'm an innocent blackman that is being murdered. This is a lynching that is happening in Americatonight. There's overwhelming and compelling evidence of my defense that hasnever been heard in any court of America.”

最混乱的遗言

并非所有人都可以坦然平静面对死亡,Joshua Maxwell在死前的留言已经变得混乱,他似乎在对某个人说话,又似乎在向谁忏悔。

完整遗言:Ido, I want to address you, I am sorry. I don't know who you are. I am sorry Iput you through some things that I can't take back. I am sorry. This isn'tgoing to change anything. Sorry for putting you through this. This is creatingmore victims. I am sorry, I put you through this. I love you man, I love you.This is not gonna change anything. This person shoe did that 10 years ago isn'tthe same person you see today. I hurt a lot of people with decisions I made. Ican't be more sorry than I am right now. I hurt the Lopes family, let this be alesson. Your decisions affect everybody. Look after your sister for me. I amalways gonna be with you. I love you too Shay I love you if your listening I amsorry to be putting everybody through this. This is the end of this, time tomove on. I hope this brings you peace, I am sorry. I told your sister my lastwords. Danielle, you know that I love you. You know that you have my heart,I've enjoyed these times. I love you little hef.

最“宽容”的遗言


Ronald O'Bryan因在圣诞节糖果里放毒药毒死自己的亲生儿子而被判死刑。他在遗言中宽容的写道:“即将对我执行的死刑是错误的,但我原谅你们,因为人人都会犯错,而我们不能因为一个错误而质疑正义。”

完整遗言:Whatis about to transpire in a few moments is wrong! However, we as human beings domake mistakes and errors. This execution is one of those wrongs yet doesn’tmean our whole system of justice is wrong. Therefore, I would forgive all whohave taken part in any way in my death. What is about to transpire in a fewmoments is wrong! However, we as human beings do make mistakes and errors. Thisexecution is one of those wrongs yet doesn’t mean our whole system of justiceis wrong. Therefore, I would forgive all who have taken part in any way in mydeath.

包含高频词最多的遗言

Yosvanis Valle在28岁被捕入狱,罪名是抢劫并射杀了一位西班牙男士。他的遗言包含了大量“love”、“sorry”“family”等高频词,善意和愧疚满满,可以被看做死囚遗言中的范文。

完整遗言:Iam sorry, I never wanted to kill your family. I never wanted to kill yourfamily or these people. I am sorry for the way I talk in English. I did it tomyself. I was forced to do it. I was a gang member. I never wanted to kill yourbrother. I was forced to do this. I blame myself. I am not going to blamenobody. I got my mother and my family too. I was forced. I tell you from myheart. I am sorry with all my heart. That's the reality of life, I am sorry. Igot to pay for it. To my family, I love you, be strong. They have family too;the way they suffer is the way I am suffering. I am asking you to go and givethem hugs. Please accept their hugs. Be strong in the Lord. I love you sister.I love you all, please go and try and talk to the family. I love my family. Iunderstand why I am paying this price. Do not have any excuses for notextending your love. I am ready Warden, I am sorry everybody, I did it. Thankyou brother, don't hate nobody, I feel good. I love my family, I love youJesus. Be strong mama, I love you sister. I love Jesus. Warden I am ready.

最感人的遗言

在一家飞机修理棚射杀了4人的Lester Leroy Bower写下了我们认为最感人的遗言。Lester平静地接受了即将到来的死亡,并诚挚的感谢了自己的辩护律师和家人。“到了离开的时候了,而我不会说再见,直到我们再次相见。”

"Much has beenwritten about this case, not all of it has been the truth. But the time is overand now it is time to move on. I want to thank my attorneys for all that theyhave done. The have afforded me the last quarter of a century. I would like tothank my wife, my daughters, family and friends for unwavering support, and allof the letters and well wishes over the years. Now it is time to pass on. Ihave fought the good fight, I held the faith. I am not going to say goodbye, Iwill simply say until we meet again. I love you very, very much. Thank youWarden."

在死囚中有近20%(110人)没有留下遗言或者拒绝留下遗言。我们无法猜透他们的心思,恐惧害怕、绝望无助亦或平静等待这最终时刻的来临。

人在临刑之前确实不一定会悔改,不一定会觉得自己哪儿错了。当然,相当一部分的囚犯的确没做错过任何事,只不过他们选择了一个太激进太冲动的太不合时宜的方式来解决问题。他们的"善"是对亲人说的,对爱人说的,对朋友说的,对那些"没有他们不行"的生者说的。走的人痛苦几秒,留下的人可能痛苦几年,几十年,甚至痛苦到他们自己走的时候。

衡量一个句子有多"emotinal",算法大致上是这么办的:把句子拆成单个的词,去掉冠词和人称以及一些口头语(统称为stopwords),只留下一句话里的"核心词",然后针对这些词来做一系列的分析(这儿就不具体展开了)。然而我发现,有的时候一句话的精华就在这些stopwords上。

举个最极端但是最简单的例子吧:I Love You.

我这个人泪点高到自己都有点儿害怕,但是看了这条遗言,立刻起身去厕所哭了一会儿,尤其是看到了这个连不会英语的人都会说的单词"Okay"的时候。

原文发布时间为:2015-11-26

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号Hey, don't y'all worry aboutme, okay?

人之将死其言也善?30年来死囚遗言分析相关推荐

  1. 分享一篇glibc 2.30内存管理源码分析

    分享一篇glibc 2.30内存管理源码分析,出于时间关系文章中可能存在问题(如纰漏.或者解释不顺,后续我会持续更新修正),还请大家海涵,大家互相探讨,也多多希望大家指出文章中问题,我及时斧正.本文只 ...

  2. 100+诡异的数据集,20万Eclipse Bug、死囚遗言等

    摘要:近日,Robert Seaton整理了100多个最有趣的数据集,其中包括Jeopardy真题,死囚的最后一句话,20万个Eclipse Bug,足球比赛相关,柏拉图式的爱情,太阳系以外的行星,1 ...

  3. 30万行数据,Python 分析科比二十年职业生涯 | 原力计划

    作者 | 高羊羊羊羊羊杨 来源 | CSDN博客 头图 | 付费下载自视觉中国 出品 | CSDN(ID:CSDNnews) 前段时间,湖人当家球星 科比·布莱恩特不幸遇难.这对于无数的球迷来说无疑使 ...

  4. 云计算之路-阿里云上:从ASP.NET线程角度对“黑色30秒”问题的全新分析

    在这篇博文中,我们抛开对阿里云的怀疑,完全从ASP.NET的角度进行分析,看能不能找到针对问题现象的更合理的解释. "黑色30秒"问题现象的主要特征是:排队的请求(Requests ...

  5. python猪肉价格预测_预测猪肉年底会涨到30元,用python分析:肉涨真正利好哪些股?...

    概要 预测猪肉年底会涨到30元,那么问题来了,肉涨利好哪些股?本文从全国猪肉价格可视化分析,然后用python的pandas数据相关性分析,来选取最有代表性的猪肉价格.最后,提取猪肉概念的30多只股票 ...

  6. Android 系统(30)---如何用DDMS分析native memory leak

    native程序如果发生内存问题,一般都比较难查,幸好DDMS有集成native memory leak(仅仅针对app,无法分析mediaserver等非app的进程)功能,通过DDMS可以观察na ...

  7. Android 系统性能优化(30)---Android性能全面分析与优化方案研究

    Android 性能优化 1.结合以下四个部分讲解: 性能问题分类 性能优化原则和方法 借助性能优化工具分析解决问题 性能优化指标 2性能问题分类 1.渲染问题:过度绘制.布局冗杂 2.内存问题:内存 ...

  8. Java基础之《netty(30)—RPC调用流程分析》

    一.RPC基本介绍 1.RPC(Remote Procedure Call)-远程过程调用,是一个计算机通信协议.该协议允许运行于一台计算机的程序调用另一台计算机的子程序,而程序无需额外的为这个交互作 ...

  9. 2022-2028年中国商贸物流行业市场前瞻与投资战略规划分析报告

    [报告类型]产业研究 [出版时间]即时更新(交付时间约3个工作日) [发布机构]智研瞻产业研究院 [报告格式]PDF版 本报告介绍了商贸物流行业相关概述.中国商贸物流行业运行环境.分析了中国商贸物流行 ...

最新文章

  1. R语言数据格式转换函数、数据类型判断函数(numeric、character、vector、matrix、data.frame、factor、logical)、R语言数据格式类型转换
  2. 玩转Numpy——np.ravel()的使用
  3. 大型互联网公司架构演进之路汇总
  4. kafka-manager 安装
  5. 【自适应(盲)均衡6】信号过多径衰落信道的矩阵乘法表示之Toeplitz矩阵和Toeplitz块矩阵的生成(分数间隔FSE)
  6. MySQL的使用笔记
  7. 脚艺人什么意思,网络上脚艺人什么梗,变身脚艺人意思
  8. iOS:类似于网易云音乐的刷新条目显示弹框
  9. 【大数据部落】R语言RFM模型在电商行业的应用
  10. 统计某个路径下的总文件个数,及总行数(不含空行)
  11. java datasource使用_java Datasource,数据库连接池
  12. nginx工作原理、配置以及web服务器的资源请求过程
  13. android expandablelistview横向,expandableListView 总结
  14. python 倒计时库_python实现倒计时小工具
  15. 不是吧!做了3年Android还没看过OkHttp源码?好吧,带你彻底理解一波!
  16. 满意度调查中的NPS题目怎么设置?
  17. IT基础架构规划方案三(IT基础软件和系统规划)
  18. 2021-10-28 MyBatis学习
  19. 融资租赁系统-覆盖业务全场景数据服务
  20. 【回归预测】基于TPA-LSTM(时间注意力注意力机制长短期记忆神经网络)实现数据多输入单输出回归预测附matlab代码

热门文章

  1. 太空飞行计划LibreOJ - 6001(网络流24题)(最大权闭合图)
  2. meso-四(4-N,N,N-三甲基氨基苯基)卟啉(TTMAPP);[5,15-二乙炔基-10,20-二(3,4,5-三(十六烷氧基)苯基)卟啉]锌(DBTCPP-Zn);锌卟啉(TPP-Zn)科研级
  3. 城市绿色货运配送体系评价
  4. 几行代码瞬间卡死电脑
  5. 公有云厂商服务内容对比
  6. 转:vue-cli的webpack模板项目配置文件分析
  7. 满足条件的整数 - 详解
  8. 复杂度分析--时间复杂度
  9. java多线程-爬电影天堂上的电影下载地址
  10. 使用Gitee用于进行团队合作,(配合数据库迁移)