伯灵顿佛蒙特大学故事计算实验室的安德鲁·里根(Andrew Reagan)和他的研究团队用情绪分析绘制了约1300多个故事的情感线,然后使用数据挖掘技术来揭示最常见的情感线是什么样子。研究中,安德鲁·里根和他的研究团队发现,形成复杂叙事的基石仅仅源自于六种核心故事线。

◆ ◆ ◆

导言

人们天生喜欢去寻找并转述各类故事。我们所拥有的那种分享信息并定义自身存在性的能力就可以很好地解释为什么我们天生沉迷于此。

而现在,随着计算能力、语言处理和文本数字化三种技术方面的改善,以文字“大数据”来研究某种文化成为了可能。

正如美国作家库尔特·冯内古特(Kurt Vonnegut)曾经说过的那样:“这些故事都有着美丽而方便计算的格式,没有理由说我们不能把它们套进计算机的算法里去。”

图1 J.K.罗琳所著的《哈利·波特与死亡圣器》的情感线

(注:整个系列共七部书可以被定义为一个复杂的“杀死怪物”情节。数据分析:Hedonometer / Andy Reagan / Kirsch)

伯灵顿佛蒙特大学故事计算实验室的安德鲁·里根(Andrew Reagan)和他的研究团队用情绪分析绘制了约1300多个故事的情感线,然后使用数据挖掘技术来揭示最常见的情感线是什么样子。研究中,安德鲁·里根和他的研究团队发现,形成复杂叙事的基石仅仅源自于六种核心故事线。

这项研究令人着迷的奇妙之处就在于首次提出了基本故事线的确存在的实验性依据,并由此解开了讲故事之所以能够吸引人们的本质特征。

◆ ◆ ◆

实验展示

科学家收集了1327本书作为样本,这些样本书绝大多数采用了收录进古登堡计划中的元数据来虚构故事(P.S.古登堡计划是于1971年发起的世界上第一个数字图书馆。其中所有书籍的输入都是由志愿者完成的)。为了生成样本书的情感线,研究者将文本分为了一个个10000的小块,并分析每个小块里的所表达的感情。(如图2所示)

图2

研究中所有样本书的故事线和相应的数据可视化如图3所示。

六种基本故事线形态分别为:


  1. “白手起家”(故事线主要特征形态为:上升)

  2. “悲剧”或“凤凰变麻雀”(故事线主要特征形态为:下降)

  3. “陷入困境的人”(故事线主要特征形态为:先降后升)

  4. “伊卡洛斯” (故事线主要特征形态为:先升后降)(P.S.希腊神话中代达罗斯的儿子。在用蜡和羽毛做的翅膀逃离克里特岛时,因飞得太高,双翼上的蜡遭太阳融化跌落水中丧生,被埋葬在一个海岛上。)

  5. “灰姑娘”(故事线主要特征形态为:先升后降再升)

  6. “俄狄浦斯”(故事线主要特征形态为:先降后升再降)(P.S. 俄狄浦斯是外国文学史上典型的命运悲剧人物。他在不知情的情况下,杀死了自己的父亲并娶了自己的母亲。)


图3 六种基本故事线的形态展示

(点击查看高清图片)

(注:从左至右从上到下依次为:“白手起家”、“陷入困境的人”、“灰姑娘”、“悲剧”、“俄狄浦斯”、“伊卡洛斯”。数据分析:Reagan et. al/ University of Vermont)

◆ ◆ ◆

结论

当研究团队确定了六种基本的情感故事线之后,又进一步观察了情感线与其故事下载量之间的关系,并据此探索最受欢迎的情感故事线类型。最终的研究结果显示,最受欢迎的故事往往遵循“伊卡洛斯”和“俄狄浦斯”两种类型的情感故事线。

另外,把众多感情线揉到一起的那些更复杂的故事同样受到追捧。事实上,研究结果显示,最受欢迎的故事往往是连续两次出现“陷入困境的人”的,还有“灰姑娘”紧接一个“悲剧”的故事。

原文发布时间为:2016-10-28

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

可视化1300个故事 揭秘6种情节套路相关推荐

  1. 放羊的和砍柴的故事的N种结局

    有个放羊的和砍柴的故事,换种角度也许就不一样了,未必都是消极的. 你是砍柴的,他是放羊的,你和他聊了一天,他的羊吃饱了,你的柴呢?砍柴的陪不起放羊的- 请放弃你的无效社交! 砍柴人陪放羊人聊了一天,表 ...

  2. 揭秘6种最有效的社会工程学攻击手段及防御之策

    本文讲的是揭秘6种最有效的社会工程学攻击手段及防御之策, 世界第一黑客凯文•米特尼克在<欺骗的艺术>中曾提到,人为因素才是安全的软肋.很多公司在信息安全上投入重金,最终导致数据泄露的原因却 ...

  3. 面试了500个年轻人,发现混得好的,都会这5种说话套路

    老K的团队里,许多人的背景履历很好,智商也挺高,但是一开口说话,MD就像智障一样,那一刻你会怀疑他的斯坦福学位是不是在中关村念的. 关于技术人员的沟通软技能,在上一篇推文里介绍过了,<领导说,不 ...

  4. 数据治理工作的几种推进套路

    一.顶层设计法 顾名思义,顶层设计法就是先做一个数据治理顶层设计的规划,然后按照规划执行即可. 做过咨询的彭友都知道,顶层设计.战略咨询都会根据战略目标拆解KPI,然后设立对应的支撑项目,并且根据优先 ...

  5. 读书笔记 - 学会写作: 五个吸引人的情节套路

    五个吸引人的情节套路 为了更好地理解故事编写套路,分别以五个国家的电影套路举例,看看电影编剧是如何设计出有特色又吸引人的故事的.模板种类不多,一只手就数得过来. 美国好莱坞式编剧 - 个人英雄主义的胜 ...

  6. 数据治理工作的8种推进套路(下)

    编 辑:彭文华 来 源:大数据架构师(ID:bigdata_arch) 彭友们好,我是老彭啊.周二写了一个数据治理工作8种推进方式,时间关系没写完,结果一大堆人私信我催稿 我说你们催稿的彭友能不能帮我 ...

  7. 11.11数据可视化大屏设计揭秘

    万众期待的京东11.11全球热爱季落下帷幕,巅峰狂欢中,多少人的购物车在这一天成为了GDP野马,创造的商业价值年年翻新,节节拔高,这背后的数据和流量,让消费者和企业更加直观.明确地捕捉到最新的消费风向 ...

  8. SPIDR - 完美分割用户故事的五种简单技巧

    根据INVEST原则,对用户故事的要求是它必须"足够小"或具有合适的大小.用户故事应该足够小,可以在冲刺中完成6-10个.当然这也取决于开发团队的速度.为了原则上实现这一目标,必须 ...

  9. 分类结果可视化python_可视化分类结果的另一种方法

    分类结果可视化python I love good data visualizations. Back in the days when I did my PhD in particle physic ...

最新文章

  1. asp.net三种重定向方法的总结
  2. FPGA配置 - 基于SPI FLASH的FPGA多重配置(Xilinx)
  3. vscode和anaconda结合的环境配置
  4. Java 中关于 null 对象的容错处理
  5. VTK修炼之道80:VTK开发基础_智能指针与引用计数
  6. eclipse下使用git插件上传代码至github
  7. java sax解析xml_【转】java使用sax解析xml文件
  8. MaxCompute - ODPS重装上阵 第一弹 - 善用MaxCompute编译器的错误和警告
  9. 自己动手开发编译器(十)miniSharp语法分析器
  10. notepad批量删除html元素,Notepad++几个常用删除类正则表达式汇总(收藏)
  11. 书法是什么?书法的美从何说起?
  12. portlet_Portlet生命周期
  13. Python多行字符串
  14. 《完美软件》读书笔记10:有关测试的主要误区
  15. 【Win10自带录屏工具】
  16. [转载] DeepinC . Mr_zkt 集合选数
  17. Gartner发布首份中国RPA魔力象限报告,弘玑Cyclone被重点推荐
  18. 对一次微信升级事件的自我反省:思维方式决定解决问题能力
  19. 中国股神透露独特选股思路
  20. android java 启用4g_[RK3399] 修改移动网络默认为4G

热门文章

  1. 《架构师杂志》评述:Scott Guthrie
  2. 芯片行业模式优缺点及巨头代表梳理
  3. centost查看网络信息_监控io性能、free命令、ps命令、查看网络状态、Linux下抓包...
  4. python3使用mbruteforce报错
  5. 安卓手机使用Alpine Term APK安装Linux系统,并安装docker
  6. cmd下载远程linux的文件,Java利用ssh协议实现从远程Linux服务器下载文件和文件夹...
  7. 微信小程序分包和主包
  8. Matplotlib学习笔记(三)
  9. 易经中最有智慧的20条人生哲理!
  10. 缺氧游戏黑科技计算机,缺氧实用黑科技研究分享