作者 | 法纳斯特

责编 | 郭芮

最近正值复联4上映,笔者也发现了一个有趣的网站,主要是关于漫威人物、漫威电影的图谱。

https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/index.html

其实之前笔者也利用了有关Graph的库实现了一波人物的关系分析,只不过分析结果比较粗糙而已~下面是网站的概况,网站是基于Graph技术开发的。,大家可以一览。

那么人家能做出这么酷炫的关系图,我们自己能不能实现呢?本文就利用网站提供的数据,使用Neo4j(NOSQL图形数据库)进行实战一波。

获取分析

人物及人物关联信息从网站上获取,具体接口如下:

数据为json格式,分别在「characters」和「relationship」中。

这里的信息是分别指托尼·斯达克,关系「0」为朋友,斯蒂文·罗杰斯。

数据获取

具体代码如下:

import json
import requests

headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}

url = 'https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/data/marvel-data.json'
response = requests.get(url=url, headers=headers)
result = json.loads(response.text)

num = 0
names = []
item = {0: 'friend', 1: 'enemy', 2: 'creation', 3: 'family', 4: 'work', 5: 'love'}

for i in result['relationship']:
    subject = result['relationship'][i]['id']
    object = result['relationship'][i]['target_id']

if subject not in names:
        names.append(subject)
    if object not in names:
        names.append(object)

relation = int(result['relationship'][i]['relationship'])
    with open('relation_message.csv', 'a+') as f:
        f.write(subject + ',' + object + ',' + item[relation] + '\n')

for j in names:
    num += 1
    with open('names_message.csv', 'a+') as f:
        f.write(j + ',' + str(num) + '\n')

for k in result['characters']:
    id = result['characters'][k]['id']
    name = result['characters'][k]['name']
    status = result['characters'][k]['status']
    species = result['characters'][k]['species']
    with open('message.csv', 'a+') as f:
        f.write(id + ',' + name + ',' + status + ',' + species + '\n')

最后成功获取数据。

人物名为简称,共计182个人物。

1144条人物关系数据,4大类型,下面是182个人物的一些详情信息:

包含了人物的名字及简称,存活状态,人物属性。

数据可视化

下面通过Neo4j对人物关系进行可视化,Neo4j的安装这里就不细说了,大家可以自行百度。

开启Neo4j服务后,登陆Neo4j网站,初始化界面如下:

先加载第一个文件:

具体代码如下:

LOAD CSV  WITH HEADERS FROM 'file:///names_message.csv' AS data CREATE (:people{name:data.name, id:data.id});

下面加载第二个文件:

具体代码如下:

LOAD CSV  WITH HEADERS FROM "file:///relation_message.csv" AS relations
MATCH (entity1:people{name:relations.subject}) , (entity2:people{name:relations.object})
CREATE (entity1)-[:rel{relation: relations.relation}]->(entity2)

点击1144按钮处,取消限制数,再点击全屏。

这里大致能看出来漫威的人物聚集情况,第一大反派灭霸(thanos),原来这么孤立的。

这里由于人物太多,造成观察不便,所以对结果进行一些筛选,比如筛选托尼·斯达克的朋友,运行下面的代码。

match p=(n:people{name:"tonys"})-[:rel{relation:"friend"}]->() return p;

得到下图结果:

其中「thor」为「雷神」,「stever」为「美队」,「blackw」为「黑寡妇」,「vision」为「幻视」,「peterp」为「蜘蛛侠」,「bruceb」为「绿巨人」。

下面再来看一下美队的女友吧。

佩吉·卡特和她的侄女莎朗·卡特,据说两人样貌极为相像。

总结

本次只是对Neo4j的一些简单操作,后期或许会去深入了解。此外漫威的这些人物信息,还可以玩出很多花样的。

也希望大家能去动手尝试尝试,做一枚硬核铁粉~

作者:法纳斯特,Python爱好者,专注爬虫,数据分析及可视化。

声明:本文首发个人公众号法纳斯特,作者投稿,版权归其个人所有。

【END】

作为码一代,想教码二代却无从下手:

听说少儿编程很火,可它有哪些好处呢?

孩子多大开始学习比较好呢?又该如何学习呢?

最新的编程教育政策又有哪些呢?

下面给大家介绍CSDN新成员:极客宝宝(ID:geek_baby)

戳他了解更多↓↓↓

 热 文 推 荐 

☞ 大疆前员工泄露源码入狱;阿里巴巴普惠字体发布;谷歌搜索加入灭霸彩蛋 | 极客头条

☞ 拿什么重建你,巴黎圣母院?

☞ @程序员,你的技术为啥十年八年也没有进步?

☞厉害了!超越 Google,16 岁少女发明眼疾诊断 AI 模型!

☞ 和 996 对着干的百亿巨头:不打卡,不设 KPI,福利好到爆,却称霸行业 20 年!

☞ 回报率29%! 大神用情感分析创建一个比特币交易算法, 原来交易玩的是心理战

☞ 开发者如何写好技术简历?

☞ 写代码这条路,能走多远?阿里算法专家告诉你

☞ 她说:为啥程序员都特想要机械键盘?这答案我服!

System.out.println("点个在看吧!");
console.log("点个在看吧!");
print("点个在看吧!");
printf("点个在看吧!\n");
cout << "点个在看吧!" << endl;
Console.WriteLine("点个在看吧!");
Response.Write("点个在看吧!");
alert("点个在看吧!")
echo "点个在看吧!"

你点的每个“在看”,我都认真当成了喜欢

硬核黑科技告诉你,漫威十年到底有多少个角色?相关推荐

  1. 硬核黑科技告诉你,漫威 10 年到底有多少个角色?

    作者 | 法纳斯特 责编 | 郭芮 最近正值复联4上映,笔者也发现了一个有趣的网站,主要是关于漫威人物.漫威电影的图谱. https://graphics.straitstimes.com/STI/S ...

  2. 将绿色计算进行到底,蚂蚁集团四大硬核黑科技全公开

    作者 |  伍杏玲 出品 | CSDN 在红包和优惠券齐飞的热闹气氛下,第14个"双11"正式结束.可能大家意料不到的是,你在买单时,绿色计算为降低碳排放"买单" ...

  3. 美的COLMO冰箱凭借硬核黑科技,荣膺行业唯一AI 营养健康品牌奖项

    美的COLMO冰箱凭借硬核黑科技,荣膺行业唯一AI 营养健康品牌奖项 近日,美的COLMO冰箱在2021年中国电冰箱行业高峰论坛中荣获"AI 营养健康品牌 "奖项,该行业论坛由中国 ...

  4. 揭秘支撑双 11 买买买背后的硬核黑科技!

    作者 | 伍杏玲 出品 | CSDN(ID:CSDNnews) 自2009年第一次"双11"起,如今过去11年,"双11"也从原来孤单的"光棍节&qu ...

  5. 秘支撑双 11 买买买背后的硬核黑科技!

    自2009年第一次"双11"起,如今过去11年,"双11"也从原来孤单的"光棍节",变成全民购物狂欢节.果然对象什么的靠一边去,买买买才是王 ...

  6. 硬核黑科技、技术大咖、AI 音乐节……科大讯飞全球 1024 开发者节太燃了!

    (文末有价值1024元的福利赠送) 1956 年 8 月,自达特茅斯会议首次提出"人工智能"以来,人工智能的命运起起伏伏,经历三大浪潮. 在黄金时期的50-70年代,人们发明最早的 ...

  7. 每一节网课背后,硬核黑科技大曝光

    疫情期间,你的家人或亲戚一定也开始宅在家上网课了吧? 熟悉 RTC 技术(实时音视频)的小伙伴都知道,每一堂网课背后,都有一套技术栈.你可以将它们想象成一群辛勤的"小人儿",彼此通 ...

  8. 揭秘“语音交互”背后的AI硬核黑科技!

    第 6 期出席<大咖来了>直播栏目的嘉宾是百度 DuerOS 首席布道师曹洪伟,进行了主题为<面向交互的人工智能>的分享. 主要讲解了语音交互中用到的 AI 技术,如 ASR. ...

  9. 《流浪地球 2》的硬核黑科技

    电影中,由刘德华饰演的量子计算机工程师图恒宇有一个惊心动魄的情节.为了同步启动全球地球发动机,需要重启互联网,避免地壳破碎和地质灾害.而重启互联网的关键则是要启动"根服务器".电影 ...

最新文章

  1. 无法解析 list 中的方法 iterator_Python-list中的append()和extend()方法区别
  2. oracle分区表执行计划分区合并,利用ORACLE分区技术提高管理和性能_PART2
  3. 拿下两个世界第一,阿里人机对话模型成人工智能国际通用标准
  4. 农区养羊如何配套种草
  5. eclipse 查找
  6. SAP CRM WebClient UI WebUI Runtime repository design
  7. 【深度学习】——模型评估指标MAP计算实例计算
  8. [Swift]LeetCode874. 模拟行走机器人 | Walking Robot Simulation
  9. Windows CE如何根据文件名获取其对应文件图标icon
  10. 50条培养内心强大的励志语录
  11. 菜刀、冰蝎、蚁剑、哥斯拉
  12. JMeter测试多用户登录
  13. ASCII Grid
  14. 02.集线器,网桥,交换机
  15. Galera/mysql 集群 备忘
  16. Weisfeiler-Leman test与WL subtree kernel
  17. 计算机病毒手动查杀,电脑中毒了怎么办 如何手动彻底查杀病毒【解决方法】...
  18. 花别人一半时间学好编程!聪明人是怎么做到的?
  19. 2023年三月份图形化二级打卡试题
  20. Pytorch实战 | P6 好莱坞明星图片识别(深度学习实践pytorch)

热门文章

  1. 【金融】【python】使用python处理多种期货数据指标
  2. Windows10 任务栏图标如何居中
  3. double取两位小数_Java语言中:float、double数据类型在内存中是如何存储的
  4. matlab 曲线拐点_如何用matlab把一组数据模拟一个函数图像?并找出曲线拐点?...
  5. 兼容超大图片的处理_N年都没弄明白!PS保存的图片格式都啥意思?
  6. 服务器ip维护无法登录,用DHCP解决服务器硬件管理口没有设置IP无法登录的问题...
  7. Unix网络编程卷一第三章笔记
  8. python 源文件中文输入
  9. (转)Google 选择 Jetty, 放弃 Tomcat
  10. 透彻解析云原生在数字化转型中的应用实践,PaaS功不可没