文章目录

  • 前言
  • 一、数据描述
  • 二、数据预处理
  • 三、犯罪时空分析
    • 1.犯罪类型分析
    • 2.犯罪时间特征分析
      • (1)基于年维度
      • (2)基于月维度
      • (3)基于日维度
    • 3.犯罪空间特征分析
  • 四、基于犯罪空间理论的结论

前言

波士顿作为美国马萨诸塞州的首府和最大城市,美国新英格兰地区最重要的城市,被称为美国的雅典,是公认的世界性大城市,长期以来却被犯罪问题所困扰。选取的数据集由波士顿警察局提供,其中记载了波士顿市2015年到2018年犯罪案例。根据其中信息,可以针对波士顿城市犯罪问题展开相关分析研究。

数据来源:https://www.kaggle.com/datasets/AnalyzeBoston/crimes-in-boston

一、数据描述

数据集共319073条数据,由17个特征字段组成

INCIDENT_NUMBER 事件编号
OFFENSE_CODE 犯罪代码
OFFENSE_CODE_GROUP 犯罪代码组
OFFENSE_DESCRIPTION 犯罪行为描述
DISTRICT 犯罪地区
REPORTION_AREA 犯罪报告区域
SHOOTING 是否发生枪击
OCCURRED_ON_DATE 犯罪发生日期
YEAR 年份
MONTH 月份
DAY_OF_WEEK 星期
HOUR 小时
UCR_PART 案件发生警区
STREET 案件发生街道
Lat 纬度
Long 经度
Location 位置

二、数据预处理

missingno是一个可以将缺失值情况进行可视化的第三方库,利用该库查看数据集特征值缺失情况
代码如下(示例):

%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
import seaborn as sns
myfont1 = FontProperties(fname = "simhei.ttf",size=18)
myfont2 = FontProperties(fname = "simhei.ttf",size=12)
#导入数据集
crime_boston = pd.read_excel(r'D:\dataset\crime.xlsx',sheet_name='crime')
#绘制缺失值热图
import missingno as msno
msno.matrix(crime_boston,labels=True)

结果如下:

三、犯罪时空分析

1.犯罪类型分析

数据集中“OFFENSE_CODE_GROUP”(犯罪代码组)特征对犯罪类型划分粒度较为合适,因此选定该字段作为各犯罪类型划分标准。通过groupby()函数对犯罪类型进行分类汇总,共计67种分类。

df = crime_boston.groupby('OFFENSE_CODE_GROUP').count()

为了方面后续制图,整理了分类汇总的结果为Excel表格(为了方面后续制图,可以将结果升序排列,为了操作简单,我直接在Excel中进行的排序操作)

作为crime_type导入

调用PyEcharts第三方库对犯罪类型及其数量进行可视化展示

type_ls = []
for i in crime_type['type']:type_ls.append(i)num_ls = []
for i in crime_type['numbers']:num_ls.append(i)from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker
from pyecharts.globals import ThemeType
c = (Bar(init_opts=opts.InitOpts(width="1100px", height="1000px",theme=ThemeType.ESSOS)).add_xaxis(type_ls).add_yaxis("犯罪数量", num_ls).reversal_axis().set_global_opts(title_opts=opts.TitleOpts(title="2015年-2018年波士顿犯罪类型及其数量")).set_series_opts(label_opts=opts.LabelOpts(position="right"))
)
c.render_notebook()

结果如图所示

通过图可以看出,盗窃罪以25935起的数量,成为波士顿市发生频率最高的犯罪类型;其他类型犯罪包括非法侵入他人住宅、绑架未遂、对他人威胁造成身体伤害等,这个罪名以18075起的数量位列第二;排名前五的罪名还有药物违规、简单暴力罪和故意破坏公共财物罪。生物威胁罪、入室盗窃、贩卖人口、赌博等犯罪在波士顿市案发较少。

2.犯罪时间特征分析

(1)基于年维度

首先查看波士顿市犯罪数量随年份变化情况,绘制南丁格尔玫瑰图进行展示

course = ['2015年','2016年','2017年','2018年']
score = [53388,99114,100886,65685]
c = (Pie().add("",[list(z) for z in zip(course,score)],radius=["10%","75%"],rosetype='area').set_global_opts(title_opts=opts.TitleOpts(title='不同年份的犯罪数量',pos_top='10%',pos_left='40%'),legend_opts=opts.LegendOpts(type_="scroll",pos_top='20%',pos_left='81%',orient='vertical')).set_series_opts(label_opts = opts.LabelOpts(formatter='{b}:{c}'))
)
c.render_notebook()


数据集记录的时间跨度为2015年6月15日到2018年9月3日,2015年、2018年的数据不完整,因此在该维度着重分析2016年和2017年数据。结果显示,2017年犯罪总数同比增长1.79%。
接下来将视角由犯罪整体情况维度转向不同的犯罪类型,同样利用groupby()函数进行汇总分析。结果显示,2016年、2017年报告记录犯罪类型分别为65种、66种,2017年比2016年多出一项赌博犯罪,共报告6例;入室盗窃未遂仅在2016年被报告,生物威胁类犯罪仅发生在2017年。对2016年、2017年共有的犯罪类型变化趋势进一步分析,查看犯罪类型数量变化。
还是为了后续制图方便,把汇总结果放在Excel表里

导入表格为crime_change,选取数量变化较大的犯罪类型绘制正负条形图

plt.rcParams['axes.unicode_minus']=False
sns.set(style="ticks") color=pd.cut(crime_change["change"],[-600,0,700],labels=["b","r"]) #对不同区间进行颜色划分
xs=np.arange(len(color))
fig,ax=plt.subplots(figsize=(10,6))
plt.barh(xs,crime_change["change"],height=0.6,color=color)
plt.yticks(xs,crime_change["type"],fontproperties=myfont2)
# yticks = mtick.FormatStrFormatter("%.1f%%")
# ax.yaxis.set_major_formatter(yticks)
plt.xlabel("数量变化",fontproperties=myfont2)
plt.title("不同犯罪类型数量增减变化",fontproperties=myfont1)
# ax.yaxis.grid(True) # y坐标轴的网格使用主刻度
for item in ['top', 'right', 'left',"bottom"]:ax.spines[item].set_visible(False) #去掉边框
# plt.savefig('barchar24.png', dpi=1000, transparent=True)
# plt.show()


通过图5可以直观地看出药物违规滥用犯罪数量减少最多,共减少525起,同比下降9.94%。财产类犯罪调查数量增长最多,共增加618起,同比增长18%。以变化率来看,贩卖人口、车牌类犯罪、酒类犯罪、贪污罪以及卖淫犯罪增幅最大,同比增长率分别为150%、36.55%、28.78%、28.57%以及24.29%;降幅最大的五类犯罪有爆炸罪、过失致人死亡罪、非法集会、刑事骚扰罪以及无证经营罪,同比下降率分别为71.05%、40%、27.03%、20%以及16.07%。

波士顿市经济发达、生活水平较高,私家车普及率较高,因此车牌类犯罪、酒后驾驶罪等围绕车辆的犯罪数量出现增长;作为马萨诸塞州首府,波士顿在马萨诸塞州政治生活中扮演着中演角色。波士顿有着大量的行政、司法机关,相应官员数量也较多,这难免会使贪污罪、财产类犯罪调查数量出现增长。结合实际,权色问题往往相伴出现,一些腐败分子手中的权力会让他们的欲望更加膨胀,这给卖淫人员提供了大量犯罪机会,在贪利动机的促使下,越来越多的女性走上了卖淫犯罪的道路。

(2)基于月维度

依旧还是分类汇总

crime_month= crime_boston.groupby('MONTH').count()

绘制日历热图对犯罪数量进行可视化展示

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import calmapfig,ax=calmap.calendarplot(crime_month['INCIDENT_NUMBER'],  fillcolor='grey', linecolor='w',linewidth=0.1,cmap='RdYlBu_r',yearlabel_kws={'color':'black', 'fontsize':12},fig_kws=dict(figsize=(10,6),dpi= 80))
fig.colorbar(ax[0].get_children()[1], ax=ax.ravel().tolist())
plt.show()


PS:热力图风格类型我放到这里啦,需要调整日历热力图风格的小伙伴们可以选择自己喜欢的

'Accent', 'Accent_r', 'Blues', 'Blues_r', 'BrBG', 'BrBG_r', 'BuGn', 'BuGn_r',
'BuPu', 'BuPu_r', 'CMRmap', 'CMRmap_r', 'Dark2', 'Dark2_r', 'GnBu', 'GnBu_r',
'Greens', 'Greens_r', 'Greys', 'Greys_r', 'OrRd', 'OrRd_r', 'Oranges', 'Oranges_r',
'PRGn', 'PRGn_r', 'Paired', 'Paired_r', 'Pastel1', 'Pastel1_r', 'Pastel2', 'Pastel2_r',
'PiYG', 'PiYG_r', 'PuBu', 'PuBuGn', 'PuBuGn_r', 'PuBu_r', 'PuOr', 'PuOr_r', 'PuRd',
'PuRd_r', 'Purples', 'Purples_r', 'RdBu', 'RdBu_r', 'RdGy', 'RdGy_r', 'RdPu', 'RdPu_r',
'**RdYlBu', 'RdYlBu_r', 'RdYlGn', 'RdYlGn_r', 'Reds', 'Reds_r', 'Set1', 'Set1_r', 'Set2', 'Set2_r',
'Set3', 'Set3_r', 'Spectral', 'Spectral_r', 'Wistia', 'Wistia_r', 'YlGn', 'YlGnBu',
'YlGnBu_r', 'YlGn_r', 'YlOrBr', 'YlOrBr_r', 'YlOrRd', 'YlOrRd_r', 'afmhot', 'afmhot_r', 'autumn',
'autumn_r', 'binary', 'binary_r', 'bone', 'bone_r', 'brg', 'brg_r', 'bwr', 'bwr_r', 'cividis',
'cividis_r', 'cool', 'cool_r', 'coolwarm', 'coolwarm_r', 'copper', 'copper_r', 'crest', 'crest_r', 'cubehelix',
'cubehelix_r', 'flag', 'flag_r', 'flare', 'flare_r', 'gist_earth', 'gist_earth_r', 'gist_gray',
'gist_gray_r', 'gist_heat', 'gist_heat_r', 'gist_ncar', 'gist_ncar_r', 'gist_rainbow', 'gist_rainbow_r',
'gist_stern', 'gist_stern_r', 'gist_yarg', 'gist_yarg_r', 'gnuplot', 'gnuplot2', 'gnuplot2_r', 'gnuplot_r',
'gray', 'gray_r', 'hot', 'hot_r', 'hsv', 'hsv_r', 'icefire', 'icefire_r', 'inferno', 'inferno_r', 'jet',
'jet_r', 'magma', 'magma_r', 'mako', 'mako_r', 'nipy_spectral', 'nipy_spectral_r', 'ocean', 'ocean_r',
'pink', 'pink_r', 'plasma', 'plasma_r', 'prism', 'prism_r', 'rainbow', 'rainbow_r', 'rocket', 'rocket_r',
'seismic', 'seismic_r', 'spring', 'spring_r', 'summer', 'summer_r', 'tab10', 'tab10_r', 'tab20', 'tab20_r',
'tab20b', 'tab20b_r', 'tab20c', 'tab20c_r', 'terrain', 'terrain_r', 'turbo', 'turbo_r', 'twilight', 'twilight_r',
'twilight_shifted', 'twilight_shifted_r', 'viridis', 'viridis_r', 'vlag', 'vlag_r', 'winter', 'winter_r'

四个年份的犯罪数据链变化及走势基本相同,从初夏的5月到初秋的9月均处在犯罪的高峰期,自11月份入冬起到次年2月份形成一个犯罪低谷期。由此可以认为,波士顿市的犯罪在总体上具备一定的季节性特征。
基于常规逻辑认识,一般认为盗窃罪、暴力犯罪、强奸罪数量变化与季节变化相关性较强,由于数据集中缺少强奸罪的犯罪记录,因此下面将对盗窃罪和暴力犯罪的季节性特征进一步探索。
由于原始数据集中”OCCURRED_ON_DATE“字段包含时间点,不方便后续可视化,所以我把原来的时间点信息去掉,将原来的数据存入到了一个新的Excel表格(crime_month)中(虽然麻烦些,但能抓老鼠的就是好猫!)

crime_month = pd.read_excel(r'D:D:\dataset\crime.xlsx',sheet_name='crime_month')

使用时间序列分解法进行分析,得到盗窃罪的长期趋势、季节性变化以及残差散点图

#盗窃罪时间序列分解
larceny = crime_month[crime_month['OFFENSE_CODE_GROUP']=='Larceny']
larceny = larceny.groupby('OCCURRED_ON_DATE').count()
larceny = larceny.iloc[:,0:1]
# decomposition时间序列分解
from statsmodels.tsa.seasonal import seasonal_decompose
#model : {"additive", "multiplicative"}, optional,加法模型,乘法模型
result = seasonal_decompose(larceny, model='additive')
# 添加图像标题,x,y为浮点型,表示标题在图像水平、垂直方向相对位置
result.plot().suptitle('盗窃罪时间序列分解',x=0.55, y=1.04, fontsize=16, color='k',fontproperties=myfont2)


盗窃罪在10月到12月的冬季和初春3月迎来两次数量高峰。波士顿属温带大陆性气候,全年四季分明,冬有严寒、夏有酷暑。冬季和初春时分,人们穿着较厚,对行窃行为感知程度低,盗窃犯罪更易得手,这也使得这段时期成为盗窃犯罪的高发期。
使用同样的时间序列分解方法,对暴力犯罪(攻击+抢劫)进行季节性分析。

暴力犯罪(攻击+抢劫)高发期出现在每年的夏季,以5月份为最。春夏之际,随着气温回暖,人们户外活动量增加,活动空间范围扩大,这间接增加了人与人之间发生冲突的可能性,加之温度的升高不利于人的情绪稳定,诱发暴力犯罪的因素叠加,使得暴力犯罪的数量随着温度的升高也出现增长。

(3)基于日维度

犯罪现象不仅受季节变换影响,随着白昼黑夜交替,犯罪数量及表现形态也因时而异,呈现出一定的时间规律性,下面研究波士顿市一日当中的整体发案情况,调用pyecharts绘制折线图

crime_day = crime_boston.groupby('HOUR').count()
y = []
for i in crime_day['INCIDENT_NUMBER']:y.append(i)
ls=crime_day.index.values.tolist()
x=[]
for i in ls:i=str(i)+'时'x.append(i)
#绘制折线图
import pyecharts.options as opts
from pyecharts.charts import Line
line=(Line().add_xaxis(xaxis_data=x).add_yaxis(series_name="案发数量",y_axis=y).set_series_opts(markarea_opts=opts.MarkAreaOpts(data=[opts.MarkAreaItem(name="案发低谷期", x=("3时", "6时")),opts.MarkAreaItem(name="平台期", x=("10时", "15时")),opts.MarkAreaItem(name="案发高峰期", x=("16时", "19时")),])).set_global_opts(title_opts=opts.TitleOpts(title="犯罪数量逐时变化"),visualmap_opts=opts.VisualMapOpts(is_piecewise=True,dimension=0,pieces=[{"gt": 0, "lte": 3, "color": "green"},{"gt": 3, "lte": 6, "color": "#2874B2"},{"gt": 6, "lte": 10, "color": "#F7BA0B"},{"gt": 10, "lte": 15, "color": "orange"},{"gt": 15, "lte": 19, "color": "red"},{"gt": 19, "color": "green"},],pos_right=0,pos_bottom=100)))
line.render_notebook()


一天之中的犯罪数量变化趋势与人们作息规律大致吻合。凌晨3时到6时是一天之中的案发低谷期;随着白昼的到来,人的活动性增强,人与人之间接触交流增多,6时到10时犯罪数量一路攀升,增长率达225.2%;10时到15时迎来平台期,除去12时犯罪数量陡增,其余时刻案发数量均在16500起左右;16时至19时是一天中案发的高峰期,其中17时案发数量最多;19时之后到次日3时,犯罪数量逐时减少。
继续细化研究对象粒度,结合犯罪类型分析盗窃罪、暴力类犯罪数量变化。

#四种盗窃类型的数量随小时的变化
daoqie = crime_boston[crime_boston['OFFENSE_CODE_GROUP']=='Larceny']
daoqie = daoqie.groupby('HOUR').count()
y1=[]
for i in daoqie['INCIDENT_NUMBER']:y1.append(i)
#入室盗窃、商业类盗窃、车辆盗窃y的汇总方式与上面相同
fig,ax=plt.subplots(nrows=2,ncols=2,figsize=(12,8),dpi=1000)
plt.subplot(2, 2, 1)
x = ['0时', '1时', '2时', '3时', '4时', '5时', '6时', '7时', '8时', '9时', '10时', '11时', '12时', '13时', '14时', '15时', '16时', '17时', '18时', '19时', '20时', '21时', '22时', '23时']
plt.plot(x,y1,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y1,width=0.6,color='teal')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('盗窃案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)plt.subplot(2, 2, 2)
plt.plot(x,y2,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y2,width=0.6,color='#F7BA0B')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('入室盗窃案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)plt.subplot(2, 2, 3)
plt.plot(x,y3,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y3,width=0.6,color='#D4652F')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('车辆盗窃案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)plt.subplot(2, 2, 4)
plt.plot(x,y4,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y4,width=0.6,color='#2874B2')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('商业区盗窃案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)# plt.savefig(fname="pic.png",figsize=[8,8])
plt.show()


这四类案件同属盗窃类案件,在案发时间规律上有着相似性和差异性。

盗窃案件和入室盗窃案件数量变化趋势较为相似,案件高发时段分别为12时到18时、8时到12时。犯罪分子实施盗窃行为难免需要与事主或其财物发生接触,12时到18时是一天当中人员流动性最大的时段,在这时实施盗窃行为更易伪装与隐蔽;8时到12时是人们出门上班、上学或活动的时段,家中无人照看,不法分子趁虚而入实施盗窃行为,这一时段也容易出现因疏忽大意未锁好门窗的情况,会给寻机作案者溜门而入的可乘之机;车辆盗窃案件高发期在18时到22时,这一时期是下班晚高峰时期,人们将车辆集中停靠至住宅附近,在夜幕的掩盖下,犯罪者更易穿梭隐蔽在车辆中实施盗窃行为,成功的可能性大大提升;商业区盗窃案件高发期在0时到7时,此时人员大多已经转移至住宅区,商业区人员稀少,且夜间社会防范力量有所减弱,犯罪分子更易得手。

暴力类案件(攻击+抢劫)时间规律与盗窃类案件不同,同样绘制折线图对其进行分析

fig,ax=plt.subplots(nrows=1,ncols=2,figsize=(12,5),dpi=1000)
plt.subplot(1, 2, 1)
x = ['0时', '1时', '2时', '3时', '4时', '5时', '6时', '7时', '8时', '9时', '10时', '11时', '12时', '13时', '14时', '15时', '16时', '17时', '18时', '19时', '20时', '21时', '22时', '23时']
plt.plot(x,y5,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y5,width=0.6,color='teal')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('攻击类案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)plt.subplot(1, 2, 2)
plt.plot(x,y6,color="#D47479",linestyle="--",lw = 1)
plt.bar(x,y6,width=0.6,color='#F7BA0B')
# 绘制x轴标题
plt.xlabel("时间",fontsize=8)
# 绘制y轴标题
plt.ylabel("案发数量",fontsize=8)
plt.title('抢劫案件逐小时变化图',fontsize=9)
plt.xticks(fontsize=6)# plt.savefig(fname="pic.png",figsize=[8,8])
plt.show()


攻击类案件包括故意伤害致人轻伤、故意伤害致人重伤罪及故意杀人罪三类统计数据,这类案件发生的高峰时段为16时至21时及凌晨0时至2时;在抢劫案件中,20时到22时及0时至2时是案件的高发期。结合作案环境来看,深夜凌晨作案有夜幕的掩护,易于隐藏躲避,这在一定程度上加强了犯罪分子的作案心理;从生理角度分析,夜间是人劳作一天之后最为疲惫的时期,警觉性降低,抵抗力减弱,难以抵御外来攻击或拦路劫财行为,许多暴力类犯罪因此发生。

3.犯罪空间特征分析

波士顿是美国最古老的城市之一,其定性较早,城市结构非常紧凑。波士顿可以划分为后湾区、市中心下城区、波士顿南端、波士顿东区、南波士顿滨水创新区、灯塔山社区、金融区等10个住宅区、8个商业区和6个工业区,有着纽伯里街(Newbury Street)、华盛顿街(Washington Street)、哈里森大道(Harrison Ave)及市场街(Market Street)四条商业街。波士顿是全美居民受教育程度最高的城市,举世闻名的哈佛大学和麻省理工学院都位于波士顿的都市区。不同的城市功能区有着不同的犯罪类型和数量分布,下面利用ArcGIS技术分析波士顿的犯罪空间分布格局。

使用ArcGIS符号系统中的热力图模式绘制热力图,首先是盗窃类型犯罪的热力图

盗窃案件主要发生在两大区域。一是波士顿市后湾区,二是波士顿公园地区。

下面还绘制了同属盗窃大类案件中的车辆盗窃、入室盗窃案件的热力图。


车辆盗窃与入室盗窃在地区分布上有一定的相似性。后湾地区和下城中心区有着历史悠久的公寓楼和现代化的玻璃墙大楼,同样是这两类案件的高发区;紧挨着后湾区和下城区的波士顿南段(South End)是众多白领人士的家庭居住地,南段聚集着全美最多的维多利亚时期的红砖大楼,拥有着许多艺术中心和近30个公园,是波士顿宜居区之一,住房的集中必然也会导致车辆停靠的聚集,因此南段区域同样是车辆、入室盗窃案件的热点区域之一;波士顿西北角处还有一个热点区域,那一点是波士顿奥尔斯特区(Allston),该区被许多大学环绕,东北面有哈佛商学院以及哈佛大学的体育馆和球场,东南面有波士顿大学等,不仅如此该区还拥有着四通八达的交通和琳琅满目的美食,因此奥尔斯特区是许多青年大学生的首选居住地。大学生社会经验少,防范意识较差,易被犯罪分子视为侵害目标,这导致该区也有着大量犯罪行为。

药物滥用是波士顿市重点犯罪类型之一,因此同样对药物滥用案件进行了热力图绘制与分析

药物滥用类案件主要分布在三个区域,分别是市中心的下城区、南段区以及西南部的蓝山湾地区。该类案件较盗窃类案件聚集区域性更加明显,经过交互查看,发现三个高发区有着共同的特点,那就是均在医疗、医院等机构附近。

人身伤害类案件与抢劫案是侵害人的生命健康权的严重暴力犯罪,针对该类案件做犯罪空间布局分析,不仅有利于保护公民生命健康权,还对维护社会治安稳定有着重要意义。


抢劫罪与盗窃罪的分布情况相似度很高,其热点区域也集中在市中心的下城区及后湾区。故意伤害案件中,除了下城区与后湾区是犯罪高发地区外,还有多切斯特地区(Dorchester)。

四、基于犯罪空间理论的结论

1.夏季为波士顿市犯罪高发期,故意伤害案件、抢劫案件、盗窃案件、故意损坏财物类案件都为夏季的主要犯罪类型,基于“日”维度来看,在夜晚时分发生上述案件的可能性更大。
2.ArcGIS可视化结果显示,城市中心下城区是波士顿市最主要的犯罪热点区域,下面基于犯罪理性选择理论来对这一点进行解释。犯罪理性选择理论强调潜在犯罪人会在犯罪前倾向于选择最有利、最能满足自己需求的行为模式,他们会仔细评估分析“在何时犯罪”、“何地犯罪”、“对哪些人犯何种罪”等诸如此类的问题。结果显示,在财产类犯罪中,城市中心下城区聚集的商业中心能够满足犯罪人对犯罪收益的期望;在人身伤害类犯罪中,下城区频繁的人口流动和较大的人口密度,又给潜在犯罪人提供了易于犯罪的社会环境,因此城市中心成为了各类犯罪分子实施犯罪的首选地。
3.多切斯特区是波士顿重要犯罪集中区,该地区适用社会失序理论。社会失序理论是指居民因受到人口不稳定性、种族混杂导致的文化异质性以及低收入或低社会地位等社会失序因素的影响,而容易产生犯罪行为。上文基于社会因素、阶级构成因素、经济发展因素对多切斯特地区高犯罪特征进行了多维度阐释,与社会失序理论十分契合。

一个小白关于波士顿犯罪数据集的分析就到这里啦~

波士顿犯罪数据时空分析及可视化相关推荐

  1. 爬取最好大学网数据、分析并可视化操作

    爬虫爬取数据.分析并可视化操作 本次对最好大学网进行爬虫示例. 1.获取网页响应 def getHTMLText(url):try:resp = request.urlopen(url)html_da ...

  2. 使用python生成词云——聆心云心理健康服务平台数据可视分析和可视化

    实验题目:聆心云心理健康服务平台数据可视分析和可视化 实验目的和要求:统计出在聆心云平台做沙盘游戏的次数.根据各次沙盘游戏所使用的沙具和进行的操作数据进行词云可视化,掌握Python词云制作方法 实验 ...

  3. 对新闻数据的分析与可视化

    该任务是在大学本科的时候的一个小作业,主要是对湾湾的新闻数据进行一个采集分析与可视化,任务比较简单.任务可分为两个部分,一个是爬取中时新闻网站的数据,二是对该数据进行处理与分析. 一.爬取数据数据: ...

  4. Python对阿里巴巴、谷歌、腾讯等六家公司股票数据进行分析与可视化实战(附源码 超详细)

    需要源码请点赞关注收藏后评论区留言私信~~~ 下面针对阿里巴巴.谷歌.亚马逊.Facebook.苹果和腾讯六家公司股票数据进行了分析与可视化描述,数据分析前需要安装互联数据获取包pandas-data ...

  5. 文本数据可视化_非结构化文本数据的分析和可视化

    文本数据可视化 Stuck behind the paywall? Read this article with my friend link here. 卡在收费墙后面? 在这里与我的朋友链接阅读本 ...

  6. Scanpy(六)空间转录组数据的分析与可视化

    目录 Reading data QC and preprocessing Manifold embedding and clustering based on transcriptional simi ...

  7. java大数据日志分析与可视化设计

    伴随着大数据科技的发展和成熟,越来越多的企业和机构使用大数据来进行分析和决策.其主要的分析数据来源于日志文件,所以对日志文件的分析是很重要的也是很关键的步骤. 本系统实现的功能是,将日志信息生成.日志 ...

  8. 如何使用SQL对数据进行分析和可视化

    什么是数据分析? 数据分析可以描述为清理.转换和处理原始数据以提取可操作的相关信息以帮助企业做出明智决策的过程.数据分析过程提供了有用的见解和统计数据,可以以表格.图表和图形的形式呈现. 在本文中,您 ...

  9. 【宝可梦数据分析–数据相关性分析及可视化】

    #数据集链接:https://pan.baidu.com/s/1U0XDJmi_lYI84UkPHgpDfA #提取码:1234 #导入相关库并打开CSV文件 import matplotlib.py ...

最新文章

  1. Ubuntu任务栏Tint2安装与使用
  2. 微电网日前优化调度 。算例有代码(2)
  3. android 剪贴板管理器,安卓剪贴板管理(Clipper Plus)
  4. 该虚拟机似乎正在使用
  5. 【转】eclipse技巧1
  6. dbms数据库管理系统_DBMS中的数据库语言
  7. fortran调用matlab画图,[转载]Matlab与Fortran的交互--基本概念
  8. 高薪、稀缺人才必备哪些技能?BDTC大会告诉你,附最新议程!
  9. 华为海思总裁凌晨邮件燃爆全国:多年备胎一夜转“正”,今后要科技自立
  10. JavaScript JSON 对象使用详解、JSON. parse()、JSON. stringify()
  11. tm影像辐射定标_ENVI中TM的辐射定标和大气校正
  12. mapped file has no Team ID and is not a platform binary (signed with custom identity or adhoc?
  13. IMDB电影排行爬取分析
  14. 浏览器使用默认端口9006连接TinyWebServer服务器连接不上?
  15. python里面bif是啥意思_什么是BIF?
  16. http接口、api接口、RPC接口、RMI、webservice、Restful等概念
  17. 加油卡html界面6,油卡核销.html
  18. 关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript
  19. Java8新特性-使用Stream流来实现递归遍历树形结构(案例)
  20. [RISC-V MCU 应用开发]基于CH32V307和TtencentOS Tiny的物联网心率监测

热门文章

  1. 华为新人培养计划曝光!(新员工培训就该这么做)
  2. 视觉SLAM笔记(40) 特征点的缺陷
  3. 生产计划管理软件功能是什么?对生产管理有何好处?
  4. Android LruCache和DiskLruCache相结合打造图片加载框架(仿微信图片选择,照片墙)
  5. ubuntu20.04 TL-WDN5200H无线usb网卡在Linux上的使用
  6. Arduino Nano 引脚分配图及定义详解
  7. java 编译器原理_作业5:Java编译原理
  8. php curl模拟wss,使用Poco C++库创建websocket安全访问(wss)客户端
  9. AE快速批量添加字幕
  10. 将小图标转换成字体图标代码