目录

一、概念解读

1.1、Python对象

1.2、可变与不可变对象

1.3、引用

二、逐步深入:引用赋值

2.1、不可变对象的引用赋值

三、主旨详解:浅拷贝、深拷贝

3.1、浅拷贝

3.1.1、不可变对象的拷贝

3.1.2、可变对象的拷贝

3.2、深拷贝

四、查漏补缺


在平时工作中,经常涉及到数据的传递。在数据传递使用过程中,可能会发生数据被修改的问题。为了防止数据被修改,就需要再传递一个副本,即使副本被修改,也不会影响原数据的使用。为了生成这个副本,就产生了拷贝——今天就说一下Python中的深拷贝与浅拷贝的问题。


一、概念解读

数据拷贝会涉及到Python中对象、可变类型、引用这3个概念,先来看看这几个概念,只有明白了它们才能更好地理解拷贝到底是怎么一回事。

1.1、Python对象

在Python中,对对象有一种很通俗的说法,万物皆对象。说的就是构造的任何数据类型都是一个对象,无论是数字、字符串、还是函数,甚至是模块、Python都对当做对象处理。

所有Python对象都拥有三个属性:身份、类型、值

看一个简单的例子:

name = 'python'                     # name对象
print('ID:', id(name))              # id:身份的唯一标识
print('Type:', type(name))          # type:对象的类型,决定了该对象可以保存什么类型的值
print('Value:', name)               # 对象的值,表示的数据

结果输出:

1.2、可变与不可变对象

在Python中,按更新对象的方式,可以将对象分为2大类:可变对象与不可变对象。

  1. 可变对象:  列表、字典、集合。所谓可变是指可变对象的值可变身份是不变的
  2. 不可变对象:数字、字符串、元组。不可变对象就是对象的身份和值都不可变。新创建的对象被关联到原来的变量名,旧对象被丢弃,垃圾回收器会在适当的时机回收这些对象。
val1 = 'python'
print('ID of val1 --> L1:', id(val1))# 由于val1是不可变的,重新创建java对象,随之id改变,旧对象python会在某个时刻被回收
val1 = 'java'
print('ID of val1 --> L2:', id(val1))

1.3、引用

在Python程序中,每个对象都会在内存中申请开辟一块空间来保存该对象,该对象在内存中所在位置的地址被称为引用。在开发程序时,所定义的变量名实际就对象的地址引用。

引用实际就是内存中的一个数字地址编号,在使用对象时,只要知道这个对象的地址,就可以操作这个对象,但是因为这个数字地址不方便在开发时使用和记忆,所以使用变量名的形式来代替对象的数字地址。在Python中,变量就是地址的一种表示形式,并不开辟开辟存储空间。

就像 IP 地址,在访问网站时,实际都是通过 IP 地址来确定主机,而 IP 地址不方便记忆,所以使用域名来代替 IP 地址,在使用域名访问网站时,域名被解析成 IP 地址来使用。

通过一个例子来说明变量和变量指向的引用就是一个东西:

age = 18
print('ID of age:\t', id(age))
print('ID of 18:\t', id(18))


二、逐步深入:引用赋值

上边已经明白,引用就是对象在内存中的数字地址编号,变量就是方便对引用的表示而出现的,变量指向的就是此引用。赋值的本质就是让多个变量同时引用同一个对象的地址。

那么在对数据修改时会发生什么问题呢?

2.1、不可变对象的引用赋值

对不可变对象赋值,实际就是在内存中开辟一片空间指向新的对象,原不可变对象不会被修改。原理图如下:

下面通过案例来理解一下:

a与b在内存中都是指向1的引用,所以a、b的引用是相同的。

a = 1
b = a
print('ID of a:', id(a))
print('ID of b:', id(b))

现在再给a重新赋值,看看会发生什么变化?从下面不难看出:当给a赋新的对象时,将指向现在的引用,不在指向旧的对象引用。

a = 1
b = a
a = 2
print('ID of a:', id(a))
print('ID of 2:', id(2))
print('ID of b:', id(b))
print('ID of 1:', id(1))

2.2、可变对象的引用赋值

可变对象保存的并不是真正的对象数据,而是对象的引用。当对可变对象进行赋值时,只是将可变对象中保存的引用指向了新的对象。原理图如下:

仍然通过一个实例来体会一下,可变对象引用赋值的过程:当改变l1时,整个列表的引用会指新的对象,但是l1与l2都是指向保存的同一个列表的引用,所以引用地址不会变。

l1 = [1, 2, 3]
l2 = l1
print('ID of l1 --> Level1:', id(l1))
print('ID of l2 --> Level1:', id(l2))
l1[0] = 11
print('ID of l1 --> Level2:', id(l1))
print('ID of l2 --> Level2:', id(l2))


三、主旨详解:浅拷贝、深拷贝

经过前2部分的解读,大家对对象的引用赋值应该有了一个清晰的认识了。那么Python中如何解决原始数据在函数传递之后不受影响?这个问题Python已经帮我们解决了,使用对象的拷贝或者深拷贝就可以愉快解决了。

下面具体来看看Python中的浅拷贝与深拷贝是如何实现的。

3.1、浅拷贝

为了解决函数传递后被修改的问题,就需要拷贝一份副本,将副本传递给函数使用,就算是副本被修改,也不会影响原始数据 。

3.1.1、不可变对象的拷贝

不可变对象只在修改的时候才会在内存中开辟新的空间,而拷贝实际上是让多个对象同时指向一个引用,和对象的赋值没区别。

同样的,通过一个实例来感受一下:不难看出,a与b指向相同的引用,不可变对象的拷贝就是对象赋值。

import copya = 10
b = copy.copy(a)
print('ID of a:', id(a))
print('ID of b:', id(b))

3.1.2、可变对象的拷贝

对于不可变对象的拷贝,对象的引用并没有发生变化,那么可变对象的拷贝会不会和不可变对象一样了?我们接着往下看。

通过下面的实例能看出:可变对象的拷贝会在内存中开辟一个新的空间来保存拷贝的数据。当再改变之前的对象时,对拷贝之后的对象没有任何影响。

import copyl1 = [1, 2, 3]
l2 = copy.copy(l1)
print('ID of l1 --> Level1:', id(l1))
print('ID of l2 --> Level1:', id(l2))
l1[0] = 11
print('ID of l1 --> Level2:', id(l1))
print('ID of l2 --> Level2:', id(l2))
print('l1:', l1)
print('l2:', l2)

原理图如下:

现在再回到刚才那个问题,是不是浅拷贝就可以解决原始数据在函数传递之后不变的问题了?下面看一个稍微复杂一点的数据结构。

通过下面这个实例可以发现:复杂对象在拷贝时,并没有解决数据在传递之后,数据改变的问题。出现这种原因,是copy() 函数在拷贝对象时只是将指定对象中的所有引用拷贝了一份如果这些引用当中包含了一个可变对象的话,那么数据还是会被改变。这种拷贝方式,称为浅拷贝

import copy
a = [1, 2]
l1 = [3, 4, a]
l2 = copy.copy(l1)
print('ID of l1 --> Level1:', id(l1))
print('ID of l2 --> Level1:', id(l2))
a[0] = 11
print('ID of l1 --> Level2:', id(l1))
print('ID of l2 --> Level2:', id(l2))
print('l1:', l1)
print('l2:', l2)

原理图如下:

对于上边这种状况,Python还提供了另一种拷贝方式(深拷贝)来解决。

3.2、深拷贝

区别于浅拷贝只拷贝顶层引用,深拷贝会逐层进行拷贝,直到拷贝的所有引用都是不可变引用为止。

接下来我们看看,要是将上边的拷贝实例用使用深拷贝的话,原始数据改变的问题还会不会存在了?

下面的实例清楚地告诉我们:之前的问题就可以完美解决了。

import copy
a = [1, 2]
l1 = [3, 4, a]
l2 = copy.deepcopy(l1)
print('ID of l1 --> Level1:', id(l1))
print('ID of l2 --> Level1:', id(l2))
a[0] = 11
print('ID of l1 --> Level2:', id(l1))
print('ID of l2 --> Level2:', id(l2))
print('l1:', l1)
print('l2:', l2)

原理图如下:


四、查漏补缺

为什么Python默认的拷贝方式是浅拷贝?

  1. 时间角度:浅拷贝花费时间更少;

  2. 空间角度:浅拷贝花费内存更少;

  3. 效率角度:浅拷贝只拷贝顶层数据,一般情况下比深拷贝效率高。

本文知识点总结:

  1. 不可变对象在赋值时会开辟新空间;

  2. 可变对象在赋值时,修改一个的值,另一个也会发生改变;

  3. 深、浅拷贝对不可变对象拷贝时,不开辟新空间,相当于赋值操作;

  4. 浅拷贝在拷贝时,只拷贝第一层中的引用,如果元素是可变对象,并且被修改,那么拷贝的对象也会发生变化;

  5. 深拷贝在拷贝时会逐层进行拷贝,直到所有的引用都是不可变对象为止;

  6. Python中有多种方式实现浅拷贝,copy模块的copy函数、对象的copy函数、工厂方法、切片等;

  7. 大多数情况下,编写程序时都是使用浅拷贝,除非有特定的需求;

  8. 浅拷贝的优点:拷贝速度快,占用空间少,拷贝效率高。

【注】:本文转载自微信公众号《马哥Linux运维》20190328期《Python程序员如何防止数据被修改》,本文作者PayneLi,运营个人公众号 Python全家桶。向作者致敬!

Python浅拷贝、深拷贝与防止数据被篡改相关推荐

  1. python浅拷贝 深拷贝

    Python 变量 对象 引用 1.变量 变量第一次赋值时被创建,变量在使用前必须赋值 变量本身没有类型,变量类型为它引用的对象类型: 变量在使用时被替换成它引用的对象 2.对象 对象本身具有计数和类 ...

  2. python浅拷贝深拷贝

    copy_list=list[:]  得到的是浅拷贝,即只能顶层拷贝,里面的嵌套不会复制一份. a = [0, [1, 2], 3] b = a[:] a[0] = 8 a[1][1] = 9 请问现 ...

  3. python 实例对象 浅拷贝_Python3 入门教程——浅拷贝深拷贝差别

    前言 在 Python 中提供了一个用于拷贝操作的 copy 模块,该模块中提供 浅拷贝 和 深拷贝 两种操作,其中: 浅拷贝:只是将对象管理地址进行打包复制,其内部的元素的并未进行复制,而是使用旧的 ...

  4. Interview:算法岗位面试—10.11下午—上海某公司算法岗位(偏机器学习,互联网数字行业)技术面试考点之XGBoost的特点、python的可变不可变的数据类型、赋值浅拷贝深拷贝区别

    ML岗位面试:10.11下午-上海某公司算法岗位(偏机器学习,互联网数字行业)技术面试考点之XGBoost的特点.python的可变不可变的数据类型.赋值浅拷贝深拷贝区别 Interview:算法岗位 ...

  5. Python 浅拷贝和深拷贝 - Python零基础入门教程

    目录 一.Python 浅拷贝和深拷贝前言 二.Python 普通的变量赋值 三.Python 浅拷贝和深拷贝 1.Python 浅拷贝 copy 2.Python 深拷贝 deepcopy 3.Py ...

  6. Python中深拷贝与浅拷贝的区别?

    往期面试题: 列举Python中的标准异常类? 说说Python面向对象三大特性? 说说Python中有几种数据类型? 说说Python模块主要分哪三类? 废话不多说,开始今天的题目: 问:说说Pyt ...

  7. Python浅拷贝与深拷贝

    Python浅拷贝与深拷贝 Python中拷贝 Python中的赋值号=并不是真正的拷贝,这仅仅是一个引用.参照这篇博客 .必要的时候,我们需要复制值,而不是使用引用.Python中有两种方式:浅拷贝 ...

  8. 【从零学Python】深拷贝和浅拷贝、二维数组初始化

    Python 的深拷贝和浅拷贝 直接赋值: 其实就是对象的引用(别名). 浅拷贝(copy): 拷贝父对象,不会拷贝对象的内部的子对象. 深拷贝(deepcopy): copy 模块的 deepcop ...

  9. python中深拷贝与浅拷贝的区别

    ####################python中的数据类型####################### ##########python中的数据类型有6种,分别为:数字类型如int,float ...

最新文章

  1. 基于python的人工智能Jiagu深度学习自然语言处理开源工具
  2. 让编译器对一些警告闭嘴
  3. 网站描述怎么写?对网站优化有什么作用?
  4. WinCE 开始菜单StartMenu_Create()函数代码分析
  5. 了解C++类的大小和类变量的字节对齐
  6. 都是大人物,看看你认识几个。
  7. springcloud阿里巴巴五大组件_如何无缝迁移 SpringCloud/Dubbo 应用到 Serverless 架构
  8. 论文浅尝 | 异构图 Transformer
  9. TensorFlow 中 identity 函数理解
  10. 聊天机器人-ChatterBot初试
  11. linux ssh环境,在Linux下ssh 环境的登录 和 文件拷贝
  12. struts2自己定义拦截器
  13. Remote Desktop Connection Manager (RDCMan)
  14. 2014新生暑假个人排位赛06 -444. 爱好和平 (数组模拟邻接表+dfs)
  15. 0xc0000225无法进系统_win10系统出现0xc0000225无法进入系统的恢复方法
  16. java bks证书_jks bks 等的定义 如何将jks转化为bks的
  17. 转发--目前开源数据集整理
  18. Java筑基17-注解
  19. Android8.1 MTK平台 修改 Volte 视频通话我方视角为矩形
  20. 用筛选法求100之内的素数。谭浩强《c语言程序设计》第六章第一题

热门文章

  1. 论文代码复现Enhancing the Transferability of Adversarial Attacks through Variance Tuning
  2. 中国ERP行业应用问题概述 (转)
  3. 解析!2018软件测试官方行业报告
  4. android自定义控件的惯性滑动
  5. 法国计算机专业怎么样,法国计算机科学专业大学排名(2020年USNEWS)_快飞留学
  6. 双11,超现实的电商马拉松
  7. QPalette设置各种背景色
  8. 一直被模仿,从未被超越_longware_新浪博客
  9. iOS本地推送实现备忘录闹铃提醒
  10. 使用Android studio做一个简单的网站APP