SQLAlchemy 中的 Session、sessionmaker、scoped_session

目录

  • 一、关于 Session

    • 1. Session是缓存吗?
    • 2. Session作用:
    • 3. Session生命周期:
    • 4. Session什么时候创建,提交,关闭?
    • 4. 获取一个Session:
    • 5. 关于SQLAlchemy 的 create_engine:
    • 6. 关于线程安全:
  • 二、单线程下 scoped_session 对创建 Session 的影响
    • 1. 两个 Session 添加同一个对象
    • 2. 不同的 Session 添加不同的对象
    • 3. 用 scoped_session 创建 Session
  • 三、多线程下 scoped_session 对创建 Session 的影响
    • 1. 当不用 scoped_session 时:
    • 2. 当使用 scoped_session 时:

一、关于 Session

Session 其实 就是一个会话, 可以和数据库打交道的一个会话

在一般的意义上, 会话建立与数据库的所有对话,并为你在其生命周期中加载或关联的所有对象表示一个“等待区”。他提供了一个入口点获得查询对象, 向数据库发送查询,使用会话对象的当前数据库连接, 将结果行填充在对象中, 然后存储在会话中, 在这种结构中称为身份映射 – 这种数据结构维护了每一个副本的唯一, 这种唯一意味着一个对象只能有一个特殊的唯一主键。

会话以基本无状态的形式开始,一旦发出查询或其他对象被持久化,它就会从一个引擎申请连接资源,该引擎要么与会话本身相关联,要么与正在操作的映射对象相关联。此连接标识正在进行的事务, 在会话提交或回滚其挂起状态之前,该事务一直有效。

会话中维护的所有变化的对象都会被跟踪 - 在再次查询数据库或提交当前事务之前, 它将刷新对数据库的所有更改, 这被称为工作模式单元。

在使用会话时候,最重要的是要注意与它相关联的对象是会话所持有的事务的代理对象 - 为了保持同步,有各种各样的事件会导致对象重新访问数据库。可能从会话中分离对象并继续使用他们,尽管这种做法有其局限性。但是通常来说,当你希望再次使用分离的对象时候,你会将他们与另一个会话重新关联起来, 以便他们能够恢复表示数据库状态的正常任务。


1. Session是缓存吗?

可能会将这里的session与http中的session搞混,需要注意的是,它有点用作缓存,因为它实现了 身份映射 模式,并存储了键入其主键的对象。但是,它不执行任何类型的查询缓存。
此外,默认情况下,Session使用弱引用存储对象实例。这也违背了将Session用作缓存的目的。关于session强应用下次再讨论。

2. Session作用:

1. session创建和管理数据库连接的会话
2. model object 通过session对象访问数据库,并把访问到的数据以 Identity Map的方式,映射到Model object中

3. Session生命周期:

1. session在刚被创建的时候,还没有和任何model object 绑定,可认为是无状态的
2. session 接受到query查询语句, 执行的结果或保持或者关联到session中
3. 任意数量的model object被创建,并绑定到session中,session会管理这些对象
4. 一旦session 里面的objects 有变化,那可是要commit/rollback提交或者放弃changs

4. Session什么时候创建,提交,关闭?

一般来说,session在需要访问数据库的时候创建,在session访问数据库的时候,准确来说,应该是“add/update/delete”数据库的时候,会开启database transaction。假设没有修改autocommit的默认值(False), 那么,database transaction 一直会保持,只有等到session发生rolled back、committed、或者closed的时候才结束,一般建议,当database transaction结束的时候,同时close session,以保证,每次发起请求,都会创建一个新的session特别是对web应用来说,发起一个请求,若请求使用到Session访问数据库,则创建session,处理完这个请求后,关闭session

4. 获取一个Session:

Session 是一个直接实例化的常规的Python 类。然而, 为了标准会会话的配置和获取方式, sessionmaker 类通常用于创建顶级会话配置, 然后可以在整个应用程序中使用它, 就不需要重复配置参数。

下面是sessionmaker 的使用方式

from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker# 创建连接数据库的引擎,session连接数据库需要
my_engine = create_engine('mysql+pymysql://root:123456@localhost/my_db')# 创建一个配置过的Session类
Session = sessionmaker(bind=my_engine)# 实例化一个session
db_session = Session()# 使用session
myobject = MyObject('foo', 'bar')
db_session.add(myobject)
db_session.commit()

在上面,该sessionmaker()创建了一个工厂类,在创建这个工厂类时我们配置了参数绑定了引擎。将其赋值给Session。每次实例化Session都会创建一个绑定了引擎的Session。这样这个session在访问数据库时都会通过这个绑定好的引擎来获取连接资源
当你编写应用程序时, 请将sessionmaker 工厂放在全局级别,视作应用程序配置的一部分。例如:应用程序包中有三个.py文件,您可以将该sessionmaker行放在__init__.py文件中; 在其他模块“from mypackage import Session”。这样,所有的Session()的配置都由该配置中心控制。

5. 关于SQLAlchemy 的 create_engine:

直接只用 create_engine 时,就会创建一个带连接池的引擎:

my_engine = create_engine('mysql+pymysql://root:123456@localhost/my_db')

创建一个session,连接池会分配一个connection。当session在使用后显示地调用 session.close(),也不能把这个连接关闭,而是由由QueuePool连接池管理并复用连接。

确保 session 在使用完成后用 session.close、session.commit 或 session.rollback 把连接还回 pool,这是一个必须在意的习惯。

关于SQLAlchemy 数据库连接池:

session 和 connection 不是相同的东西, session 使用连接来操作数据库,一旦任务完成 session 会将数据库 connection 交还给 pool。在使用 create_engine 创建引擎时,如果默认不指定连接池设置的话,一般情况下,SQLAlchemy 会使用一个 QueuePool 绑定在新创建的引擎上。并附上合适的连接池参数

create_engine() 函数和连接池相关的参数有:

  • pool_recycle, 默认为 -1, 推荐设置为 7200, 即如果 connection 空闲了 7200 秒,自动重新获取,以防止 connection 被 db server 关闭。
  • pool_size=5, 连接数大小,默认为 5,正式环境该数值太小,需根据实际情况调大
  • max_overflow=10, 超出 pool_size 后可允许的最大连接数,默认为 10, 这 10 个连接在使用过后,不放在 pool 中,而是被真正关闭的。
  • pool_timeout=30, 获取连接的超时阈值,默认为 30 秒

SQLAlchemy不使用连接池:
在创建引擎时指定参数 poolclass=NullPool 即禁用了SQLAlchemy提供的数据库连接池。SQLAlchemy 就会在执行 session.close() 后立刻断开数据库连接。当然,如果没有被调用 session.close(),则数据库连接不会被断开,直到程序终止。

my_engine = create_engine('mysql+pymysql://root:123456@localhost/my_db',poolclass=NullPool)

关于 SQLAlchemy 的 engine ,这里有一篇文章写的很好:http://sunnyingit.github.io/book/section_python/SQLalchemy-engine.html

6. 关于线程安全:

session不是线程安全的,在多线程的环境中,默认情况下,多个线程将会共享同一个session。试想一下,假设A线程正在使用session处理数据库,B线程已经执行完成,把session给close了,那么此时A在使用session就会报错,怎么避免这个问题?

1. 可以考虑在这些线程之间共享Session及其对象。但是应用程序需要确保实现正确的锁定方案,以便多个线程不会同时访问Session或其状态。SQLAlchemy 中的 scoped_session 就可以证线程安全,下面会有讨论。
2. 为每个并发线程维护一个会话,而不是将对象从一个Session复制到另一个Session,通常使用Session.merge()方法将对象的状态复制到一个不同Session的新的本地对象中。

二、单线程下 scoped_session 对创建 Session 的影响

上面简单介绍了sessionmaker的作用,下面开始探讨 scoped_session 对创建 Session 的影响。现在先探讨单线程情况。


先声明待会实验用的模型:

from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import Column, Integer, String
from sqlalchemy import create_engineBase = declarative_base
engine = create_engine("mysql+pymysql://root:123456@127.0.0.1:3306/my_db?charset=utf8mb4")class Person(Base):__tablename__ = 'Person'id = Column(Integer, primary_key=True, autoincrement=True)name = Column(String(length=64), comment='姓名')mobile = Column(String(length=13), comment='手机号')id_card_number = Column(String(length=64), comment='身份证')def __str__(self):return '%s(name=%r,mobile=%r,id_card_number=%r)' % (self.__class__.__name__,self.name,self.mobile,self.id_card_number)# 在数据库中创建模型对象的表
Base.metadata.create_all(engine)

1. 两个 Session 添加同一个对象

1.1 在 commit 之前添加:


from sqlalchemy.orm import sessionmaker, scoped_sessionsession_factory = sessionmaker(bind=engine)
# engine 在上面已经创建好了person = Person(name='frank-' + 'job3', mobile='111111', id_card_number='123456789')Session= session_factory()
s1= session_factory()
# s1 : <sqlalchemy.orm.session.Session object at 0x107ec8c18>s2 = session_factory()
# s2 : <sqlalchemy.orm.session.Session object at 0x107ee3ac8>print(s1 is s2)
# Falseid(s1),id(s2)
# 4427910168, 4428020424s1.add(person)
s2.add(person)
# 会报错!
# sqlalchemy.exc.InvalidRequestError: Object '<Person at 0x22beb14bf60>' is already attached to session '2' (this is '3')

结论:

通过 sessionmaker 工厂创建了两个 Session ,而且可以看到 s1 s2 是两个不同的 Session 。
在 s1 添加 person 后,继续使用 s2 添加 person 报错. 说 person 这个对象 已经和 另一个 Session 关联一起来了, 所以再次关联另一个 Session 就会报错。

1.2 在 commit 之后添加:

即在上面代码的 s1.add(person) 之后, s1.commit() ,然后再 s2.add(persion)
这里就没帖代码了。

结论:

即使在 s1 提交之后,s2 再去添加 person 也会发生错误,但 s1 的提交是成功了的,数据 person 已经存放在数据库了。
当 s1 添加 person 并提交,然后关闭 s1 ,s2再去添加并提交 person 数据库,这不会报错,但是数据库也不会出现两条 person 数据。

1.3 再 close 之后添加:

p = Person(name='frank', mobile='11111111', id_card_number='123456789')s1.add(p)
s1.commit()s2.add(p)
s2.commit()# 也会报错!!!
# sqlalchemy.exc.InvalidRequestError: Object '<Person at 0x21207e3e128>' is already attached to session '2' (this is '3')p = Person(name='frankcc', mobile='1111111122', id_card_number='1234567890')s1.add(p)
s1.commit()
s1.close()
s2.add(p)
s2.commit()# 不会报错

结论:

s1 关闭之后, s2再去添加提交同一个对象,不会报错,但是数据库值有一条 person 数据。

2. 不同的 Session 添加不同的对象

person4 = Person(name='frank-' + 'job4', mobile='4444444444', id_card_number='123456789')
person1 = Person(name='frank-' + 'job1', mobile='111111', id_card_number='123456789')s1.add(person1)
s2.add(person4)
s1.commit()  # 提交数据
s2.commit()  # 提交数据, 写入数据库

结论:

当然,s1 ,s2 添加提交不同的对象,不会出错。在数据库成功新增数据。 

mysql> select * from person;
+----+------------+------------+----------------+
| id | name       | mobile     | id_card_number |
+----+------------+------------+----------------+
|  1 | frank-job1 | 111111     | 123456789      |
|  2 | frank-job4 | 4444444444 | 123456789      |
+----+------------+------------+----------------+
2 rows in set (0.00 sec)

以上说明:

一个对象一旦被一个 Session 添加,除非关闭这个 Session ,不然其他的 Session 无法添加这个对象。
一个 Session 添加并提交一个对象,然后关闭该 Session ,其他的 Session 可以添加并提交这个对象,但是数据库并不会有这条数据。

3. 用 scoped_session 创建 Session


session_factory = sessionmaker(bind=engine)
Session = scoped_session(session_factory)s1 = Session()
# <sqlalchemy.orm.session.Session object at 0x0000020E58690240>s2 = Session()
# <sqlalchemy.orm.session.Session object at 0x0000020E58690240>print(s1 is s2)
# Truep = Person(name='frankaaabb', mobile='1111111122233', id_card_number='12345678900099')s1.add(p)
s2.add(p)
s2.commit()

结论:

可以看到,通过scoped_session再去创建 Session ,返回的是同一个 Session 。
scoped_session类似单例模式,当我们调用使用的时候,会先在Registry里找找之前是否已经创建Session,未创建则创建 Session ,已创建则直接返回。

三、多线程下 scoped_session 对创建 Session 的影响

这里探讨在多线程下使用 scoped_session 与不使用 scoped_session 的情况


1. 当不用 scoped_session 时:

当不使用 scoped_session 时,也分两种情况,是否创建全局性 Session

1.1 多线程下不设置 Session 为全局变量


session_factory = sessionmaker(bind=engine)
Session = session_factorydef job(name):session = Session()print(f"id session:{id(session)}")person = Person(name='frank-' + name, mobile='111111', id_card_number='123456789')print(f"{name} person is add..")session.add(person)time.sleep(1)if name == 'job3':# 线程3 提交, 其他线程不提交.session.commit()session.close()if __name__ == '__main__':thread_list = []# 创建5个线程for i in range(5):name = 'job' + str(i)t = threading.Thread(target=job, name=name, args=(name,))thread_list.append(t)for t in thread_list:t.start()for t in thread_list:t.join()

结论:

每个线程下的 Session 都是不同的 Session
数据库成功新增了线程3提交的数据,其他的线程中的数据并没有提交到数据库中去。

id session:2557871997392
job0 person is add..
id session:2557871998064
job1 person is add..
id session:2557871998568
job2 person is add..
id session:2557871999072
job3 person is add..
id session:2557871999688
job4 person is add..mysql> select * from person;
+----+------------+--------+----------------+
| id | name       | mobile | id_card_number |
+----+------------+--------+----------------+
| 14 | frank-job3 | 111111 | 123456789      |
+----+------------+--------+----------------+
1 row in set (0.00 sec)

1.2 在多线程下用全局 Session


session_factory = sessionmaker(bind=engine)
Session = session_factory
session = Session()def job(name):global sessionprint(f"id session:{id(session)}")person = Person(name='frank-' + name, mobile='111111', id_card_number='123456789')print(f"{name} person is add..")session.add(person)time.sleep(1)if name == 'job3':# 线程3 提交, 其他线程不提交.session.commit()session.close()if __name__ == '__main__':thread_list = []# 创建5个线程for i in range(5):name = 'job' + str(i)t = threading.Thread(target=job, name=name, args=(name,))thread_list.append(t)for t in thread_list:t.start()for t in thread_list:t.join()

结论:

全部线程下的 Session 都时同一个 Session
每个线程下的数据都被提交到了数据库

id session:2737857674824
job0 person is add..
id session:2737857674824
job1 person is add..
id session:2737857674824
job2 person is add..
id session:2737857674824
job3 person is add..
id session:2737857674824
job4 person is add..mysql> select * from person;
+----+------------+--------+----------------+
| id | name       | mobile | id_card_number |
+----+------------+--------+----------------+
| 15 | frank-job0 | 111111 | 123456789      |
| 16 | frank-job2 | 111111 | 123456789      |
| 17 | frank-job1 | 111111 | 123456789      |
| 18 | frank-job3 | 111111 | 123456789      |
| 19 | frank-job4 | 111111 | 123456789      |
+----+------------+--------+----------------+
5 rows in set (0.00 sec)

2. 当使用 scoped_session 时:

2.1 多线程下不设置 Session 为全局变量


session_factory = sessionmaker(bind=engine)
Session = scoped_session(session_factory)def job(name):session = Session()print(f"id session:{id(session)}")person = Person(name='frank-' + name, mobile='111111', id_card_number='123456789')print(f"{name} person is add..")session.add(person)time.sleep(1)if name == 'job3':# 线程3 提交, 其他线程不提交.session.commit()session.close()if __name__ == '__main__':thread_list = []# 创建5个线程for i in range(5):name = 'job' + str(i)t = threading.Thread(target=job, name=name, args=(name,))thread_list.append(t)for t in thread_list:t.start()for t in thread_list:t.join()

结论:

每个线程下的 Session 都不相同
只有线程3下的数据被提交到了数据库

id session:2173841850832
job0 person is add..
id session:2173841851504
job1 person is add..
id session:2173841851896
job2 person is add..
id session:2173841852008
job3 person is add..
id session:2173841853128
job4 person is add..mysql> select * from person;
+----+------------+--------+----------------+
| id | name       | mobile | id_card_number |
+----+------------+--------+----------------+
| 32 | frank-job3 | 111111 | 123456789      |
+----+------------+--------+----------------+
1 row in set (0.00 sec)

2.2 多线程下设置 Session 为全局变量


session_factory = sessionmaker(bind=engine)
Session = scoped_session(session_factory)
session = Session()def job(name):global sessionprint(f"id session:{id(session)}")person = Person(name='frank-' + name, mobile='111111', id_card_number='123456789')print(f"{name} person is add..")session.add(person)time.sleep(1)if name == 'job3':# 线程3 提交, 其他线程不提交.session.commit()session.close()if __name__ == '__main__':thread_list = []# 创建5个线程for i in range(5):name = 'job' + str(i)t = threading.Thread(target=job, name=name, args=(name,))thread_list.append(t)for t in thread_list:t.start()for t in thread_list:t.join()

结论:

每个线程下的 Session 是同一个 Session
每个线程下的数据都没提交到了数据库

id session:2810724382032
job0 person is add..
id session:2810724382032
job1 person is add..
id session:2810724382032
job2 person is add..
id session:2810724382032
job3 person is add..
id session:2810724382032
job4 person is add..mysql> select * from person;
+----+------------+--------+----------------+
| id | name       | mobile | id_card_number |
+----+------------+--------+----------------+
| 33 | frank-job0 | 111111 | 123456789      |
| 34 | frank-job2 | 111111 | 123456789      |
| 35 | frank-job1 | 111111 | 123456789      |
| 36 | frank-job3 | 111111 | 123456789      |
| 37 | frank-job4 | 111111 | 123456789      |
+----+------------+--------+----------------+
5 rows in set (0.00 sec)

以上说明:

在同一个线程中,有 scoped_session 的时候,返回的是同一个 Session 对象。
在多线程下,即使通过  scoped_session 创建Session,每个线程下的 Session 都是不一样的,每个线程都有一个属于自己的 Session 对象,这个对象只在本线程下共享。
scoped_session 只有在单线程下才能发挥其作用。在多线程下显得没有什么作用。

SQLAlchemy 中的 Session、sessionmaker、scoped_session相关推荐

  1. 【Python SQLAlchemy】数据库连接池SQLAlchemy中多线程安全的问题

    问题描述 写了一个apscheduler定时任务 里面用到SQLAlchemy在同一时间点开启了18个任务,用于更新18个表 但是最终看数据库表的时候,发现有2个表未更新.查看打印日志均正常,查找原因 ...

  2. SQLAlchemy中的Django风格的数据库路由器

    Updated August, 2014 – the approach here really won't work very well if you are using transactions! ...

  3. [转发]sqlalchemy中出现MySQL server has gone away的解决方法

    最近项目中用到sqlalchemy来作为orm框架,数据库引擎用的是pymysql,demo做出来之后,调用一个数据录入功能的API偶尔发现会出现500错误,查看后台日志在API执行过程中报了&quo ...

  4. 灵活使用 SQLAlchemy 中的 ORM 查询

    之前做查询一直觉得直接拼 SQL 比较方便,用了 SQLAlchemy 的 ORM 查询之后,发现也还可以,还提高了可读性. 这篇文章主要说说 SQLAlchemy 常用的 ORM 查询方式,偏实践. ...

  5. sqlAlchemy中的对象转换为dict

    sqlAlchemy中的对象转换为dict 假设数据库里有一张post表,其中一种方法就是 p = session.query(Post).first() p.__dict__ 但由于p是sqlAlc ...

  6. python typing.Literal 与sqlalchemy中的Literal

    python typing.Literal是用于限制函数传参,例如: from typing import Literal def func(a:Literal[1,2,3]): print(a) 那 ...

  7. Flask框架—flask中的session

    Flask中的session session设置 Flask除请求对象之外,还有一个 session 对象. 它允许你在不同请求间存储特定用户的信息.它是在 Cookies 的基础上实现的,并且对 C ...

  8. Tomcat5集群中的SESSION复制详解

    Tomcat 5服务器为集群和SESSION复制提供了集成的支持.本系列的第一篇文章将为大家提供SESSION持久性以及TOMCAT集群中SESSION复制的 内在工作机制一个概要认识.我将会讨论SE ...

  9. ashx页面中context.Session[xxx]获取不到值的解决办法

    1.在 aspx和aspx.cs中,都是以Session["xxx"]="aaa"和aaa=Session["xxx"].ToString( ...

最新文章

  1. WCF(Sender) to MSMQ to WCF(Receiver)
  2. 如何查询土地规划用途_一秒辨别“三无产品”,护肤品的猫腻如何发现?
  3. 回文串判定_JAVA
  4. ListView自定义视图中对Button按钮实现仅允许一个按钮处于开启状态
  5. 【js】vue 2.5.1 源码学习(二) 策略合并
  6. codeforces1498 D. Bananas in a Microwave(背包+优化)
  7. 自己构建GlassFish 4.0快照
  8. linux ftp解压命令 cannot fid or open,Linux环境搭建及常用shell命令集锦
  9. 迪杰斯特拉c++_常用十大算法之 其九·迪杰斯特拉算法【日后详细补充】
  10. 【Oracle】DBA_AUDIT_TRAIL表SES_ACTIONS字段对应的操作列表
  11. 混合选择集的坐标提起lisp_晓东CAD家园-论坛-A/VLISP-[LISP程序]:请教如何对选择集进行排序-我有(setq ss(ssget _w p0 p1 (list (0 . CIRC...
  12. Python Des加密与解密实现软件注册码、机器码
  13. Java实现欧姆龙Fins协议(推荐用springboot)
  14. 电源 PFC(功率因数校正)电路拓扑,共计100多份,内含A PFC,连续断续,交错,维也纳,各功率段的PFC电路,还有电感 设计选型
  15. Android 、AndroidQ 、小米、 oppo等【后台启动界面】问题 解决方案
  16. nu.xom:Document
  17. 四十个鹏城春夏,一场数字繁花
  18. haproxy代理https配置方法【转】
  19. python+vue+Elementui植物园网站的设计django
  20. angularjs grunt uglify 报错

热门文章

  1. 我身边的手机应用开发者
  2. FFMPEG设置 cbr讨论
  3. 解决 VUE: 本地运行和服务器上运行样式不一致,run、build 运行时样式有出入
  4. IP: 169.254.0.0/16 地址用途
  5. 遍历Map key-value的两种方法、遍历Set方法
  6. Shell 字符串截取
  7. dependency 中的 classifier属性
  8. FreeSql (二)自动迁移实体
  9. JAVA自学笔记25
  10. 201706问题记录