数据库中IP地址数据该怎么存?或许你已经不止一次遇到过这类问题,怎么存?varchar(255)不就完事儿了?坦白说,在我经历的几个项目中,几乎都遇到过存储IP地址(V4、V6)的数据字段,都用的变长字符串varchar(15)来存储,嗯,感觉还挺香的…

  其实很早以前我就在《高性能MySQL第三版》中看过IP地址属于特殊类型数据,应转为整数存储。

《高性能MySQL第三版》
4.1.7 特殊类型数据
-某些类型的数据并不直接与内置类型一致。低于秒级精度的时间戳就是一个例子;
-本意的前面部分也演示过存储此类数据的一些选项。-另一个例子是一个IPv4地址。人们经常使用VARCHAR(15)列来存储IP地址。
-然而,它们实际上是 32位无符号整数,不是字符串。用小数点将地址分成四段的表示方法只是为了让人们阅读容易。
-所以应该用无符号整数存储IP地址。MySQL提供INET ATON()和 INET NTOA()函数在这两种表示方法之间转换。

  但项目中并未涉及到对IP地址的高频查询业务需求;所以嘛,你知道的,我们程序员的三不准则:跟自己没关系的代码不要看自己模块用不到的技术不要学遗留代码只要能跑的就不要动!

  直到老大看我们项目数据表时问道:“你们存IP地址都是用字符串吗?这可不兴啊!应该用整数来存啊。”

  “老大,我明白你的优化思路,你看咱们这表,就几十条数据(狗头)…”

  直到上周有位同学问我IP地址在数据库中该怎么存,他在面试中被问到了,我突然意识到了这玩意儿是时候记录一下了。


目录

  • 一、IP地址应该怎么存
  • 二、整数存储 IP 地址的查询性能实验
    • 1、测试范围查询:
    • 2、IP精确查询:
    • 3、整理一下结果发现:
  • 总结

一、IP地址应该怎么存

  在MySQL中,当存储IPv4地址时,应该使用32位的无符号整数(UNSIGNED INT)来存储IP地址,而不是使用字符串,用UNSIGNED INT类型存储IP 地址是一个4字节长的整数

  如果是字符串存储IP 地址,在正常格式下,最小长度为 7 个字符 (0.0.0.0),最大长度为 15 个 (255.255.255.255),因此,我们通常会使用varchar(15)来存储。同时为了让数据库准确跟踪列中有多少数据,数据库会添加额外的1字节来存储字符串的长度。这使得以字符串表示的 IP 的实际数据存储成本需要16字节

  这意味着如果将每个 IP 地址存储为字符串的话,每行需要多耗费大约 10 个字节的额外资源。

  如果你说磁盘够使不是事儿,那我得告诉你,这个不仅会使数据文件消耗更多的磁盘,如果该字段加了索引,也会同比例扩大索引文件的大小,缓存数据需要使用更多内存来缓存数据或索引,从而可能将其他更有价值的内容推出缓存区。执行SQL对该字段进行CRUD时,也会消耗更多的CPU资源。

  在早先使用Oracle10g时,是没有相关函数来进行IP整数和字符串的,但在MySQL中有内置的函数,来对IP和数值进行相互转换。

  • INET_ATON()

将IP转换成整数。

算法:第一位乘256三次方+第二位乘256二次方+第三位乘256一次方 + 第四位乘256零次方

  • INET_NTOA()

将数字反向转换成IP

SELECT INET_ATON('127.0.0.1');+------------------------+
| INET_ATON('127.0.0.1') |
+------------------------+
|             2130706433 |
+------------------------+
1 row in set (0.00 sec)SELECT INET_NTOA('2130706433');+-------------------------+
| INET_NTOA('2130706433') |
+-------------------------+
| 127.0.0.1               |
+-------------------------+
1 row in set (0.02 sec)

  如果是 IPv6地址的话,可以使用函数 INET6_ATON()INET6_NTOA() 来转化:

mysql> SELECT HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')); +----------------------------------------------+
| HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B')) |
+----------------------------------------------+
| 1030000000000000C9B4FF1248AA1A2B             |
+----------------------------------------------+
1 row in setmysql> SELECT INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B'));
+-------------------------------------------------------+
| INET6_NTOA(UNHEX('1030000000000000C9B4FF1248AA1A2B')) |
+-------------------------------------------------------+
| 1030::c9b4:ff12:48aa:1a2b                             |
+-------------------------------------------------------+
1 row in set

  然后将数据库定义为 varbinary类型,分配 128bits空间(因为 ipv6采用的是128bits,16个字节);或者定义为 char 类型,分配 32bits 空间。

二、整数存储 IP 地址的查询性能实验

测试数据,用存储过程生成了 100 万个随机 IP 地址;

1、测试范围查询:

  • IP转成Int,查询:耗时0.60s
select ip_int from T where ip_int > INET_ATON('192.0.0.0') and ip_int <=INET_ATON('192.255.255.255');1726 row in set, 1 warning (0.60 sec)
  • IP为字符串,查询:耗时0.63s
select ip_varchar from T where ip_varchar like '192.%';1726 row in set, 1 warning (0.63 sec)

2、IP精确查询:

select ip_int from T where ip_int = INET_ATON('192.168.0.0');1 row in set, 1 warning (0.00 sec)
select ip_varchar from T where ip_varchar='192.168.0.0';1 row in set, 1 warning (0.00 sec)

都是0s出结果。可认为常量索引查询,性能上无明显差异。

3、整理一下结果发现:

  • 范围查询和精确查询:

  数据量少的情况下的差距不明显,如果数据量扩大到约1千万行或1亿行1亿行时预计范围查询差距能拉开到0.5s

  • 存储空间节省:

  按1亿行算,理论上 varchar 最大15字节存储,数值4个字节,大约节省10字节 *1亿 约1G空间

  加上索文件引所占的空间,一个索引也是能节省1G。约能节省2G空间。

总结

  IP地址数据采用整数(UNSIGNED INT)存储,在存储和CPU资源使用上都少于字符串存储形式;在歧义较大的范围查询中,存储整数方式无需关系范围中的位数问题,查询更加直观方便。

  但整数存储需要使用INET_ATON、INET_NTOA等特定函数处理,可读性查,函数也会消耗额外CPU,经检验发现CPU开支微乎其微。

  因此,需要范围查询,且数据量很大(如亿级以上),采用数值存储IP地址的方式更优。如果均是唯一IP精确查询,或数据量不大,那么使用字符串操作更为简单

老大告诉我不要用字符串存IP地址,不兴~相关推荐

  1. 面试官:如果要存ip地址,用什么数据类型比较好

    欢迎关注方志朋的博客,回复"666"获面试宝典 来源:blog.csdn.net/mhmyqn/article/details/48653157 在看高性能MySQL第3版(4.1 ...

  2. 如果要存 IP 地址,用什么数据类型比较好?大部人都会答错!

    欢迎关注方志朋的博客,回复"666"获面试宝典 来源:blog.csdn.net/mhmyqn/article/details/48653157 在看高性能MySQL第3版(4.1 ...

  3. 如果要存ip地址,用什么数据类型比较好?

    欢迎关注方志朋的博客,回复"666"获面试宝典 来源:https://blog.csdn.net/mhmyqn/article/details/48653157 在看高性能MySQ ...

  4. 面试官:如果要存ip地址,用什么数据类型比较好?

    点击关注公众号,实用技术文章及时了解 在看高性能MySQL第3版(4.1.7节)时,作者建议当存储IPv4地址时,应该使用32位的无符号整数(UNSIGNED INT)来存储IP地址,而不是使用字符串 ...

  5. 502 proxy error解决方法_老大说,网上这种获取真实IP地址的方法不对,我不信......

    作者:蔡永吉  来源:http://bit.ly/33H8RMm想必大家对这段代码并不陌生: public String getIpAddr(HttpServletRequest request) { ...

  6. python判断一个字符串是不是ip地址

    文章目录 一.解决思路 二.判断代码 一.解决思路 满足什么条件的叫ip地址: 1.先判断它是不是由4段数字用点号"."分隔开 2.再判断每段数字的十进制是不是在0-255之间 满 ...

  7. 老大说,网上这种获取真实IP地址的方法不对,我不信...

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试资料 作者:蔡永吉  来源:http://bit.ly/33H8RMm ...

  8. VC中字符串形式ip地址和整数形式ip地址转换

    字符串转整数 int dwAddr = inet_addr("127.0.0.1"); 整数转字符串 struct in_addr inAddr;inAddr.s_addr = d ...

  9. Python操作字符串-截取IP地址

    ip = "192.168.18.152"#截取IP段前两段ip1 = str(re.findall(r'(?<!\d)\d{1,3}\.\d{1,3}(?=\.\d)', ...

最新文章

  1. 138.ssm 框架下 导出Excel
  2. 项目日志2-系统降级模块设计
  3. 观察者模式/ java实现附代码 /
  4. 做Java头发少_这35个Java代码优化细节,你用了吗
  5. 隔空操作之通过简单计算识别手的挥动反向
  6. 64位Ubuntu 12.04系统下安装Qt library和Qt Creator全过程记录
  7. Oracle优化检查表
  8. MyBatis总结五:#{}和${}的用法和区别
  9. 前端学习(1746):前端调试值之时间监听
  10. ss流量查询 php,Linux_Linux怎么使用ss命令查看系统的socket状态,  Linux系统中,ss命令可用于 - phpStudy...
  11. Using SharePoint 2003 Web Services to Retrieve Data From A List
  12. java8 构造函数引用_java8新特性之方法引用与构造器引用
  13. python和c先学哪个-对于初学者而言,python和 c语言先学哪个好
  14. CNN已老,GNN来了:重磅论文讲述深度学习的因果推理(附资源)
  15. es6学习推荐网址(阮一峰)
  16. EMI辐射发射超标案例
  17. 期权期货和金融衍生品学习笔记 -- 第一章引言
  18. 使用Matlab将抖音视频转换成gif图片
  19. 为什么C++被公认为是最难的语言?
  20. Python中各种进制之间的转换

热门文章

  1. 搭建spark源码运行环境报错及解决办法
  2. 什么语言最适合做 GUI?
  3. 微信模板消息发送失败
  4. 《MATLAB SYNTAX》第4章 多项式
  5. 【Matlab】彻底清除persistent变量
  6. java tea bag_设计模式系列教程—Template Method Pattern(模板方法模式)
  7. csr867x入门笔记(序)
  8. Adobe PS 图片反转
  9. word 怎么删除多余的空白页
  10. 打印设置自定义表尾_教大家Excel2013表格中如何打印固定的表头和表尾