std::string的find问题研究
https://files-cdn.cnblogs.com/files/aquester/std之string的find问题研究.pdf
目录
目录 1
1. 前言 1
2. find字符串 1
3. find单个字符 2
4. 问题分析 3
4.1. gcc-4.1.2 3
4.2. gcc-4.8.2 4
5. a.cpp源代码 5
6. 单个字符版本find源码 5
7. 字符串版本find源码 6
7.1. gcc-4.1.2 6
7.2. gcc-4.8.2 6
8. 结论 7
1. 前言
一次偶然,发现完全同一份代码,在不同机器上find出现两个不同执行结果,本文旨在研究find的“诡异”行为,找出背后的原因。
2. find字符串
测试代码:
// g++ -g -o x x.cpp #include <string> #include <iostream> extern "C" int main() { std::string::size_type n = std::string::npos; std::string str = "123"; std::string::size_type m = str.find("2", n); // 按照期望,m值应为npos std::cout << "n=" << n << ", m=" << m << std::endl; return 0; } |
i386输出结果(gcc (GCC) 4.1.2):
n=4294967295, m=1 |
这里m值为1,是一个非期望的值。
i86_64编译成64位输出结果(gcc (GCC) 4.8.5):
n=18446744073709551615, m=18446744073709551615 |
i86_64编译成32位输出结果(gcc (GCC) 4.8.5):
n=4294967295, m=4294967295 |
i386上编译放到i86_64上执行的输出结果:
n=4294967295, m=4294967295 |
i386上编译成共享库后放到i86_64上执行的输出结果:
// g++ -g -o libx.so -fPIC -shared x.cpp n=4294967295, m=4294967295 |
3. find单个字符
测试代码:
// g++ -g -o x x.cpp #include <string> #include <iostream> extern "C" int main() { std::string::size_type n = std::string::npos; std::string str = "123"; std::string::size_type m = str.find('2', n); std::cout << "n=" << n << ", m=" << m << std::endl; return 0; } |
i386输出结果(gcc (GCC) 4.1.2):
n=4294967295, m=4294967295 |
i86_64编译成64位输出结果(gcc (GCC) 4.8.5):
n=18446744073709551615, m=18446744073709551615 |
i86_64编译成32位输出结果(gcc (GCC) 4.8.5):
n=4294967295, m=4294967295 |
i386上编译放到i86_64上执行的输出结果:
n=4294967295, m=4294967295 |
i386上编译成共享库后放到i86_64上执行的输出结果:
n=4294967295, m=4294967295 |
4. 问题分析
对于字符串版本的find,出现不同的结果。小技巧:加上编译选项“-D_GLIBCXX_DEBUG”,方可DEBUG进入find。
4.1. gcc-4.1.2
以下为i386环境。
g++ -g -o x x.cpp -D_GLIBCXX_DEBUG Breakpoint 2, main () at x.cpp:6 6 std::string::size_type n = std::string::npos; (gdb) n 7 std::string str = "123"; (gdb) 8 std::string::size_type m = str.find("2", n); (gdb) s std::string::find (this=0xbfb54a10, __s=0x804b8f2 "2", __pos=4294967295) at /usr/include/c++/4.1.2/bits/basic_string.h:1579 1579 return this->find(__s, __pos, traits_type::length(__s)); (gdb) s std::char_traits<char>::length (__s=0x804b8f2 "2") at /usr/include/c++/4.1.2/bits/char_traits.h:257 257 { return strlen(__s); } (gdb) finish Run till exit from #0 std::char_traits<char>::length (__s=0x804b8f2 "2") at /usr/include/c++/4.1.2/bits/char_traits.h:257 0x0804a8d9 in std::string::find (this=0xbfb54a10, __s=0x804b8f2 "2", __pos=4294967295) at /usr/include/c++/4.1.2/bits/basic_string.h:1579 1579 return this->find(__s, __pos, traits_type::length(__s)); Value returned is $1 = 1 (gdb) s std::string::find (this=0xbfb54a10, __s=0x804b8f2 "2", __pos=4294967295, __n=1) at /usr/include/c++/4.1.2/bits/basic_string.tcc:721 721 size_type __ret = npos; 723 if (__pos + __n <= __size) (gdb) p __pos $2 = 4294967295 (gdb) p __n $3 = 1 (gdb) p __size $4 = 3 (gdb) p __pos + __n $5 = 0 |
4.2. gcc-4.8.2
以下为x86_64环境。
// g++ -g -o x x.cpp -m32 -D_GLIBCXX_DEBUG Breakpoint 1, main () at x.cpp:6 6 std::string::size_type n = std::string::npos; Missing separate debuginfos, use: debuginfo-install glibc-2.17-196.tl2.3.i686 libgcc-4.8.5-4.el7.i686 libstdc++-4.8.5-4.el7.i686 (gdb) n 7 std::string str = "123"; (gdb) 8 std::string::size_type m = str.find("2", n); (gdb) s std::string::find (this=0xffffd300, __s=0x80499d8 "2", __pos=4294967295) at /usr/include/c++/4.8.2/bits/basic_string.h:1864 1864 return this->find(__s, __pos, traits_type::length(__s)); (gdb) s std::char_traits<char>::length (__s=0x80499d8 "2") at /usr/include/c++/4.8.2/bits/char_traits.h:259 259 { return __builtin_strlen(__s); } (gdb) finish Run till exit from #0 std::char_traits<char>::length (__s=0x80499d8 "2") at /usr/include/c++/4.8.2/bits/char_traits.h:259 0x0804931f in std::string::find (this=0xffffd300, __s=0x80499d8 "2", __pos=4294967295) at /usr/include/c++/4.8.2/bits/basic_string.h:1864 1864 return this->find(__s, __pos, traits_type::length(__s)); Value returned is $1 = 1 (gdb) s std::string::find (this=0xffffd300, __s=0x80499d8 "2", __pos=4294967295, __n=1) at /usr/include/c++/4.8.2/bits/basic_string.tcc:740 740 const size_type __size = this->size(); |
5. a.cpp源代码
// g++ -g -o a a.cpp -ldl -m32 #include <dlfcn.h> #include <stdio.h> int main() { typedef int (*X)(); void* p = dlopen("./libx.so", RTLD_NOW); if (!p) printf("dlopen failed: %s\n", dlerror()); else { X x = (X)dlsym(p, "main"); (*x)(); } return 0; } |
6. 单个字符版本find源码
gcc-4.1.2版本的find源码,gcc-4.8.2的实现相同。
// basic_string.tcc template<typename _CharT, typename _Traits, typename _Alloc> typename basic_string<_CharT, _Traits, _Alloc>::size_type basic_string<_CharT, _Traits, _Alloc>:: find(_CharT __c, size_type __pos) const _GLIBCXX_NOEXCEPT { size_type __ret = npos; const size_type __size = this->size(); if (__pos < __size) { const _CharT* __data = _M_data(); const size_type __n = __size - __pos; const _CharT* __p = traits_type::find(__data + __pos, __n, __c); if (__p) __ret = __p - __data; } return __ret; } |
7. 字符串版本find源码
7.1. gcc-4.1.2
// /usr/include/c++/4.1.2/bits/basic_string.h 1575 size_type 1576 find(const _CharT* __s, size_type __pos = 0) const 1577 { 1578 __glibcxx_requires_string(__s); 1579 return this->find(__s, __pos, traits_type::length(__s)); 1580 } // /usr/include/c++/4.1.2/bits/basic_string.tcc 715 template<typename _CharT, typename _Traits, typename _Alloc> 716 typename basic_string<_CharT, _Traits, _Alloc>::size_type 717 basic_string<_CharT, _Traits, _Alloc>:: 718 find(const _CharT* __s, size_type __pos, size_type __n) const 719 { 720 __glibcxx_requires_string_len(__s, __n); 721 size_type __ret = npos; 722 const size_type __size = this->size(); 723 if (__pos + __n <= __size) // 这里溢出 724 { 725 const _CharT* __data = _M_data(); 726 const _CharT* __p = std::search(__data + __pos, __data + __size, 727 __s, __s + __n, traits_type::eq); 728 if (__p != __data + __size || __n == 0) 729 __ret = __p - __data; 730 } 731 return __ret; 732 } |
7.2. gcc-4.8.2
实现和gcc-4.1.2不同了,新的实现不存在溢出漏洞。
// /usr/include/c++/4.8.2/bits/basic_string.h 1860 size_type 1861 find(const _CharT* __s, size_type __pos = 0) const 1862 { 1863 __glibcxx_requires_string(__s); 1864 return this->find(__s, __pos, traits_type::length(__s)); 1865 } // /usr/include/c++/4.8.2/bits/basic_string.tcc 734 template<typename _CharT, typename _Traits, typename _Alloc> 735 typename basic_string<_CharT, _Traits, _Alloc>::size_type 736 basic_string<_CharT, _Traits, _Alloc>:: 737 find(const _CharT* __s, size_type __pos, size_type __n) const 738 { 739 __glibcxx_requires_string_len(__s, __n); 740 const size_type __size = this->size(); 741 const _CharT* __data = _M_data(); 742 743 if (__n == 0) 744 return __pos <= __size ? __pos : npos; 745 746 if (__n <= __size) // 这里不存在溢出 747 { 748 for (; __pos <= __size - __n; ++__pos) 749 if (traits_type::eq(__data[__pos], __s[0]) 750 && traits_type::compare(__data + __pos + 1, 751 __s + 1, __n - 1) == 0) 752 return __pos; 753 } 754 return npos; 755 } |
8. 结论
一些低版本的find实现存在bug,存在溢出。注:std::string::size_type实际为size_t,是一个无符号整数类型,在i386上为4字节无符号整数类型,在x86_84上为8字节无符号整数类型,对应的有符号类型为ssize_t。
转载于:https://www.cnblogs.com/aquester/p/10143920.html
std::string的find问题研究相关推荐
- std::string的拷贝赋值研究
说明:以下涉及的std::string的源代码摘自4.8.2版本. 结论:std::string的拷贝复制是基于引用计数的浅拷贝,因此它们指向相同的数据地址. // std::string类定义 ty ...
- 关于std::string 在 并发场景下 __grow_by_and_replace free was not allocated 的异常问题
使用string时发现了一些坑. 我们知道stl 容器并不是线程安全的,所以在使用它们的过程中往往需要一些同步机制来保证并发场景下的同步更新. 应该踩的坑还是一个不拉的踩了进去,所以还是记录一下吧. ...
- ATL::CStringA和std::string之间转换的一些误区
对于刚做windows下VC的开发同学,类型转换应该是一个令其很苦恼的问题.我刚写工作的时候,也为这类问题不停的在网上搜索转换方法.最近工作中遇到一个"神奇"的bug(一般&quo ...
- C++/C++11中std::string用法汇总
C++/C++11中std::string是个模板类,它是一个标准库.使用string类型必须首先包含<string>头文件.作为标准库的一部分,string定义在命名空间std中. st ...
- 在C++中对字符串std::string使用switch/case语句
如果你使用C语音的string,也就是char *,是可以放在switch/case语句中的. 在C++中是不能对字符串string使用switch/case语句的,这里的string指的是std:: ...
- 将整个ASCII文件读入C ++ std :: string [重复]
本文翻译自:Read whole ASCII file into C++ std::string [duplicate] This question already has an answer her ...
- 如何将std :: string转换为const char *或char *?
如何将<code>std::string转换为char*或const char* ? #1楼 看看这个: string str1("stackoverflow"); c ...
- c++ uint8_t* to std::string
Convert uint8_t* to std::string in C++? [duplicate] 正确写法: https://stackoverflow.com/questions/450891 ...
- QString与std::string的相互转换
QString与std::string的相互转换 原创 2014年07月07日 16:25:53 4011 [cpp] view plain copy //1 QString与int相互转换 QStr ...
最新文章
- 世界物联网大会IOT
- eBPF学习——抓取内核网络中的socket信息
- linux g++ gcc编译c++哪个好,linux g++编译c++
- 全链路灰度这样做,新需求迭代上线也能放心干饭
- 直播电商加速合规,引爆消费潜力
- cat 常用的日志分析架构方案_芯片失效分析常用方法及解决方案
- 我们在进行着一场拔河比赛……
- Android 开发环境在 Windows7 下的部署安装
- linux sqlserver 管理工具,Linux连接SqlServer的图形化工具SQuirrel
- vue组件一直注册不了_Vue自定义组件及组件的注册方法
- windows和linux存储float,C语言float型数据在内存中的储存方式
- apache是怎么运行php的_PHP与WEB服务器是如何交互的
- Linux学习总结(72)——Linux系统安全加固
- 线路由器常见故障和排除方法
- django.db.utils.OperationalError: (1049, Unknown database 'djangodb')
- sonar-runner命令模式运行sonar
- gitLab下载安装和使用教程
- Centos 使用防火墙 Firewalld 进行流量转发
- java p2p 聊天_P2P--多用户在线聊天室(Java源码)
- 计算机网卡和交换机网卡以及交换机数据转发
热门文章
- 整理了一下Asp.net源码常见问题(完善中...),欢迎大家补充修正(最后更新于06-01)!...
- ASP.NET MVC+Bootstrap个人博客之打造清新分页Helper(三)
- HP 服务器 iLO 远程控制软件 介绍
- VS2013 编译使用 stlport
- 上周回顾:微软与苹果比赛谁更“不安全”
- IOS视频编辑功能详解上篇-添加水印
- [Doctrine Migrations] 数据库迁移组件的深入解析三:自定义数据字段类型
- 前端每日实战:45# 视频演示如何用纯 CSS 创作一个菱形 loader 动画
- Spring中WebApplicationContext
- openssh配置终极一帖