key-value 多线程server的Linux C++实现

项目需求
整体思路
网络通信
字符解析
数据存储与查询
- 1 存储管理
- 2 数据查询
多线程
待改进未实现的想法
GitHub源代码

项目需求

设计一个基于Socket或基于HTTP的server，服务内容是提供一种简单的key/value映射关系的管理与查询
以下的全部操作都是通过结构体Node来传递的：
struct Node {
char key[KEY_SIZE];
char value[VALUE_SIZE];
};
本场景中须要client和server两个程序
client端仅仅有两种操作：
int AddNode(const struct Node *node); // 将指定的node保存到server上，须要key和value都完整
int GetNode(struct Node *node); // 输入的node须要有完整的key。server负责将这个key相应的value填到node中。或返回不存在

server: server端就是接收client的两种请求，然后要么保存node要么查询node并返回值。
server端怎么保存node不作要求，但要达到以下的几点：
1. 假设将全部node都保存在内存中。那么当内存中的数据太多时，须要定期将node保存成磁盘文件。
2. client端在运行AddCell时，假设相应的key已经存在于server端。那么覆盖原有的值。

1. 整体思路

首先我们要开发一个基于网络的server，那么网络的知识是必须的，我们要开发的server是一种要求端对端的可靠的server。因此将採用基于TCP协议和套接字Socket作为服务端和client之间的通信方式。进，而我们能够观察到我们操作的数据是一个（key,value）形式。而TCP是一个以字节流传输的连接，因此须要一个字符串(char*)和数据结构(key,value)之间的相互转换函数。来将服务端和client之间的传输字节流解析成命令和数据节点（以及将命令和数据节点打包成字符串进行通信）。然后我们必须考虑server上数据的存储和查询问题，这是项目实现的关键。最后，server肯定要支持多client的同一时候连接和通信，因此还必须增加多线程或多进程。
本项目已实现的功能：

基于Socket的TCP网络传输
对网络传输字符的解析与打包
LRU Page 缓存
Hash-map 查找
多线程多clients 同一时候put。get操作

以下将从四个方面进行阐述项目思想：网络通信，字符解析。数据存储与查询，多线程实现。

2. 网络通信

基于本server的功能特性考虑。我们要求的是可靠性，因此选择TCP。
而在TCP的连接前。
- server首先要做的准备是：创建一个连接套接字socket。然后socket绑定(bind)在一个IP和Port上以供client寻找。监听(listen)client的请求，然后accept一直堵塞等待client的连接。

- client须要做的准备：client的套接字附上服务端的ip地址和自己的port号。
当服务端和client做好通信准备后，由client发起，服务端响应。经过三次握手，建立相互之间的连接。
当一个client通信完毕后， client会主动向服务端请求释放连接。

关于三次握手以及当一个client通信完毕，与服务端释放连接时的四次挥手的具体知识，请參考wireshark抓包图解 TCP三次握手/四次挥手具体解释

建立连接后，服务端调用accept()函数。堵塞服务端进程。直至收到clientsend()过来的信息。
关于网络编程中的Socket接口函数的具体解说。參考Linux的SOCKET编程具体解释

3. 字符解析

因为网络通信中传输的是字符，我们必须将字符解析成命令(put,get,…etc.)和数据(key,value)。
由上述得知，传输字符包括有：命令，key，value。我们可依据习惯。设立切割字符，如空格，分号等。

须要注意的是每次传输的字符串切割后，得到的子字符串的个数可能是不同的，如”put 12:quinn” 分为3段，而”get 12”分为2段，”exit”仅仅有一段。

因此依据client发信给client的命令不同，字符解析函数将它解析成不同的命令。

而服务端首先推断第一段字符的含义(put,get,exit,save等)。来决定自己要实现的动作。

源代码查看：https://github.com/qzxin/key-value-server/blob/master/convert.cpp

4. 数据存储与查询

4.1 存储管理

因为内存空间有限。当数据量到达上限时，必须把数据转存到磁盘文件里。
在server实现过程中，服务端须要接受client的get和put两种操作，
- put(key, value): 在接收一定数量的数据后须要将数据保存到磁盘上，而且须要检查是否存在同样的key。
- get(key): 向服务端查询是否存在该key；

因为项目需求同样的key仅仅能有一个值，所以无论是put和get都必须遍历内存和磁盘文件里的数据，查找是否含有该key。假设每一次操作都须要訪问磁盘，那么效率将是极低的，因为訪问数据的时间局部性，近期訪问过的数据在近期内有更大的可能再次被訪问，因此想到了引入内存缓存系统，即将近期訪问过的节点保留在内存中。又由訪问数据的空间局部性，近期訪问过的数据周围的数据有更大的可能被訪问，想到了引入分页机制。

缓存系统：当查找节点时，首先在缓存中查找。查找成功则对该节点操作。

缓存查找失败。即缺页中断。因为内存空间限制。缓存的大小是一定的，当发生缺页中断时，要从磁盘中载入新数据，即须要不断的用近期訪问成功的新数据替换缓存中的旧数据。
分页机制：当待查找数据不在缓存，即缺页中断时，假设每次都从磁盘中载入一个数据，那效率是不可接受的。因此，将页（包括N个数据节点）作为缓存和磁盘数据之间操作的基本单位。

如上提到的缺页中断是操作系统中内存管理中的概念。

在请求分页存储管理系统中。因为使用了虚拟存储管理技术，使得全部的进程页面不是一次性地全部调入内存，而是部分页面装入。
这就有可能出现以下的情况：要訪问的页面不在内存。这时系统产生缺页中断。操作系统在处理缺页中断时，要把所需页面从外存调入到内存中。假设这时内存中有空暇块，就能够直接调入该页面。假设这时内存中没有空暇块，就必须先淘汰一个已经在内存中的页面，腾出空间。再把所需的页面装入。即进行页面置换。
当缺页中断时，须要进行页面置换。而常见的页面置换算法有：FIFO。LRU和时钟算法。
（1）FIFO是淘汰内存中存在时间最长的页，而最长的页可能是最常被訪问的。因此性能差。
（2）LRU是淘汰内存中最久没有被訪问的页。
（3）时钟算法是，将页连成一个环形链表，当缺页中断时。指针指向最老的页，当该页的訪问位为0。则删除该页。若该页訪问位为1，则将訪问位置0。遍历它的下一页，直至遇到一个訪问位为0的页。用新数据替换它，并把指针指向它的下一页。

注意，本文中假设”数据缓存“存在于内存中，即内存缓存，而”磁盘中的数据文件“模拟现代OS中的虚拟内存。即本文将缓存放在内存，将磁盘文件当做缓存页。

本文选用easy实现且性能尚可的LRU页面置换。具体实现过程已在还有一篇博文基于文件页的 LRU Cache：磁盘缓存实现中具体描写叙述，本文不再赘述。

本文思想是，为了更便利的对页数据进行置换。将磁盘文件的大小设置为页的大小，形成映射。

当缺页中断时，调入新的一页时，即读一个新文件到内存中。而怎样定位文件，下文分析；而被替换掉的页。假设页的dirty位为1。则又一次写入到它所属的文件，为了实现这一点，在页的数据结构中应该包括该页所属文件的编号。（这是OS中虚拟缓存的思想）

怎样定位key所在的文件？（2015/07/19更新）
建立（key, file）映射的hash表。put操作时，将每个新key和该key将要存入的文件序号压入一个hash-map；get操作或put操作。search（key）时。假设该key不在缓存中，那么查key-file映射表，假设存在该key相应的文件，则将该文件载入进缓存中，否则返回不存在该key。注意，在server启动时，应该载入（key，file）的映射表(它们存储在一个文件里)。

class HashCache::Page {
public:int file_num_; // 页所相应的文件序号bool lock_;bool dirty_;  // 标记page是否被改动class Node data_[PAGE_SIZE];  // 页包括的节点数据class Page* next;class Page* prev;Page() {lock_ = false;dirty_ = false;}
};

4.2 数据查询

4.1存储管理攻克了数据的存储和载入问题，那么怎样能高速的索引到一个数据呢？两种办法，平衡二叉树O(lgn)和hash表O(1);我们知道hash表的缺点是不能有效解决冲突，而本项目中的key，value唯一。因此採用更快的hash-map实现数据的索引，当然採用时间复杂度为O(lgn)的map实现也是能够的。

在实际操作中，当每次缺页中断，载入一页时，将新页的数据都插入到hash-map中，同一时候将被替换页的数据从hash-map中释放。而为了保证这点，在构建数据结构时，每个数据节点必须包括它所属的页号。

class HashCache::Node {
public:std::string key_;std::string value_;class Page* page_;  // 该数据节点所属页
};

总结：由操作系统中的内存页面置换和虚拟缓存中的理论，迁移得到本项目server数据的存储和查询的实现思想。
本节思想的具体实现步骤，已再还有一篇博文中描写叙述。点击此处查看。

5. 多线程

2015/09/30 更新
对于多线程实现，因为线程的创建和销毁耗费时间和资源，因此对于大量的短的传输任务能够用线程池的方式实现。

一个server肯定是要支持多client通信的。那么应该使用多进程还是多线程呢？
由上文可知，全部的数据都是先存储到内存中。然后再转存到文件里，那么为了内存数据（缓存）的共享。选用多线程实现。
每当有一个client和server连接成功后，新建一个线程，将连接套接字传入线程处理函数。然后分离（detach）该线程。由该线程处理该client的全部通信。

因为是通过”共享内存“的方式实现线程之间的通信，可能存在多个client同一时候针对一个key的value做改动。同一时候有client在读取该key的value，造成数据的不同步？那应该怎样解决线程同步问题呢？

线程同步的方式：临界区。相互排斥锁。信号量，事件

本项目，採用相互排斥锁解决数据之间的同步问题，引入2个锁：写入锁和读取锁。当有一个正在put时，全部的put和get操作等待；当有get操作时，能够再有get操作，put操作等待。（读者写者问题的经典思想）
C++多线程编程，详情请參阅：C++11 编写 Linux 多线程程序
C++线程信号量和锁，详情请參阅：C++11 并发指南三(std::mutex 具体解释)

2015/09/30 更新
如上述所述，每一次操作缓存都要锁定整个缓存部分，能够做出例如以下改进：使用两个相互排斥量进行加锁，当读取或者写入一个页的数据时，对该页进行加锁。其它页能够正常訪问。可是，当将刚刚操作的页放到双向链表的头部时，须要对整个链表（整个缓存）进行加锁。这样粒度更小。效率更高。

6. 待改进。未实现的想法

怎样增加断电缓存重建机制？
怎样增加查询超时推断？
需不须要线程调度？
是否能把全部的key全放到一个set里，当cache中不存在该key时，去set里查找。假设存在然后才去遍历文件。不存在则直接返回。
是不是还能够。将key。page_num对存入一个hash-map，依据key直接索引到其所属的页（相应文件号）。
其它參考信息：淘宝自主开发的一个分布式key/value存储系统Tair，开发本项目时没有发现~~~

7. GitHub源代码

本项目开发环境Linux GCC4.8.4 ，C++ 11
源代码：https://github.com/qzxin/key-value-server
原文：key-value 多线程server的Linux C++实现：http://blog.csdn.net/quzhongxin/article/details/46927785

转载于:https://www.cnblogs.com/blfshiye/p/5394835.html