最近在做一个iOS IM SDK,在内部试用的阶段,不断有兄弟部门或者合作伙伴过来问各种技术细节,所以统一写一篇文章记录,统一介绍下一个IM APP的方方面面,包括技术选型(包括通讯方式,网络连接方式,协议选择)和常见问题。

通讯方式选择

IM通讯方式无非两种选择:设备直连(P2P)和通过服务器中转。

P2P

P2P多见于局域网内聊天工具,典型的应用有:飞鸽传书,天网Maze(你懂的)等。这类软件在启动后一般做两件事情

进行UDP广播:发送自己信息和接受同局域网内其他端信息

开启TCP监听:等待其他端进行连接

详细的流程可以参考飞鸽传书源码。但是这种方式在有种种限制和不便:一方面它只适合在线的点对点消息传输,而对离线,群组等业务支持不够。另一方面由于 NAT 的存在,使得不同局域网内机器互联的难度大大上升,在某些网络类型(对称NAT)下无法建立连接。

服务器中转

几乎所有互联网IM产品都采用服务器中转这种方式进行消息传输,相对于P2P的方式,它有如下的优点:

  • 能够支持更多P2P无法支持或支持不好的业务,如离线消息,群组,聊天室服务

  • 方便业务逻辑的拓展和新旧版本的兼容

当然它也有自己的问题:服务器架构复杂,并发要求高。

网络连接方式

IM主流网络连接方式有两种:

  • 基于TCP的长连接

  • 基于HTTP短连接PULL的方式

后者常见于WEB IM系统(当然现在很多WEB IM都是基于WebSocket实现),它的优点是实现简单,方便开发上手,问题是流量大,服务器负载较大,消息及时性无法很好地保证,对大规模的用户量支持不够,比较适合小型的IM系统,如一个小网站的客户系统。

基于TCP长连接则够更好地支持大批量用户,问题是客户端和服务器的实现比较复杂。当然也还有一些变种,如下行使用MQTT进行服务器通知/消息的下发,上行使用HTTP短连接进行指令和消息的上传。这种方式能够保证下行消息/指令的及时性,但是在弱网络下上行慢的问题还是比较严重。早期的来往就是基于这种方式。

协议选择

IM协议选择原则一般是:易于拓展,方便覆盖各种业务逻辑,同时又比较节约流量。后一点的需求在移动端IM上尤其重要。

常见的协议有:

  • XMPP

  • SIP

  • MQTT

  • 私有协议

XMPP协议的优点在于:协议开源,可拓展性强,在各个端(包括服务器)有各种语言的实现,开发者接入方便。但是缺点也是不少:XML表现力弱,有太多冗余信息,流量大,实际使用时有大量天坑。

SIP协议多用于VOIP相关的模块,是一种文本协议,由于我并没有实际用过,所以不做评论,但从它是文本协议这一点几乎可以断定它的流量不会小。

MQTT的优点是协议简单,流量少,但是它并不是一个专门为IM设计的协议,多使用于推送。

而市面上几乎所有主流IM APP都是是使用私有协议,一个被良好设计的私有协议一般有如下优点:高效,节约流量(一般使用二进制协议),安全性高,难以破解。缺点则是在开发初期没有现有样列可以参考,对于设计者的要求比较高。

一个好的协议需要满足如下条件:高效,简洁,可读性好,节约流量,易于拓展,同时又能够匹配当前团队的技术堆栈。基于如上原则,我们可以推出: 如果团队小,团队技术在IM上积累不够可以考虑使用XMPP或者MQTT+HTTP短连接的实现。反之可以考虑自己设计和实现私有协议。

私有协议的设计

序列化选择

移动互联网相对于有线网络最大特点是:带宽低,延迟高,丢包率高和稳定性差,流量费用高。所以在私有协议的序列化上一般使用二进制协议,而不是文本协议。常见的二进制序列化库有protobuf和MessagePack,当然你也可以自己实现自己的二进制协议序列化和反序列的过程,比如蘑菇街的TeamTalk。但是前面二者无论是可拓展性还是可读性都完爆TeamTalk(TeamTalk连Variant都不支持,一个int传输时固定占用4个字节),所以大部分情况下还是不推荐自己去实现二进制协议的序列化和反序列化过程。

协议格式设计

基于TCP的应用层协议一般都分为包头和包体(如HTTP),IM协议也不例外。包头一般用于表示每个请求/反馈的公共部分,如包长,请求类型,返回码等。 而包头则填充不同请求/反馈对应的信息。

一个最简单的包头可以定义为

1
2
3
4
5
6
7
struct PackHeader
{
    int32_t     length_;    //包长度
    int32_t     serial_;    //包序列号
    int32_t     command_;   //包请求类型
    int32_t     code_;      //返回码
};

以心跳包为例,假设当前的serial为1,心跳包的command为10,那么使用MessagePack做序列化时:length=4,serial=1,command=10,code=0,每个字段各占一个字节,包体为空,仅需要4个字节。

当然这是最简单的一个例子,面对真正的业务逻辑时,包体里面会需要塞入更多地信息,这个需要开发根据自己的业务逻辑总结公共部分,如为了兼容加入的协议版本号,为了负载均衡加入的模块id等。

其他问题

上面就是一个IM系统大致的选型过程:通讯方式,连接方式,协议选择,协议设计。但是实际开发过程中还有大量的问题需要处理。

协议加密

为了保证协议不容易被破解,市面上几乎所有主流IM都会对协议进行加密传输。常见的流程和HTTPS加密相似:建立连接后,客户端和服务器进行进行协商,最终客户端获得一个当前Sessino的秘钥,后续的数据传输都通过这个秘钥进行加解密。一般出于效率的考虑都会采用流式加密,如RC4。而前期协商过程则推荐使用AES等非对称加密以增加破解难度。

快速连接(登录)

对iOS APP而言,因为没有真后台的存在,APP每次启动基本都需要一次重连登录(短时间内切换除外),所以如何快速重连重登就非常重要。常见的优化思路如下:

  • 本地缓存服务器IP并定期刷新。移动网络调优可以参考《iOS移动网络调优那些事》。

  • 合并部分请求。如加密和登录操作可以合并为同一个操作,这样就可以减少一次不必要的网络请求来回的时间。

  • 简化登录后的同步请求,部分同步请求可以推迟到UI操作时进行,如群成员信息刷新。

连接保持

一般APP实现连接保持的方式无非是采用应用层的心跳,通过心跳包的超时和其他条件(网络切换)来执行重连操作。那么问题来了:为什么要使用应用层心跳和如何设计应用层心跳。

众所周知TCP协议是有KEEPALIVE这个设置选项,设置为KEEPALIVE后,客户端每隔N秒(默认是7200s)会向服务器发送一个发送心跳包。但实际操作中我们更多的时是使用应用层心跳。原因如下:

  • KEEPALIVE对服务器负载压力比较大(服务器大大是这么说的...)

  • socks代理对KEEPALIVE并不支持

  • 部分复杂情况下KEEPALIVE会失效,如路由器挂掉,网络直接被拔除

移动端在实际操作时为了节约流量和电量一般会在心跳包上做一些小优化

  • 尽量精简心跳包,保证一个心跳包大小在10字节之内

  • 心跳包只在空闲时发送 (收到最后一个数据包n秒内再也没有收到包则进行一次心跳)

  • 根据APP前后台状态调整心跳包间隔 (主要是安卓)

消息可达

在移动网络下,丢包,网络重连等情况非常之多,为了保证消息的可达,一般需要做消息回执和重发机制。参考易信,每条消息会最多会有3次重发,超时时间为15秒,同时在发送之前会检测当前连接状态,如果当前连接并没有正确建立,缓存消息切定时检查(每隔2秒检查一次,检查15次)。所以一条消息在最差的情况下会有2分多的重试时间,以保证消息的可达。

因为重发的存在,接受端偶尔会收到重复的两条消息,这种情况下就需要接收端进行去重。一般的做法是每条消息都有自己唯一的message id(一般是uuid)。

文件上传优化

IM消息(包括SNS模块)内包含大量的文件上传的需求,如何优化文件的上传就成了一个比较大的主题。常见有下面这些优化思路:

  • 将上传流程提前:音频提供边录边传。朋友圈的图片进行预上传,选择图片后用户一般会进行文本输入,在这段时间内后台就可以默默将选好的图片进行上传。

  • 提供闪电上传的方式:服务器根据MD5进行文件去重。

  • 优化和上传服务器的连接(参考快速连接),提供连接重用的功能。

  • 文件分块上传:因为移动网络丢包严重,将文件分块上传可以使得一个分组包含合理数量的TCP包,使得重试概率下降,重试代价变小,更容易上传到服务器。

  • 在分包的前提下支持上传的pipeline,避免不必要的网络等待时间。

  • 支持断点续传

移动IM开发那些事:技术选型和常见问题相关推荐

  1. 【区块链实战】什么是DAPP,区块链开发如何进行技术选型

    目录 一.简介 二.知识点 DAPP 公链 联盟链 区块链开发涉及的角色 Solidity 三.技术选型 1.DApp 架构分析 2.公链与联盟链 一.简介 区块链技术现在已经进入一个高速发展时期,作 ...

  2. 一个互联网app的开发设计(技术选型和架构)

    原文地址:http://blog.csdn.net/brycegao321/article/details/51830525 在做一个互联网应用时, 要考虑技术选型和架构搭建. 先说说技术选型,   ...

  3. 论区块链应用开发中的技术选型

    区块链技术栈总览 区块链技术栈现阶段总览 链端选型 Fabric [ x,逐渐被市场淘汰 ] 和以太坊不能兼容的链 [ x ,原因:单打独斗,无法借力 ] FISCO BCOS / Venachain ...

  4. 开发中的技术选型调研总结

    最近公司研发项目有这么一个需求: 主要用来实现IM系统中用户文件上传和下载这部分的功能. 小组的组长是个大神,只是给我们定了一个大致的需求分析,告诉我们现在肯定有很多这种功能的实现,但是具体使用哪种技 ...

  5. 前端学习(1848)vue之电商管理系统电商系统的开发模式和技术选型

  6. 技术选型——混编APP应用概述

    本文主要是针对**APP进行开发之前的技术选型准备文档,现在share出来,希望在做同类开发的您留下宝贵意见. =============================分割线============ ...

  7. 如何做好企业/团队的技术选型?

    好的技术选型,能最大程度地提高企业和团队的效率,从而开发出满足用户需求的产品.作为一线的技术管理者,他们都是怎样做的呢? 大公司或者大一点的团队的技术选型几乎不需要太多讨论,因为最后会不可避免地绕到技 ...

  8. 《江湖X》开发那些事 - 2.技术选型

    写在开头,对于任何非尖端型研发项目的技术选型,我的忠告: 不要造次 江湖X技术选型 客户端: Unity(C#+lua) 服务器: SCut(C#) 数据库: redis.mysql 关于客户端游戏引 ...

  9. Java开发中Websocket的技术选型参考

    1. 前言 Websocket是 HTML5 开始提供的一种在单个 TCP 连接上进行全双工通讯的协议.WebSocket 使得客户端和服务器之间的数据交换变得更加简单,允许服务端主动向客户端推送数据 ...

最新文章

  1. linux iptables常用命令之配置生产环境iptables及优化
  2. Frontiers期刊向您邀稿啦!脑机接口领域
  3. python 任务调度 celery_python任务调度模块celery(二)
  4. Linux下mysql5.1修改密码,Linux下MySQL忘记密码
  5. Gradle 1.12用户指南翻译——第五十四章. 构建原生二进制文件
  6. 关于es查询dsl的filter与must,term与match的区别
  7. Python私有化与poperty方法
  8. java 动态性之反射机制 详解 案例,java架构师技术图谱
  9. 图解hadoop原理
  10. WPS-Word : 页首的段落段前间距失效/不起作用/无效,段前一行无效没反应
  11. U盘文件目录损坏且无法读取
  12. 别再乱用了,这才是 @Validated 和 @Valid 的真正区别和用法!
  13. 多页vue应用的单页面打包方法(内含打包模式的应用)
  14. 用python把数据画成饼状图_Python学习第92课——数据可视化之饼状图绘制
  15. matlab中的~用法和~=
  16. 【随笔】在CSDN的第一年,你好,桐小白~ —— 在CSDN的一岁生日
  17. (总结)什么是HTML语义化
  18. No7. 字符串匹配
  19. 北大邮箱收件服务器,北京大学网络服务
  20. 2021年10款优质Chrome浏览器插件推荐

热门文章

  1. eclipse打包jar发布到linux下运行出错(java.lang.ClassNotFoundException: cmd.WordCount$MyMapper )
  2. LeetCode Hot100 ---- 动态规划专题
  3. 【Transformer】CSWin Transformer: A General Vision Transformer Backbone with Cross-Shaped Windows
  4. md发布test-1 md发布test-1md发布test-1md发布test-1md发布test-1md发布test-1md发布test-1md发布test-1md发布test-1md发布test-
  5. 马云狂炸近百亿,你的借呗额度涨了吗?
  6. 少数民族青年作家要有更高的标准和目标
  7. 《城邦暴力团》:一部奇书、反书、隐书
  8. java abstractset 继_java集合框架-AbstractSet
  9. eureka集群只注册一个_Spring cloud系列教程第十篇- Spring cloud整合Eureka总结篇
  10. php输出查询mysql总数_PHP查询语句,如何返回总记录数??