最近看到微博的短链接真是很火啊,新浪、腾讯、搜狐等微博网站都加入了短链接的功能。之所以要是使用短链接,主要是因为微博只允许发140 字,如果链接地址太长的话,那么发送的字数将大大减少。短链接的主要职责就是把原始链接很长的地址压缩成只有6 个字母的短链接地址,当我们点击这6 个字母的链接后,我们又可以跳转到原始链接地址。

开始以为短链接是按照某种算法把原始链接压缩为短链接,再根据算法从短链接反算成原始链接的。后来尝试了下压缩算法(gzip 压缩算法),发现对于url 这种字符串越是压缩,长度就越长。通过对压缩算法的一些了解,发现靠压缩算法来实现这个功能不太靠谱。

后来在网上找到一个生成算法,该算法主要使用MD5 算法对原始链接进行加密(这里使用的MD5 加密后的字符串长度为32 位),然后对加密后的字符串进行处理以得到短链接的地址。原始的算法是C# 版本的,这里我把该算法修改成Java 版本的. 算法的具体代码如下,代码中有注释:

一、  代码

package com.csdn.shorturl;

public class ShortUrlGenerator {

/**

@param args

*/

public static void main(String[] args) {

// 长连接: http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml

// 新浪解析后的短链接为: http://t.cn/h1jGSC

String sLongUrl = "http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml" ; // 3BD768E58042156E54626860E241E999

String[] aResult = shortUrl (sLongUrl);

// 打印出结果

for int i = 0; i < aResult. length ; i++) {

System. out .println( "[" + i + "]:::" + aResult[i]);

}

}

public static String[] shortUrl(String url) {

// 可以自定义生成 MD5 加密字符传前的混合 KEY

String key = "wuguowei" ;

// 要使用生成 URL 的字符

String[] chars = new String[] { "a" , "b" , "c" , "d" , "e" , "f" , "g" , "h" ,

"i" , "j" , "k" , "l" , "m" , "n" , "o" , "p" , "q" , "r" , "s" , "t" ,

"u" , "v" , "w" , "x" , "y" , "z" , "0" , "1" , "2" , "3" , "4" , "5" ,

"6" , "7" , "8" , "9" , "A" , "B" , "C" , "D" , "E" , "F" , "G" , "H" ,

"I" , "J" , "K" , "L" , "M" , "N" , "O" , "P" , "Q" , "R" , "S" , "T" ,

"U" , "V" , "W" , "X" , "Y" , "Z"

};

// 对传入网址进行 MD5 加密

String sMD5EncryptResult = ( new CMyEncrypt()).getMD5OfStr(key + url);

String hex = sMD5EncryptResult;

String[] resUrl = new String[4];

for int i = 0; i < 4; i++) {

// 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算

String sTempSubString = hex.substring(i * 8, i * 8 + 8);

// 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用 long ,则会越界

long lHexLong = 0x3FFFFFFF & Long.parseLong (sTempSubString, 16);

String outChars = "" ;

for int j = 0; j < 6; j++) {

// 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引

long index = 0x0000003D & lHexLong;

// 把取得的字符相加

outChars += chars[( int ) index];

// 每次循环按位右移 5 位

lHexLong = lHexLong >> 5;

}

// 把字符串存入对应索引的输出数组

resUrl[i] = outChars;

}

return resUrl;

}

}

二、  输出结果

执行上面代码的结果如下,会产生4 组6 位字符串,任意一组都可以作为当前字符串的短链接地址。

[0]:::7nUFJn

[1]:::f6Zzy2

[2]:::j6jmQb

[3]:::2eAjea

三、  跳转原理

当我们生成短链接之后,只需要在表中(数据库或者NoSql )存储原始链接与短链接的映射关系即可。当我们访问短链接时,只需要从映射关系中找到原始链接,即可跳转到原始链接。

微博短链接的生成算法(Java版本)相关推荐

  1. java短链接原理_微博短链接的生成算法(Java版本)

    最近看到微博的短链接真是很火啊,新浪.腾讯.搜狐等微博网站都加入了短链接的功能.之所以要是使用短链接,主要是因为微博只允许发140 字,如果链接地址太长的话,那么发送的字数将大大减少.短链接的主要职责 ...

  2. 微博短链接的生成算法(Java 版本)

    最近看到微博的短链接真是很火啊,新浪.腾讯.搜狐等微博网站都加入了短链接的功能.之所以要是使用短链接,主要是因为微博只允许发140字,如果链接地址太长的话,那么发送的字数将大大减少.短链接的主要职责就 ...

  3. 新浪微博短链接的生成算法(Java版本)

    最近看到微博的短链接真是很火啊,新浪.腾讯.搜狐等微博网站都加入了短链接的功能.之所以要是使用短链接,主要是因为微博只允许发140 字,如果链接地址太长的话,那么发送的字数将大大减少.短链接的主要职责 ...

  4. php 短网址 算法,微博短链接算法PHP版本_php

    思路: 1)将长网址md5生成32位签名串,分为4段, 每段8个字节; 2)对这四段循环处理, 取8个字节, 将他看成16进制串与0x3fffffff(30位1)与操作, 即超过30位的忽略处理; 3 ...

  5. 微博URL短地址lua生成算法

    短地址(Short URL),或 叫短网址.短链接等等 ,就是比较短的URL地址. 借助短地址,可以将原来冗长的网址替换成简短的网址,让使用者可以更容易分享链接. 在Web 2.0的今天,不得不说,这 ...

  6. 短链接java代码_java高仿新浪微博短链接地址生成工具ShortUrlGenerator.java

    仿新浪微博 短链接地址生成工具 ShortUrlGenerator.java String sLongUrl = "http://tech.sina.com.cn/i/2011-03-23/ ...

  7. java 新浪短链接_java高仿新浪微博短链接地址生成工具ShortUrlGenerator.java | 学步园...

    仿新浪微博 短链接地址生成工具 ShortUrlGenerator.java String sLongUrl = "http://www.zuidaima.com/share/1550463 ...

  8. java高仿新浪微博短链接地址生成工具ShortUrlGenerator.java

    原文:仿新浪微博 短链接地址生成工具 ShortUrlGenerator.java 源代码下载地址:http://www.zuidaima.com/share/1550463378934784.htm ...

  9. 短链接的生成之工具类的编写--三种方式(亲测可用)

    在很多时候我们都需要使用到短链接,比较常见的是在生成微信二维码的时候,长的url不能生成二维码,必须使用短链接.所以短链接的生成就尤其重要,废话不多说,下面直接介绍三种生成短链接的工具类 一.使用百度 ...

最新文章

  1. WAIC汇聚全球顶级科学家,畅谈人工智能的未来挑战与突破
  2. python读出文件中的内容_Python读取文本内容
  3. myeclipse定位代码文件位置
  4. qq编辑资料html,腾讯限置qq日记代码HTML在线编辑器: http://www.wyzxsx.com/editor.asp
  5. 用asp.net获取服务器和客服端有关信息
  6. AutoCAD ObjectARX和RealDWG的基本数据操作
  7. 确认过眼神,你是要来百度AI开发者实战营深圳站的人
  8. 学习LoadRunner之C语言函数
  9. 详解淘宝大秒杀系统设计,首次公开
  10. dynamipsGUI+VMware
  11. [ATL/WTL]_[Gdiplus]_[关于混用GDI和GDI+(GDIPlus)导致显示不正常的解决方案]
  12. python爬取金庸小说全集
  13. 基于Matlab的车型识别(GUI界面)
  14. oracle系统的物料编码,物料编码汇总专题[大家一起努力将其补充完善!以方便大家查阅!] - □-Oracle ER......
  15. Windows10 MySQL8.0版本的压缩包安装方式
  16. 数字金额转中文大写(到亿)
  17. 「UG/NX」BlockUI 枚举Enum
  18. Box-constrained L-BFGS 相关知识拓展
  19. 毕业设计、卷积cnn、lstm、random walk、地址交易识别
  20. 激光测距项目整体框图及原理

热门文章

  1. 阿里云CDN+点播服务助力云学堂全面提升用户在线学习体验
  2. “天才少年”稚晖君宣布离职再创业 !
  3. 多旋翼无人机进阶教程
  4. 卷积神经网络中的add和concat
  5. 纪念币有没有收藏价值?
  6. vue项目中使用vw/vh
  7. Java/java程序设计多态参数:练手小题:父类员工类含有普通员工和经理两个子类,普通员工有work方法,经理有特有属性年终奖,和manage方法现要求在主文件中设计能调用所有类的年薪方法和工作方法
  8. OPPO粟俊娥:OPPO研发云持续交付实践之路
  9. XMind生成PDF文档
  10. C语言实现杨辉等腰三角形及变形三角形(附代码)