手把手教会你模拟退火算法
今天终于用模拟退火过了一道题:CodeVS: P1344。
有 N ( <=20 ) 台 PC 放在机房内,现在要求由你选定一台 PC,用共 N-1 条网线从这台机器开始一台接一台地依次连接他们,最后接到哪个以及连接的顺序也是由你选定的,为了节省材料,网线都拉直。求最少需要一次性购买多长的网线。(说白了,就是找出 N 的一个排列 P1 P2 P3 ..PN 然后 P1 -> P2 -> P3 -> ... -> PN 找出 |P1P2|+|P2P3|+...+|PN-1PN| 长度的最小值)
这种问题被称为最优组合问题。传统的动态规划算法O(n22n)在n = 20的情况下空间、时间、精度都不能满足了。这时应该使用比较另类的算法。随机化算法在n比较小的最优化问题表现较好,我们尝试使用随机化算法。
1 #include<cstdio> 2 #include<cstdlib> 3 #include<ctime> 4 #include<cmath> 5 #include<algorithm> 6 7 const int maxn = 21; 8 double x[maxn], y[maxn]; 9 double dist[maxn][maxn]; 10 int path[maxn]; 11 int n; 12 double path_dist(){ 13 double ans = 0; 14 for(int i = 1; i < n; i++) { 15 ans += dist[path[i - 1]][path[i]]; 16 } 17 return ans; 18 } 19 int main(){ 20 srand(19260817U); // 使用确定的种子初始化随机函数是不错的选择 21 scanf("%d", &n); 22 for(int i = 0; i < n; i++) scanf("%lf%lf", x + i, y + i); 23 for(int i = 0; i < n; i++) for(int j = i + 1; j < n; j++) dist[i][j] = dist[j][i] = hypot(x[i] - x[j], y[i] - y[j]); 24 25 for(int i = 0; i < n; i++) path[i] = i; // 获取初始排列 26 double ans = path_dist(); // 初始答案 27 int T = 30000000 / n; // 单次计算的复杂度是O(n),这里的30000000是试出来的 28 while(T--){ 29 std::random_shuffle(path, path + n); // 随机打乱排列 30 ans = std::min(ans, path_dist()); // 更新最小值 31 } 32 printf("%.2lf", ans); 33 }
可惜的是,这个算法只能拿50分。使用O(n!)枚举排列和使用上述算法没有太大的不同。从解的角度分析,假如某一次计算尝试出了一个比较好的路径,那么最优的路径很可能可以在原基础上作一两次改动就可以得到,这时候完全打乱整个序列不是一个很好的选择。
另一个方法:根据原序列生成一个新的序列,然后交换新序列的任意两个数。假如说新生成的序列更优,则使用新序列继续计算,否则序列不变。
这个算法就是局部搜索法(爬山法)。可惜,这个算法不正确。这个算法只顾眼前,忽略了大局,只要更优便走,这样可能会造成“盯着眼前的小山包,忽略远处的最高峰”,找到的值往往只是“局部最优值”。当然——这个方法也并不是完全不正确。我们可以多次计算使用上述方法计算,取最值。这里不再赘述。
下面介绍退火算法(SA,Simulated Annealing)。
首先拿爬山做例子:我们要找到山脉的最高峰,但是我(计算机)只能看到我的脚下哪边是上升的,哪边是下降的,看不到远处是否上升。每次移动,我们随机选择一个方向。如果这个方向是上升的的(更优),那么就决定往那个方向走;如果这个方向是下降的(更差),那么“随机地接受”这个方向,接受就走,不接受就再随机一次——这个随机是关键,要考虑很多因素。比如,一个陡的下坡的接受率要比一个缓的下坡要小(因为陡的下坡后是答案的概率小);同样的下降坡度,接受的概率随时间降低(逐渐降低才能趋向稳定)。
为什么要接受一个更差的解呢?如下图所示:
如果坚决不接受一个更差的解,那么就会卡在上面的“当前位置”上了。倘若接受多几次更差的解,让他移动到山谷那里,则可以突破局部最优解,得到全局最优解。
既然这个随机这么重要,那么我们就将它写为一个函数:
bool accept(double delta, double temper){if(delta <= 0) return true;return rand() <= exp((-delta) / temper) * RAND_MAX; }
其中delta是新答案的变化量,temper是当前的“温度”。温度是模拟退火算法的一个重要概念,它随时间的推移缓慢减小。我们来分析一下这个代码:
if(delta <= 0) return true;
由于答案越小越优,因此当温度的变化量小于零(新答案减小)时,新解比旧解优,因此返回“接受”
return rand() <= exp((-delta) / temper) * RAND_MAX;
RAND_MAX是rand()的最大值。为了保证跨平台、跨编译器甚至跨版本时的正常运作,我们不对其作出任何假定。
我们把它移项:return (double)rand() / RAND_MAX <= exp((-delta) / temper)。在右边,temper是正数,delta是正数(delta是负数的已经return出去了),因此exp()中间的参数是负数。我们知道,指数函数在参数是负数时返回(0, 1)——这就是接受的概率。我们在左边随机一个实数,如果它比概率小,就接受,否则就不接受。
然后将RAND_MAX移到右边,以省下昂贵的除法成本和避免浮点数的各种陷阱。
有了接受函数,就可以写计算过程了:
double solve(){const double max_temper = 10000;double temp = max_temper;double dec = 0.999;Path p;while(temp > 0.1){Path p2(p);if(accept(p2.dist() - p.dist(), temp)) p = p2;temp *= dec;}return p.dist(); }
其中Path是路径,它有一个构造函数是接受另一个Path类型的对象,然后交换其中两个点的顺序。
1 struct Path{ 2 City path[maxn]; 3 4 Path(){ 5 F(i, n) path[i] = citys[i]; 6 } 7 8 Path(const Path& p):path(p.path){ 9 swap(path[rand() % n], path[rand() % n]); 10 } 11 12 void shuffle(){ 13 random_shuffle(path, path + n); 14 } 15 16 double dist(){ 17 double ans = 0; 18 for(int i = 1; i < n; i++){ 19 ans += path[i - 1].distTo(path[i]); 20 } 21 return ans; 22 } 23 };
上文的City是路径一个点。而void shuffle()是随机打乱整个序列(在本题没有用上)。
下面是City的定义:
1 struct City{ 2 double x, y; 3 City(){} 4 City(double x, double y):x(x), y(y){} 5 double distTo(const City& rhs) const { 6 return hypot(x - rhs.x, y - rhs.y); 7 } 8 friend istream& operator >> (istream& in, City& c){ 9 return in >> c.x >> c.y; 10 } 11 }citys[maxn];
最后是程序的主框架:
1 int main(){ 2 srand(19260817U); 3 ios::sync_with_stdio(false); 4 cin >> n; 5 F(i, n) cin >> citys[i]; 6 double ans = 1./0; 7 int T = 15; 8 while(T--){ 9 ans = min(ans, solve()); 10 } 11 printf("%.2lf", ans); 12 }
完整代码如下:
1 #define F(i, n) for(int i = 0; i < n; i++) 2 #define F1(i,n) for(int i = 1; i <=n; i++) 3 #include<cmath> 4 #include<algorithm> 5 #include<iostream> 6 #include<cstdio> 7 using namespace std; 8 9 const int maxn = 21; 10 int n; 11 struct City{ 12 double x, y; 13 City(){} 14 City(double x, double y):x(x), y(y){} 15 double distTo(const City& rhs) const { 16 return hypot(x - rhs.x, y - rhs.y); 17 } 18 friend istream& operator >> (istream& in, City& c){ 19 return in >> c.x >> c.y; 20 } 21 }citys[maxn]; 22 23 struct Path{ 24 City path[maxn]; 25 26 Path(){ 27 F(i, n) path[i] = citys[i]; 28 } 29 30 Path(const Path& p):path(p.path){ 31 swap(path[rand() % n], path[rand() % n]); 32 } 33 34 void shuffle(){ 35 random_shuffle(path, path + n); 36 } 37 38 double dist(){ 39 double ans = 0; 40 for(int i = 1; i < n; i++){ 41 ans += path[i - 1].distTo(path[i]); 42 } 43 return ans; 44 } 45 }; 46 47 48 49 bool accept(double delta, double temper){ 50 if(delta <= 0) return true; 51 return rand() <= exp((-delta) / temper) * RAND_MAX; 52 } 53 54 double solve(){ 55 const double max_temper = 10000; 56 double temp = max_temper; 57 double dec = 0.999; 58 Path p; 59 while(temp > 0.1){ 60 Path p2(p); 61 if(accept(p2.dist() - p.dist(), temp)) p = p2; 62 temp *= dec; 63 } 64 return p.dist(); 65 } 66 67 int main(){ 68 srand(19260817U); 69 ios::sync_with_stdio(false); 70 cin >> n; 71 F(i, n) cin >> citys[i]; 72 double ans = 1./0; 73 int T = 155; 74 while(T--){ 75 ans = min(ans, solve()); 76 } 77 printf("%.2lf", ans); 78 }
其实本代码在很多地方写复杂了,比如累赘的City类。在比赛中,我们不会写得如此复杂。下面对其简化:
1 #include<cstring> 2 #include<cmath> 3 #include<algorithm> 4 #include<iostream> 5 #include<cstdio> 6 using namespace std; 7 8 const int maxn = 21; 9 int n; 10 double x[maxn], y[maxn]; 11 double dist[maxn][maxn]; 12 13 struct Path{ 14 int path[maxn]; 15 16 Path(){ 17 for(int i = 0; i < n; i++) path[i] = i; 18 } 19 20 Path(const Path& p){ 21 memcpy(path, p.path, sizeof path); 22 swap(path[rand() % n], path[rand() % n]); 23 } 24 25 double dist(){ 26 double ans = 0; 27 for(int i = 1; i < n; i++){ 28 ans += ::dist[path[i - 1]][path[i]]; 29 } 30 return ans; 31 } 32 }; 33 34 35 36 bool accept(double delta, double temper){ 37 if(delta <= 0) return true; 38 return rand() <= exp((-delta) / temper) * RAND_MAX; 39 } 40 41 double solve(){ 42 const double max_temper = 10000; 43 const double dec = 0.999; 44 double temp = max_temper; 45 Path p; 46 while(temp > 0.01){ 47 Path p2(p); 48 if(accept(p2.dist() - p.dist(), temp)) p = p2; 49 temp *= dec; 50 } 51 return p.dist(); 52 } 53 54 int main(){ 55 srand(19260817U); 56 cin >> n; 57 for(int i = 0; i < n; i++) { 58 scanf("%lf%lf", x + i, y + i); 59 } 60 for(int i = 0; i < n; i++){ 61 dist[i][i] = 0; 62 for(int j = i + 1; j < n; j++){ 63 dist[i][j] = dist[j][i] = hypot(x[i] - x[j], y[i] - y[j]); 64 } 65 } 66 double ans = 1./0; 67 int T = 155; 68 while(T--){ 69 ans = min(ans, solve()); 70 } 71 printf("%.2lf", ans); 72 }
交上去就可以AC了。
由于随机化算法有一定不稳定性,这里要多次调用计算过程取最小值。T=155就是外循环次数。
值得注意的是,T=15就可以过80%的数据,T=42可以过完全部数据,此时最大数据运行时间为86ms。这里T取155是保险起见,毕竟时间足够。
上面的代码仍有改进的余地。比如,在solve()函数中,应当把最优解记下来,在返回解时返回记下的那个最优解,免得跳到了某些差解后返回差解。
下面是一张表供大家估算运行时间,左边是“降温系数”,上方是初温与末温的比值,表格内容是大致的迭代次数。
从上表可以看出,增加十倍的初温与末温比值只会增加约25%的迭代次数,而往0.9…99的后面加个9会增加十倍的运行时间。
除了记忆上表外,我们还可以通过记录退火次数(将tot初始化为零,每次产生新解时tot++,计算完后看看tot)或者使用计算器计算退火次数。计算后选择一个合适的外循环次数。
除此之外,我们还要根据数据规模,灵活地调整初温、末温与降温系数。一般来说,初温不宜太大,否则会让前几次迭代接受了很差的解,浪费时间;降温系数不宜过大,否则会让算法过早稳定,不能找到最优值;同样,降温系数也不宜太高(更不能大于1,不然温度越来越高),否则可能会超时。
在正式使用中还有些技巧,如每次降温后,做足够多次计算后才再次降温(内循环),这对算法准确性没有太大影响。
除了模拟退火外,还有不少随机化算法。比如遗传算法、蚁群算法,这些算法被称为“元启发算法”,有兴趣的读者可以查阅相关资料。
转载于:https://www.cnblogs.com/CsOH/p/6049117.html
手把手教会你模拟退火算法相关推荐
- 手把手教会你KMP算法
文章目录 一.什么是KMP算法 二.KMP算法的运行原理 1.主串不回退 子串回退到特定位置 三.next()数组的实现 1.next()数组的原理 2.#代码实现(C语言) 四.主程序实现(c语言) ...
- 2018-4-8模拟退火算法
阅读资料来源: <智能优化算法以及matlab实现>第七章 [图文]智能优化算法_数学建模_王成章_模拟退火法_2011_百度文库 https://wenku.baidu.com/view ...
- HDU2899(二分查找+or+模拟退火算法)
这道题其实是利用函数求导,判断求导后的函数是否大于零或者小于零,等于零情况,从而判断原函数的单调性,代入X求出函数的最小值. 模拟退火算法: 方法一:二分 #include<stdio.h> ...
- 【算法】模拟退火算法解决TSP问题的matlab实现
[算法]模拟退火算法解决TSP问题的matlab实现 参考文章: (1)[算法]模拟退火算法解决TSP问题的matlab实现 (2)https://www.cnblogs.com/wenyehoush ...
- 机器学习(MACHINE LEARNING)MATLAB模拟退火算法【SA】
文章目录 1 什么是智能优化算法 2 常用的智能优化算法 3 智能优化算法的特点 4 模拟退火算法 4.1 简介 4.1 工具箱(SA) 1 什么是智能优化算法 智能优化算法又称现代启发式算法,是一种 ...
- 大白话解析模拟退火算法
一. 爬山算法 ( Hill Climbing ) 介绍模拟退火前,先介绍爬山算法.爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解. ...
- 模拟退火算法解决TSP(python实现 110+行代码)【gif生成】
简述 代码我是基于我之前写的两篇,一篇是遗传算法TSP的Python实现,一篇是模拟退火算法的解决TSP的C++实现. 模拟退火算法理论+Python解决函数极值+C++实现解决TSP问题 遗传算法解 ...
- 模拟退火算法理论+Python解决函数极值+C++实现解决TSP问题
简述 算法设计课这周的作业: 赶紧写了先,不然搞不完了. 文章目录 简述 算法理论部分 变量简单分析 从状态转移概率到状态概率 推导 理解当温度收敛到接近0的时候,收敛到结果 理论部分的后记 pyth ...
- 模拟退火算法SA参数设置实验记录
模拟退火算法有4个参数 N:每个温度迭代次数 T:重复降温次数 a:降温系数 t0:初始温度 本文用一个50个城市的TSP问题数据集,用交叉对比的方法调参.一组参数运行200次取平均. 首先调初始温度 ...
最新文章
- 活动报名 | MSRA卢帅:自动化代码审查过程的研究
- C++回声服务器_3-UDP版本
- 51nod1228 序列求和(伯努利数)
- 三维数据平滑处理_你该如何正确的处理思看科技三维扫描仪得到的数据?
- Spring boot+Spring Security 4配置整合实例
- JAVA流程控制详解
- python分析nginx日志的ip(中篇一)
- LABLEME UPDATE DAMOD
- 民国大学教授收入有多高?
- asterisk概述和代码分析
- 学习计划Current(2019.4.23)
- win10桌面搜索不能用的问题
- centos 阿帕奇无法解析php_PHP之校园连接企业之路-2
- android dpi 修改,DPI修改
- 如何在 R 中计算二项式置信区间
- Eclipse-WTP什么意思?
- ubuntu 配置nginx
- Disk Manager — 可视化的硬盘分区对象
- 层次电路原理图的设计
- 计算机网络 第7版 谢希仁 学习通 作业总结
热门文章
- 覆盖分类的方法_智能垃圾分类箱上线,居民垃圾分类投放可领礼品
- CUDA C编程权威指南 第五章 共享内存和常量内存
- 图解TCPIP-MIME
- Pandas Period
- sob攻略超详细攻略_2020成都超详细旅游,美食攻略
- python实时数据存储与显示_利用python进行数据加载和存储
- 云服务器 ECS > 块存储 > 加密云盘 > 加密概述
- c++用什么软件_html用什么软件编写
- 50道编程小题目之【企业利润提成】
- delphi 登录界面 主窗体 切换_.NET CORE(C#) WPF 方便的实现用户控件切换(祝大家新年快乐)