动态规划(dynamic programming,dp)入门详解(一)
今天我们开始学习算法中非常重要的一项,动态规划。首先我们先来看下动态规划是什么。
什么的动态规划
动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。动态规划一般可分为线性动规,区域动规,树形动规,背包动规四类。
举例:
线性动规:拦截导弹,合唱队形,挖地雷,建学校,剑客决斗等;
区域动规:石子合并, 加分二叉树,统计单词个数,炮兵布阵等;
树形动规:贪吃的九头龙,二分查找树,聚会的欢乐,数字三角形等;
背包问题:01背包问题,完全背包问题,分组背包问题,二维背包,装箱问题,挤牛奶(同济ACM第1132题)等;
应用实例:
最短路径问题 ,项目管理,网络流优化等;
该解释来自于百度百科
百度百科主要给出了dynamic programming的一个大致的介绍,和丰富的应用,但是对它的实质讲的很模糊,下面我们来详细看下,dp算法到底是什么:
首先,动态规划算法与分治法类似,它的基本思路是将待求解问题分解成若干子问题,先求解子问题,再结合这些子问题的解得到原问题的解。与分治法不同的是,适用于动态规划求解的子问题数目太多,以致最后解决原问题需要耗费指数级时间。然而,不同子问题的数目常常只有多项式量级。在用分治算法求解时,有些子问题被重复计算多次。如果能保存已解的子问题的答案,则可以避免重复的计算。为了达到这个目的,可以用一个表来记录已解决的子问题的答案。不管该子问题以后是否会用到,只要计算过,就将其结果填入表中,后面如果要用,就直接取出它的值,这就是动态规划的基本思想。
简而言之,就是在求解一个问题的时候,先求解它的若干的子问题,在求解它的子问题的时候,先求解它的子问题的子问题…………,同时,我们在求解子问题的时候,将子问题的结果记录下来,来减少重复的计算。
动态规划的解题步骤
动态规划算法通常可以按下面的顺序进行解题:
动态规划算法使用示例(1)
下面我们通过例子来讲解一下动态规划算法的使用。
首先,我们以大家熟悉的fibonacci数列来进行演示。
fibonacci数列的定义大家都很熟悉,第一项,第二项为1,后面的每一项为前两项之和。
递归定义为:fibonacci(n) = fibonacci(n-1) + fobonacci(n-2) (n>2)
fibonacci(n) =1 (n<=2)
看着fibonacci数列的定义,我们很容易的写出递归方式的求解第n项的值:
#include <iostream>using namespace std;
int fibonacci(int n){
if(n <= 2)
return 1;
else
return fibonacci(n-1) + fibonacci(n-2);
}
int main(){
int n;
cin>>n;
cout<<fibonacci(n);
return 0;
}
如果使用递归的方法进行求解的话,他会进行很多重复的计算,例如我们计算fibonacci(5)的时候,他会计算fibonacci(4)和fibonacci(3) ,当我们计算fibonacci(4)的时候,会计算fibonacci(3) 和 fibonacci(2) 。这样我们就重复计算机了fibonacci(3),数据量小的时候可能还没什么问题,当数据量大的时候,会额外占用非常大的时间和空间,这肯定是不行的。
下面我们来思考,我们要计算fibonacci(n)(n>2)的话,我们要计算fibonacci(n-1)和fibonacci(n-2) 因此,我们只要知道了fibonacci(n-1)和fibonacci(n-2),就可以得出fibonacci(n)的值。因此,他的状态转移方程为:
fibonacci(n) = fibonacci(n-1) + fibonacci(n-2) (n>2)
我们可以记录每个计算过的值,后面使用到它时,直接取出它的值,来减少重复的计算。
using namespace std;
int fib[10000005]={0};
int fibonacci(int n){
fib[n] = fib[n-1] + fib[n-2];
}
int main(){
int n;
cin>>n;
if (n <= 2){
cout<<"1";
return 0;
}
fib[1] = 1;
fib[2] = 1;
for(int i = 3;i <= n; i++){
fibonacci(i);
}
cout<<fib[n];
return 0;
}
然后我们在看一下他们的时间效率。
我们分别运行上面两端程序,将n设为50.
我们运行第一个递归写法的时候,运行时间为:45279.2ms
我们运行第一个动态规划写法的时候,运行时间为:0.026ms
当求第50项时,递归算法的所使用的的时间是动态规划算法所用时间的1741507.69倍,我们摸个零,1700万倍。这是个极其夸张,恐怖的数字,这也是dp的魅力所在。
我本来是打算跑100万项的,结果递归写法跑了10几分钟出不来结果,动规写法跑了4.808ms。
后面算了下,递归写法是O(N!)的时间效率,如果跑100万项的话,我这个电脑,怕是得跑上一天都不一定跑完,这时候就是几十亿倍的时间差了。
动态规划算法使用示例(2)
下面我们在通过一个OJ题目来看下蓝桥杯的求解过程。这是一题蓝桥杯的题目,2017年第九届蓝桥杯的第四题。
题目为:
标题:测试次数
x星球的居民脾气不太好,但好在他们生气的时候唯一的异常举动是:摔手机。
各大厂商也就纷纷推出各种耐摔型手机。x星球的质监局规定了手机必须经过耐摔测试,并且评定出一个耐摔指数来,之后才允许上市流通。
x星球有很多高耸入云的高塔,刚好可以用来做耐摔测试。塔的每一层高度都是一样的,与地球上稍有不同的是,他们的第一层不是地面,而是相当于我们的2楼。
如果手机从第7层扔下去没摔坏,但第8层摔坏了,则手机耐摔指数=7。
特别地,如果手机从第1层扔下去就坏了,则耐摔指数=0。
如果到了塔的最高层第n层扔没摔坏,则耐摔指数=n
为了减少测试次数,从每个厂家抽样3部手机参加测试。
某次测试的塔高为1000层,如果我们总是采用最佳策略,在最坏的运气下最多需要测试多少次才能确定手机的耐摔指数呢?
首先我们拿到这题的时候,要先分析题目的内容,因为手机数量是有限的,所以我们不能直接使用二分法,因为当手机没了之后,我们就没法进行下面的测试,无法得出最后的耐摔指数,下面我们来分析如何来求得最坏情况下的最少测试次数。
我们设当前有phone_num个手机,level_num层,我们使用test ( phone_num, level_num )来表示最坏情况下的最少测试次数
当我们有一个手机的时候,不论有多少层,我们只能从第一层开始一层一层的摔,因为如果隔层或者不从第一层开始,他一旦摔碎了就没有手机进行下面的测试了,就无法得出结果了。
当我们有phone_num(phone_num > 1)的时候,我们就可以不从第一层开始一层层的摔了,我们第一次可以摔第 i 层,这个时候我们又有两种情况,就是摔碎了和没摔碎:
第一种情况,没摔碎。那我们这种情况下,我们需要测试的楼层就减少了 i 层,手机的数量不变, 即为 1 + test ( phone_num, level_num - i ),别忘了前面加上这次摔的次数1.
第二种情况,摔碎了。那我们这种情况下,我们需要测试的楼层就是 i - 1 层,手机数列减1,即为 1 + test ( phone_num - 1, i - 1)
这时候我们就可以总结出dp算法中最关键的一步,状态转移方程。
test ( phone_num, level_num ) = min( ( 1 + test ( phone_num, level_num - 1) ), max ( (1 + test( phone_num, level_num - i ) ), ( 1 + test( phone_num -1, i -1 ) ) )
这样写可能不太好看,我们再简化一下这个式子:把 1 提出来。
test ( phone_num, level_num ) = min( test( phone_num, level_num -1 ), max( test(phone_num, level_num - i), test ( phone_num - 1, i -1 ) ) ) + 1
#include <iostream>using namespace std;
int dp[10005][11]={0};
int main(){
int phone_num, level_num;
cin>>level_num>>phone_num;
// level_num = 1000;
// phone_num = 3;
for(int i = 1; i <= level_num; i++)
dp[i][1] = i;
for(int i = 2; i <= phone_num; i++){
for(int j = 1; j <= level_num; j++){
dp[j][i] = 1 + dp[j-1][i];//先赋值一个可能的最大值,即从上一层的次数 +1
for(int k = 2;k < j ;k++){//第一次摔一层的,上面已经赋值了,所以我们从第一次摔第二层开始
dp[j][i] = min(dp[j][i], 1 + max(dp[j - k][i],dp[k - 1][i -1]) );
}
}
}
cout<<dp[level_num][phone_num];
return 0;
}