一、数据结构和算法
数据结构:数据结构是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。 算法:算法就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说,算法就是一系列的计算步骤,用来将输入数据转换成输出结果。
二、算法的复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。==归结为可以利用时间复杂度和空间复杂度来衡量算法的好坏。== 时间复杂度(时间效率)主要衡量一个算法的运行快慢,而空间复杂度(空间效率)主要衡量一个算法运行所需要的额外空间。在计算机发展早期,计算机存储空间小,所以对空间复杂度在乎,现在,计算机的存储容量已经达到很高的程度,所以现在不需要对空间复杂度特别关注。
1.大O的渐进表示法
大O符号:是用于描述函数渐进行为的数学符号。
实际中,我们计算时间复杂度时 并不一定要计算准确的执行次数,而只需要大概执行次数,那么我们可以用大O的渐进表示法来表示时间复杂度。同样的,我们也用大O的渐进表示法来表示空间复杂度。 大O的渐进表示法是一个估算,算出的是大概次数所属量级。
推导大O阶方法: 1.用常数1取代运行时间中的所有加法常数。 2.在修改后的运行次数函数中,只保留最高阶项。 3.如果最高阶项存在且不是1,则去除与这个项目相乘的常数。 根据以上三点推导得到的结果就是大O阶。
2.时间复杂度
时间复杂度算的并不是时间,因为算法运行的时间和环境(电脑硬件和系统好坏)有直接关系。 ==时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数(函数是指数学中带未知数的函数),它定量描述了该算法的运行时间。== 一个算法所花费的时间与其中语句的执行次数成正比例,==算法中的基本操作的执行次数,为算法的时间复杂度==。即找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
// 请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
int count = 0;
for (int i = 0; i < N ; ++ i)
{
for (int j = 0; j < N ; ++ j)
{
++count;
}
}
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
用一个函数表达式来表示(N表示执行次数):F(N)=N* N+2*N+10。使用大O的渐进表示法表示为O(N^2^)。
通过上面这张图对比我们可以发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。
3.时间复杂度练习
练习1:
// 计算Func2的时间复杂度?
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
解析:时间复杂度为O(N)。用函数表达式来表示(N表示执行次数):F(N)=2* N+10。用大O的渐进表示法需要去掉加法常数,2*N+10是属于N这个量级的,N的系数无论多大都要改为1,因为当N无限大时,系数对结果影响不大,所以时间复杂度为O(N)。
练习2:
// 计算Func3的时间复杂度?
void Func3(int N, int M)
{
int count = 0;
for (int k = 0; k < M; ++ k)
{
++count;
}
for (int k = 0; k < N ; ++ k)
{
++count;
}
printf("%d\n", count);
}
解析:时间复杂度为O(N+M)。具体运行次数为F(N)=N+M;用大O的渐进表示法估算之后时间复杂度为O(N+M),因为N和M都是属于同一个量级的,所以M不能省略。
练习3:
// 计算Func4的时间复杂度?
void Func4(int N)
{
int count = 0;
for (int k = 0; k < 100; ++ k)
{
++count;
}
printf("%d\n", count);
}
解析:时间复杂度为O(1)。具体运行次数为100次,是常数级,根据大O的渐进表示法时间复杂度为O(1)。
练习4:
// 计算strchr的时间复杂度?
const char * strchr ( const char * str, int character );
解析:时间复杂度为O(N)。
strchr
函数作用为在一个串中查找给定字符的第一个匹配之处,并且返回一个指向该字符串中第一次出现的字符的指针,如果字符串中不包含该字符就返回NULL
指针。 主要实现过程为:
while(*str++)
{
if(*str==character)
return str;
}
return NULL;
在这种情况下时间复杂度就要区分为最好情况和最坏情况以及平均情况。假设字符串中共有n个字符,最好情况是第一次就找到,时间复杂度为O(1);最坏情况是在最后一次才找到或者没有找到,时间复杂度是O(N);平均情况下整体来看时间复杂度为O(N/2)。==但是在实际中,一般情况下关注的是最坏运行情况==。所以数组中搜索数据时间复杂度为O(N)。
练习5:
// 计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
解析:时间复杂度为O(N^2^)。本题是冒泡排序,不能看到是两层循环时间复杂度就是O(N^2^),我们要根据其算法的思想去思考时间复杂度,不能仅仅依靠代码。冒泡排序思想是,第一趟比较n-1次,第二趟比较n-2次,……最后一趟比较1次,比较次数构成等差数列,求和得到最后的执行次数是F(N)=(N-1)*N/2;用大O阶表示法时间复杂度就是O(N^2^)。
练习6:
// 计算BinarySearch的时间复杂度?
int BinarySearch(int* a, int n, int x)
{
assert(a);
int begin = 0;
int end = n-1;
// [begin, end]:begin和end是左闭右闭区间,因此有=号
while (begin <= end)
{
int mid = begin + ((end-begin)>>1);
if (a[mid] < x)
begin = mid+1;
else if (a[mid] > x)
end = mid-1;
else
return mid;
}
return -1;
}
时间复杂度是O(logN)。根据二分查找的思想去算时间复杂度;最好情况是第一次查找就找到了,时间复杂度是O(1);最坏情况是查找到最后一个单独的数时才找到或者查找结束也没有找到要找的数,假设一共有N个数,每次查找,查找区间缩小一半,即查找多少次,除2多少次,查找到最后一个值时,查找结束。 下图中,绿色表示最后一个值,查找N次后,查找到最后一个值,N/2/2/2/……/2=1;假设查找x次,即2^x^=N;x等于以2为底N的对数,如下图:
因为以2为底的对数在计算机中不容易表示出来,所以我们允许将其写为logN,可以省略底数,有些地方还会写为lgN;但是不是以2为底的对数不能省略底数。
练习7:
long long Fac(size_t N)
{
if(0 == N)
return 1;
return Fac(N-1)*N;
}
解析:时间复杂度是O(N),每次递归里面有两个语句,一个
if
语句和一个return
语句,递归一共调用N次,可以认为执行次数为2N,时间复杂度用大O的渐进表示法就是O(N)。
练习8:
long long Fac(size_t N)
{
if(0 == N)
return 1;
for(size_t i=0;i<N;i++)
{
//……
}
return Fac(N-1)*N;
}
解析:时间复杂度是O(N^2^)。每次调用时函数中都有循环语句,第一次调用执行N次,第二次调用执行N-1次,第三次调用执行N-2次……最后一次调用执行1次,因为是用大O的渐进表示法,是估算,所以可以看成每次调用只执行了循环语句,执行次数相加之后得到大致执行次数,利用大O的渐进表示法可以认为时间复杂度是O(N^2^)。
我们可以认为递归时间复杂度的计算就是将每次递归调用的执行次数累加
。
练习9:
long long Fib(size_t N)
{
if(N < 3)
return 1;
return Fib(N-1) + Fib(N-2);
}
解析:时间复杂度是O(2^N^)。每次递归和每次递归所执行的次数我们可以用下面的图来表示: </br>
假设最后一层算到2,从2~N一共是N-1层,所以最后一层的执行次数是2^(N-2)^,因为函数中每次执行的次数为常数次,所以每次调用我们可以认为函数中只执行了一次,因此每次递归执行的次数如上图所示。执行次数构成一个等比数列,求和之后根据大O的渐进表示法可以知道时间复杂度是O(2^N^)。
4.空间复杂度介绍及练习
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。空间复杂度不是程序占用了多少byte的空间,因为这个也没太大意义,所以==空间复杂度算的是变量的个数==。空间复杂度计算规则基本跟时间复杂度类似,也使用大O的渐进表示法。 注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。 函数的空间复杂度一般情况下是O(1)和O(N)。
练习1:
void Func1(int N)
{
int count = 0;
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
printf("%d\n", count);
}
解析:空间复杂度是O(1)。函数中只定义了两个变量
count
和k
,根据大O阶推导法可知空间复杂度是O(1)。
练习2:
// 计算BubbleSort的空间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
解析:空间复杂度是O(1)。在函数中,计算空间复杂度时参数通常不被计算,重复创建的变量也只算一个。所以在这个例子中只开辟了三个变量
end
、exchange
和i
,根据大O阶表示法可以知道空间复杂度是O(1)。
练习3:
// 计算Fibonacci的空间复杂度
// 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
if(n==0)
return NULL;
long long * fibArray = (long long *)malloc((n+1) * sizeof(long long));
fibArray[0] = 0;
fibArray[1] = 1;
for (int i = 2; i <= n ; ++i)
{
fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
}
return fibArray;
}
解析:空间复杂度是O(N)。在函数中数组动态开辟了n+1个
long long
类型的空间大小用来存储数据,算上i
和fibArray
,一共开辟了n+3个变量,所以空间复杂度是O(N)。
练习4:
// 计算阶乘递归Fac的空间复杂度?
long long Fac(size_t N)
{
if(N == 0)
return 1;
return Fac(N-1)*N;
}
解析:空间复杂度是O(N)。每次函数中虽然没有定义变量,但是每次创建栈帧也有空间的消耗,递归调用要考虑参数,因为要传参,递归是一种特殊状态,普通调用不用看参数。每次递归创建一个栈帧,一共递归N次,创建N个栈帧,每个栈帧中都要定义常数个变量,每个栈帧里的变量累加到一起之后再根据大O阶推导可以得出空间复杂度是O(N)。
练习5:
long long Fib(size_t N)
{
if(N < 3)
return 1;
return Fib(N-1) + Fib(N-2);
}
【本文转自:美国cn2站群服务器 http://www.558idc.com/mggfzq.htm提供,感谢支持】解析:空间复杂度是O(N)。时间是累计的,空间是可以重复利用的,函数调用时重复利用同一块空间。 </br> 如上图所示,先创建Fib(N)的函数栈帧,再依次创建Fib(N-1)的栈帧,当创建到Fib(2)的时候,执行完之后函数栈帧销毁,再创建Fib(1)的函数栈帧,计算完成之后销毁……,当左边的Fib(N-1)计算完成,它的函数栈帧销毁,创建右边的Fib(N-2)的函数栈帧,他们用的是同一块空间。总体来说,函数栈帧个数创建最多的时候是N个,所以空间复杂度是O(N)。