当前位置 : 主页 > 编程语言 > c语言 >

C语言实现运筹学中的马氏决策算法实例

来源:互联网 收集:自由互联 发布时间:2021-06-05
本文实例讲述了C语言实现运筹学中的马氏决策算法。分享给大家供大家参考,具体如下: 一、概述 马氏决策(Markov decision)是马尔可夫决策过程(Markov Decision Processes,简记为MDP)的简称,

本文实例讲述了C语言实现运筹学中的马氏决策算法。分享给大家供大家参考,具体如下:

一、概述

马氏决策(Markov decision)是马尔可夫决策过程(Markov Decision Processes,简记为MDP)的简称,是研究随机序贯决策问题的一门重要理论。马氏决策是一类可连续进行观察的随机动态系统的最优化决策,它将(确定性)动态规划与马尔可夫过程相结合,是随机离散事件动态系统惟一的动态控制方法。

关于马氏决策的具体说明可参考百度百科:https://baike.baidu.com/item/%E9%A9%AC%E6%B0%8F%E5%86%B3%E7%AD%96

二、实现代码

#include<stdio.h>
#include<cstdlib>
#define N 100 
float p[N][N],s[N][N],a[N],b[N];
int o;
void set_TPM()  //输入转移概率矩阵(Transition Probability Matrix) 
{  int i,j;
 printf("Please input Number of State:");
 scanf("%d",&o);
 for(i=0;i<o;i++)
 for(j=0;j<o;j++)
 {
  printf("Please input state%d,state%d:",i,j);
  scanf("%f",&p[i][j]);
  rewind(stdin);
 }
}
void set_Initial_Prob() //输入初始概率状态(Initial Probability)
{
 int i;
 for(i=0;i<o;i++)
 {
 printf("Please input state%d Initial Prob:",i);
 scanf("%f",&a[i]);
 rewind(stdin);
 }
}
void run_Markov(int count) //Markov主算法
{
 int i,j,k;
 float c[N];
 for(i=0;i<o;i++) c[i]=a[i];
 for(k=0;k<count;k++)
 {
 for(i=0;i<o;i++)
  for(j=0;j<o;j++)
  {
  s[i][j]=p[i][j]*c[i]; 
  }
 for(i=0;i<o;i++)
 { 
  b[i]=0;
  for(j=0;j<o;j++)
  {
  b[i]=b[i]+s[j][i];  
  }
  c[i]=b[i]; 
 }
 }
 for(i=0;i<o;i++) c[i]=0;
}
void print_Result() //输出周期结果
{
 int i,j;
 for(i=0;i<o;i++)
 for(j=0;j<o;j++)
 {
  printf(" %f",s[i][j]);
  if(j==2) printf("/n");
 }
 for(i=0;i<o;i++)
 {
  printf(" %f",b[i]);
 }
 printf("/n");
}
main() //主函数
{
 int a,count,i,j;
 for(count=0;;)
 {
 printf("Create New Project:/n");
 set_TPM();
 set_Initial_Prob();
 for(;;)
 {
  printf("***********************************/n"); //展示选择菜单
  printf("1.Times periods from initial./n");
  printf("2.Next Period./n");
  printf("3.Create New Porject./n");
  printf("4.Exit./n/n");
  printf("**********************************/n");
  printf("Please input your choose:/n");
  scanf("%d",&a);
  rewind(stdin);
  if(a==3) break;
  switch(a)
  {
  case 1: 
  printf("Input number of time periods from initial:/n");
  scanf("%d",&count);
  rewind(stdin);
  run_Markov(count);
  print_Result();
  break;
  case 2: 
  run_Markov(count++);
  print_Result();
  break;
  case 4: exit(1);
  default: printf("Error choose!!/n");break;
  }
 }
 }
 system("pause");
}

希望本文所述对大家C语言程序设计有所帮助。

网友评论