特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

现代精算风险理论11：信度理论(1)

来源：互联网收集：自由互联发布时间：2022-05-30

本文主要介绍了信度理论的第一部分内容，主要包括信度理论的背景，贝叶斯方法的理论知识，以及有限波动信度的估计方法。目录第十一讲信度理论(1) 第一节基础知识一、信度理

本文主要介绍了信度理论的第一部分内容，主要包括信度理论的背景，贝叶斯方法的理论知识，以及有限波动信度的估计方法。

第十一讲信度理论(1)
- 第一节基础知识
  - 一、信度理论的背景
  - 二、贝叶斯方法回顾
  - 三、贝叶斯方法例题
- 第二节有限波动信度
  - 一、完全信度的判别准则
  - 二、完全信度
  - 三、部分信度

第十一讲信度理论(1) 第一节基础知识一、信度理论的背景

在保险实务中，我们往往需要对一组保险合同来确定一个保费。当从一组保险合同中获得的数据不充分，因而无法提供风险费率的可靠估计时，就需要用到信度理论的方法。

信度理论在非寿险精算理论与实务中具有重要地位。非寿险合同是补偿性合同，非寿险的损失与每个赔案的具体情况以及相应的法规情况密切相关，因而损失经验需要经常修正以适应不断变化的外部环境。非寿险精算师在厘定费率时，既要依据过去的经验，即先验信息，也要根据风险情况的新变化加以调整。这是由非寿险经营的连续性所决定的。

非寿险保费的估算可以根据两类数据：

一类是通过观察得到的本险种一组保单的近期损失数据。这类数据确定的保费称为经验保费，记为 \(PM_\varepsilon\) 。
另一类是同险种保单早期损失数据或类似险种保单的同期损失数据，它是根据人们的主观选择得到的数据，所以称为先验信息数据。这类数据确定的保费称为先验信息保费，记为 \(PM_0\) 。

由这两类数据加权构成信度保费

\[P=zPM_\varepsilon+(1-z)PM_0, \]

其中 \(z\) 为信度因子，表示实际损失数据的可信程度。

当 \(z\) 的值接近 \(1\) 时，表明实际损失数据提供的信息相当充分，据此足以获得正确的保费
当 \(z\) 的值接近 \(0\) 时，则只能基于先验信息估计，得到先验保费的估计值。
当 \(z=1\) 时，称为完全信度。此时，只需根据实际损失数据，利用区间估计的方法计算保险费。
当 \(0<z < 1\) 时，称为部分信度。在此种情况下，就需要研究如何合理确定 \(z\) 值。

信度理论有两种基本方法：

有限波动信度，旨在控制数据中随机波动对估计的影响。
最大精度信度，试图使估计误差尽可能的小。在最大精度信度方法中发展最完善的方法是最小平方信度，它力图使估计误差平方的期望值最小。

某一公司去年每个工人平均工伤损失为 \(230\) 元。假设类似的公司每个工人工伤纯保费为 \(292\) 元，信度因子为 \(0.46\) ，这个公司工人工伤保险纯保费为

\[P=0.46\times230+(1-0.46)\times292=263.88. \]

二、贝叶斯方法回顾

(1) 基本概念和设定

设 \(X\) 是一随机损失，其分布依赖于某一参数 \(\theta\) ，其中 \(\theta\) 是某一随机变量 \(\Theta\) 的某一实现。将 \(\Theta\) 的分布称为先验分布，其密度函数为 \(f_\Theta(\theta\mid \gamma)\) ，\(\gamma\) 为参数。

在给定参数 \(\theta\) 的条件下，\(X\) 的密度为 \(f_{X\mid \Theta}(x\mid \theta)\) ，假设 \(\mathbf{X}=(X_1,X_2,\cdots,X_n)\) 为总体 \(X\) 的一个样本，在给定 \(\Theta\) 的条件下相互独立。

对于某一观测值 \(\mathbf{x}=(x_1,x_2,\cdots,x_n)\) ，样本 \(\mathbf{X}\) 的条件密度为

\[f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)=\prod_{i=1}^nf_{X\mid \Theta}(x_i\mid \theta), \]

其中 \(f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)\) 即为似然函数。

在给定样本观测值 \(\mathbf x\) 的条件下，随机参数 \(\Theta\) 的分布称为后验分布，记为 \(f_{\Theta\mid \mathbf{X}}(\theta\mid \mathbf{x})\) 。利用 \(\Theta\) 的后验分布，计算随机损失均值的估计，这样的估计称为贝叶斯估计，即为下一期的损失的估计。

(2) 后验分布的计算方法

如果给定 \(\Theta\) 的分布 \(f_\Theta(\theta)\) 和给定 \(\Theta\) 的条件下 \(\mathbf{X}\) 的分布 \(f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)\) ，则 \(\Theta\) 和 \(\mathbf{X}\) 的联合分布为

\[f_{\Theta,\mathbf{X}}(\theta,\mathbf{x})=f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)f_\Theta(\theta). \]

设 \(\Omega_\Theta=\{\theta:f_\Theta(\theta)>0\}\) 为 \(\Theta\) 的支撑，则 \(\mathbf{X}\) 的边际分布为

\[f_{ \mathbf{X} }(\mathbf{x})=\int_{\Omega_\Theta}f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)f_\Theta(\theta){\rm d}\theta. \]

在给定数据 \(\mathbf{X}\) 的条件下 \(\Theta\) 的分布

\[f_{\Theta\mid \mathbf{X}}(\theta\mid \mathbf{x})=\frac{f_{\Theta,\mathbf{X}}(\theta,\mathbf{x})}{f_{ \mathbf{X} }(\mathbf{x})}=\frac{f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)f_\Theta(\theta)}{\int_{\Omega_\Theta}f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)f_\Theta(\theta){\rm d}\theta} \]

即为 \(\Theta\) 的后验分布。

(3) 根据损失函数计算贝叶斯估计

这里只介绍均值的估计，即在给定 \(\mathbf{X}=\mathbf{x}\) 的条件下，计算 \(\mu_X(\Theta)=\mathbb{E}[X\mid \Theta]\) 的贝叶斯估计。

假设 \(L(\mu_X(\Theta),w(\mathbf{x}))\) 为损失函数，\(w(\mathbf{x})\) 为相应于该损失函数 \(\mu_X(\Theta)\) 的一个估计。

记贝叶斯估计为 \(w^*(\mathbf{x})\) ，则 \(w^*(\mathbf{x})\) 应满足

\[w^*(\mathbf{x})=\underset{w(\cdot)}{\arg\min}\ \mathbb{E}\left[L(\mu_X(\Theta),w(\mathbf{x}))\mid \mathbf{x}\right]. \]

常用的损失函数有

平方损失函数：

\[L(\mu_X(\Theta),w(\mathbf{x}))=\left[\mu_X(\Theta)-w(\mathbf{x})\right]^2. \]
此时 \(\mu_X(\Theta)\) 的贝叶斯估计为后验分布的均值。
绝对值损失函数：

\[L(\mu_X(\Theta),w(\mathbf{x}))=\left|\mu_X(\Theta)-w(\mathbf{x})\right|. \]
此时 \(\mu_X(\Theta)\) 的贝叶斯估计为后验分布的中位数。
\(0\text{-}1\) 损失函数：

\[L(\mu_X(\Theta),w(\mathbf{x}))=\mathbf{1}_{\{\mu_X(\Theta)-w(\mathbf{x})\}}. \]
此时 \(\mu_X(\Theta)\) 的贝叶斯估计为后验分布的众数。

(4) 根据损失函数计算贝叶斯预测

在给定 \(\mathbf{X}=\mathbf{x}\) 的条件下，\(X_{n+1}\) 的密度函数为

\[\begin{aligned} f_{X_{n+1}\mid\mathbf{X}}(x_{n+1}\mid\mathbf{x})&=\frac{f_{X_{n+1},\mathbf{X}}(x_{n+1},\mathbf{x})}{f_{\mathbf{X}}(\mathbf{x})} \\ \\ &=\frac{\int_{\theta\in\Omega_{\Theta}}f_{X_{n+1},\mathbf{X}\mid\Theta}(x_{n+1},\mathbf{x}\mid \theta)f_{\Theta}(\theta){\rm d}\theta}{f_{\mathbf{X}}(\mathbf{x})} \\ \\ &=\frac{\int_{\theta\in\Omega_{\Theta}}\left[\prod_{i=1}^{n+1}f_{X_i|\Theta}(x_i|\theta)\right]f_{\Theta}(\theta){\rm d}\theta}{f_{\mathbf{X}}(\mathbf{x})}. \end{aligned} \]

在给定 \(\mathbf{X}=\mathbf{x}\) 的条件下，\(\Theta\) 的后验分布为

\[f_{\Theta\mid\mathbf{X}}(\theta\mid\mathbf{x})=\frac{f_{\mathbf{X},\Theta}(\mathbf{x},\theta)}{f_{\mathbf{X}}(\mathbf{x})}=\frac{\prod_{i=1}^{n}f_{X_i|\Theta}(x_i|\theta)f_{\Theta}(\theta)}{f_{\mathbf{X}}(\mathbf{x})}. \\ \\ \Downarrow \\ \\ \prod_{i=1}^{n}f_{X_i|\Theta}(x_i|\theta)f_{\Theta}(\theta)=f_{\Theta\mid\mathbf{X}}(\theta\mid\mathbf{x})f_{\mathbf{X}}(\mathbf{x}). \]

\(X_{n+1}\) 的密度函数为

\[f_{X_{n+1}\mid\mathbf{X}}(x_{n+1}\mid\mathbf{x})=\int_{\theta\in\Omega_{\Theta}}f_{X_{n+1}\mid\Theta}(x_{n+1}\mid\theta)f_{\Theta\mid\mathbf{X}}(\theta\mid\mathbf{x}){\rm d}\theta. \]

\(X_{n+1}\) 的预测值可以采用给定 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(X_{n+1}\) 的条件期望来描述，即

\[\mathbb{E}\left[X_{n+1}\mid\mathbf{X}=\mathbf{x}\right]=\int_0^\infty x_{n+1}f_{X_{n+1}\mid\mathbf{X}}(x_{n+1}\mid \mathbf{x}){\rm d}x_{n+1}=\mathbb{E}\left[\mu_X(\Theta)\mid\mathbf{x}\right]. \]

三、贝叶斯方法例题

首先给出一个两点分布-贝塔分布的例题。

假设总体 \(X\) 服从两点分布 \(X\sim B(1,\theta)\) ，参数 \(\theta\) 为随机变量 \(\Theta\) 的取值，其分布为 \(\Theta\sim {\rm Be}(\alpha,\beta)\) 。又设 \(\mathbf{X}=(X_1,X_2,\cdots,X_n)\) 是从总体 \(X\) 中抽取的简单随机样本，设 \(\mathbf{x}=(x_1,x_2,\cdots,x_n)\) 是该样本的一组观测值。

(1) 计算给定样本 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(\Theta\) 的后验分布。

首先计算条件概率密度为

\[f_{\mathbf{X}\mid\Theta}(\mathbf{x}\mid \theta)=\prod_{i=1}^n\theta^{x_i}(1-\theta)^{1-x_i} ,\quad x_i=0,1. \]
参数 \(\Theta\) 的密度函数为

\[f_{\Theta}(\theta)=\frac{\theta^{\alpha-1}(1-\theta)^{\beta-1}}{\Beta(\alpha,\beta)}, \]
计算 \(\mathbf{X}\) 和 \(\Theta\) 的联合分布为

\[f_{\mathbf{X},\Theta}(\theta,\mathbf{x})=f_{\mathbf{X}\mid\Theta}(\mathbf{x}\mid \theta) f_\Theta(\theta)=\frac{\theta^{\alpha+\sum_{i=1}^nx_i-1}(1-\theta)^{\left(\beta-\sum_{i=1}^nx_i+n\right)-1}}{\Beta(\alpha,\beta)}. \]
得出 \(\mathbf{X}\) 的分布为

\[f_{\mathbf{X}}(\mathbf{x})=\frac{1}{\Beta(\alpha,\beta)}\int_0^1 \theta^{\alpha+\sum_{i=1}^nx_i-1}(1-\theta)^{\left(\beta-\sum_{i=1}^nx_i+n\right)-1}{\rm d}\theta=\frac{\Beta(\alpha+n\bar{x},\beta-n\bar{x}+n)}{\Beta(\alpha,\beta)}. \]
计算 \(\Theta\) 的后验分布为

\[f_{\Theta\mid\mathbf{X}}(\theta\mid\mathbf{x})=\frac{f_{\mathbf{X},\Theta}(\theta,\mathbf{x})}{f_{\mathbf{X}}(\mathbf{x})}=\frac{\theta^{\alpha+n\bar{x}-1}(1-\theta)^{\left(\beta-n\bar{x}+n\right)-1}}{\Beta(\alpha+n\bar{x},\beta-n\bar{x}+n)}. \]
该后验分布仍为贝塔分布 \(\Theta\mid\mathbf{X}\sim {\rm Be}(\alpha+n\bar{x},\beta-n\bar{x}+n)\) 。

(2) 计算后验分布的均值。

由之前的讨论可知，后验分布仍为贝塔分布，其参数分别为

\[\alpha^*=\alpha+n\bar{x} ,\quad \beta^*=\beta+n-n\bar{x}, \]
因此，后验分布的均值为

\[\mathbb{E}\left[\Theta\mid\mathbf{x}\right]=\frac{\alpha^*}{\alpha^*+\beta^*}=\frac{\alpha+n\bar{x}}{\alpha+\beta+n}. \]
(3) 计算给定样本 \(\mathbf{X}=\mathbf{x}\) 的条件下，下一期风险损失 \(X_{n+1}\) 的期望值。

由于 \(X\) 服从两点分布 \(B(1,\theta)\) ，所以

\[\mu_X(\Theta)=\mathbb{E}\left[X\mid\Theta\right]=\Theta. \]
给定 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(X_{n+1}\) 的条件期望为

\[\mathbb{E}\left[X_{n+1}\mid\mathbf{X}=\mathbf{x}\right]=\mathbb{E}\left[\mu_X(\Theta)\mid\mathbf{x}\right]=\mathbb{E}\left[\Theta\mid\mathbf{x}\right]=\frac{\alpha+n\bar{x}}{\alpha+\beta+n}. \]
从中可以分离得到贝叶斯信度估计：

\[\frac{\alpha+n\bar{x}}{\alpha+\beta+n}=\frac{\alpha+\beta}{\alpha+\beta+n}\times\frac{\alpha}{\alpha+\beta}+\frac{n}{\alpha+\beta+n}\times\bar{x}. \]
其中信度因子为 \(z=n/(\alpha+\beta+n)\) 。

下面给出一个二项分布-贝塔分布的例题。

假设总体 \(X\) 服从二项分布 \(X\sim B(2,\theta)\) ，设 \(\mathbf{X}=(X_1,X_2,\cdots,X_n)\) 是来自总体 \(X\) 的一个简单随机样本，如果参数 \(\theta\) 为随机变量 \(\Theta\sim {\rm Be}(\alpha,\beta)\) 的取值。

(1) 计算后验分布的均值。

可以验证，\(\Theta\) 的后验分布为 \({\rm Be}(\alpha+n\bar{x},\beta+2n-n\bar{x})\) ，所以后验分布的均值为

\[\mathbb{E}\left[\Theta\mid\mathbf{x}\right]=\frac{\alpha+n\bar{x}}{\alpha+n\bar{x}+\beta+2n-n\bar{x}}=\frac{\alpha+n\bar{x}}{\alpha+\beta+2n}. \]
(2) 计算给定样本 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(X_{n+1}\) 的预测值。

由于 \(X\) 服从二项分布 \(B(2,\theta)\) ，所以

\[\mu_X(\Theta)=\mathbb{E}\left[X\mid\Theta\right]=2\Theta. \]
给定 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(X_{n+1}\) 的条件期望为

\[\mathbb{E}\left[X_{n+1}\mid\mathbf{X}=\mathbf{x}\right]=\mathbb{E}\left[\mu_X(\Theta)\mid\mathbf{x}\right]=\mathbb{E}\left[2\Theta\mid\mathbf{x}\right]=\frac{2\left(\alpha+n\bar{x}\right)}{\alpha+\beta+n}. \]
记信度因子为 \(z=2n/(\alpha+\beta+2n)\) ，则可以得到贝叶斯信度估计：

\[\frac{2\left(\alpha+n\bar{x}\right)}{\alpha+\beta+n}=\frac{\alpha+\beta}{\alpha+\beta+2n}\times\frac{2\alpha}{\alpha+\beta}+\frac{2n}{\alpha+\beta+2n}\times\bar{x}. \]

最后给出一个泊松分布-伽马分布的例题。

假设索赔次数 \(X\sim P(\lambda)\) ，其先验分布 \(\Lambda\sim\Gamma(\alpha,\beta)\) ，现有 \(n\) 个样本 \(\mathbf{X}=(X_1,X_2,\cdots,X_n)\) ，给出下一年索赔次数 \(X_{n+1}\) 的预测值。

由后验分布可知

\[\begin{aligned} \mathbb{E}\left[X_{n+1}\mid\mathbf{X}=\mathbf{x}\right]&=\mathbb{E}\left[\mu_X(\Lambda)\mid\mathbf{x}\right] \\ \\ &=\mathbb{E}\left[\mathbb{E}\left[X\mid\Lambda\right]\mid\mathbf{x}\right] \\ \\ &=\mathbb{E}\left[\Lambda\mid\mathbf{x}\right] \\ \\ &=\left(\alpha+n\bar{x}\right)\frac{\beta}{n\beta+1} \\ \\ &=\frac{n\beta}{n\beta+1}\bar{x}+\frac{1}{n\beta+1}\alpha\beta. \end{aligned} \]
从上面的分解中可以看出

\[\widehat{X}_{n+1}=z\bar{x}+(1-z)\mathbb{E}(X), \]
其中信度因子为 \(z=n\beta/(n\beta+1)\) ，先验均值为 \(\mathbb{E}(X)=\alpha\beta\) ，经验均值为 \(\bar{x}\) 。

第二节有限波动信度一、完全信度的判别准则

在灾害保险等领域中，往往要根据风险因素对风险进行分类。考虑其中的一个类别，假设已经收集到某个时期的观察值。

存在的两个问题是：(1) 所收集到的资料对后期保费的决定是否能够完全依赖，换句话说，在决定保费的时候，是否还需要依赖其他的一些信息，如其他风险类别的资料等；(2) 多少样本量是经典信度理论方法决定完全信度所需要的最小样本量。事实上，这依赖于损失度量的选择。

有限波动信度旨在控制数据中随机波动对估计的影响，其数学判别准则如下：对于风险 \(S\) ，给定一个置信度为 \(1-\alpha\) ，以及常数 \(k\) ，要求 \(S\) 在均值附近波动的概率大于 \(1-\alpha\) ，即

\[{\rm Pr}\left(\mu_S-k\mu_S\leq S\leq \mu_S+k\mu_S\right)\geq 1-\alpha. \]

对给定的 \(k\) 和 \(1-\alpha\) ，使上式成立所需要的最小样本量即为完全信度所需要的样本量。此时计算信度保费可采用 \(z=1\) ，即为完全信度。

二、完全信度

(1) 索赔次数的完全信度

假设索赔次数为随机变量 \(N\) ，均值为 \(\mu_N\) ，方差为 \(\sigma_N^2\) 。对给定的 \(k\) 和 \(1-\alpha\) ，则 \(N\) 在其均值附近波动的概率为

\[{\rm Pr}\left(\mu_N-k\mu_N\leq N\leq \mu_N+k\mu_N\right)={\rm Pr}\left(-\frac{k\mu_N}{\sigma_N}\leq\frac{N-\mu_N}{\sigma_N}\leq \frac{k\mu_N}{\sigma_N}\right). \]

假设 \(\frac{N-\mu_N}{\sigma_N}\) 服从标准正态分布，要求覆盖的概率为 \(1-\alpha\) ，则有

\[{\rm Pr}\left(-\frac{k\mu_N}{\sigma_N}\leq\frac{N-\mu_N}{\sigma_N}\leq \frac{k\mu_N}{\sigma_N}\right)\approx 2\Phi\left(\frac{k\mu_N}{\sigma_N}\right)-1=1-\alpha. \]

如果 \(N\sim P(\lambda_N)\) ，则 \(\mu_N=\lambda_N,\ \sigma_N=\sqrt{\lambda_N}\) ，此时完全信度需要满足的条件是

\[\frac{k\mu_N}{\sigma_N}=k\sqrt{\lambda_N}\geq z_{\alpha/2} \quad \Longrightarrow \quad \lambda_N\geq \left(\frac{z_{\alpha/2}}{k}\right)^2\xlongequal{def}\lambda_F. \]

即如果索赔次数发生的频率比较大，则可以采用完全信度。

(2) 索赔额的完全信度

假设索赔额为随机变量 \(X\) ，均值为 \(\mu_X\) ，方差为 \(\sigma_X^2\) 。现收集到 \(n\) 个样本 \(X_1,X_2,\cdots,X_n\) ，则可用样本均值 \(\bar{X}\) 去估计均值 \(\mu_X\) ，计算 \(\bar{X}\) 的均方误差为

\[{\rm Mse}(\bar{X})=\mathbb{E}\left[\bar{X}-\mathbb{E}(X)\right]^2=\frac{\sigma_X}{\sqrt{n}}. \]

则 \(X\) 在样本均值 \(\bar{X}\) 附近波动的概率为

\[{\rm Pr}\left(\mu_X-k\mu_X\leq\bar{X}\leq\mu_X+k\mu_X\right)={\rm Pr}\left(-\frac{k\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{k\mu_X}{\sigma_X/\sqrt{n}}\right). \]

假设 \(\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\) 为标准正态分布，要求覆盖的概率为 \(1-\alpha\) ，则

\[{\rm Pr}\left(-\frac{k\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{k\mu_X}{\sigma_X/\sqrt{n}}\right)=2\Phi\left(\frac{k\mu_X}{\sigma_X/\sqrt{n}}\right)-1=1-\alpha. \]

此时完全信度需要满足的条件是

\[\frac{k\mu_X}{\sigma_X/\sqrt{n}}\geq z_{\alpha/2} \quad \Longrightarrow \quad n\geq\left(\frac{z_{\alpha/2}}{k}\right)^2\left(\frac{\sigma_X}{\mu_X}\right)^2\xlongequal{def}\lambda_FC_X^2. \]

即当样本量充分大时，可以采用完全信度。

(3) 聚合风险的完全信度

假设聚合风险为 \(S=\sum_{i=1}^NX_i\) ，其中索赔次数 \(N\sim P(\lambda_N)\) ，计算可得

\[\mu_S=\lambda_N\mu_X,\quad \sigma_S^2=\lambda_N\left(\sigma_X^2+\mu_X^2\right). \]

类似于索赔额和索赔次数，假设 \(\frac{S-\mu_S}{\sigma_S}\) 服从标准正态分布，要求覆盖的概率为 \(1-\alpha\) ，则有

\[{\rm Pr}\left(-\frac{k\mu_S}{\sigma_S}\leq\frac{S-\mu_S}{\sigma_S}\leq \frac{k\mu_S}{\sigma_S}\right)\approx 2\Phi\left(\frac{k\mu_S}{\sigma_S}\right)-1=1-\alpha. \]

此时完全信度需要满足的条件是

\[\frac{k\mu_S}{\sigma_S}=\frac{k\lambda_N\mu_X}{\sqrt{\lambda_N\left(\sigma_X^2+\mu_X^2\right)}}=\frac{k\sqrt{\lambda_N}\mu_X}{\sqrt{\sigma_X^2+\mu_X^2}}\geq z_{\alpha/2}, \]

即如果 \(\lambda_N\) 满足下面的条件时，可采用完全信度

\[\lambda_N\geq\left(\frac{z_{\alpha/2}}{k}\right)^2\left(\frac{\sigma_X^2+\mu_X^2}{\mu_X^2}\right)=\lambda_F(1+C_X^2)=\lambda_F+\lambda_FC_X^2. \]

即聚合损失的完全信度 \(=\) 索赔次数的完全信度 \(+\) 索赔额的完全信度。

注意：这里都采用了最简单的正态分布去近似 \(N,\bar{X}\) 或 \(S\) 的分布，如果采用平移伽马分布或 NP 近似方法，同样可以得出完全信度的类似结果。

三、部分信度

(1) 索赔次数的部分信度

假设 \(\frac{N-\mu_N}{\sigma_N}\) 服从标准正态分布，设信度因子为 \(z\) ，要求覆盖的概率为 \(1-\alpha\) ，则有

\[{\rm Pr}\left(-\frac{k\mu_N}{z\sigma_N}\leq\frac{N-\mu_N}{\sigma_N}\leq \frac{k\mu_N}{z\sigma_N}\right)\approx 2\Phi\left(\frac{k\mu_N}{z\sigma_N}\right)-1=1-\alpha. \]

这是因为在完全信度条件下，随机变量 \(N\) 在其均值附近波动的概率小于 \(1-\alpha\) ，因此我们采用部分信度方法，需要扩大这个区间，使得 \(N\) 落入这个区间的概率等于 \(1-\alpha\) 。最简单的方法是直接将该区间扩大到原来的 \(1/z\) 倍，其中 \(z\) 是信度因子，满足 \(0<z<1\) 。

如果 \(N\sim P(\lambda_N)\) ，则 \(\mu_N=\lambda_N,\ \sigma_N=\sqrt{\lambda_N}\) ，此时部分信度的信度因子为

\[\frac{k\mu_N}{z\sigma_N}=\frac{k\sqrt{\lambda_N}}{z}=z_{\alpha/2} \quad \Longrightarrow \quad z=\left(\frac{k}{z_{\alpha/2}}\right)\sqrt{\lambda_N}=\sqrt{\frac{\lambda_N}{\lambda_F}}. \]

(2) 索赔额的部分信度

假设 \(\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\) 为标准正态分布，设信度因子为 \(z\) ，要求覆盖的概率为 \(1-\alpha\) ，则有

\[{\rm Pr}\left(-\frac{k\mu_X}{z\sigma_X/\sqrt{n}}\leq\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{k\mu_X}{z\sigma_X/\sqrt{n}}\right)=2\Phi\left(\frac{k\mu_X}{z\sigma_X/\sqrt{n}}\right)-1=1-\alpha. \]

此时部分信度的信度因子为

\[\frac{k\mu_X}{z\sigma_X/\sqrt{n}}=z_{\alpha/2} \quad \Longrightarrow \quad z=\frac{k\mu_X}{z_{\alpha/2}\sigma_X/\sqrt{n}}=\sqrt{\frac{n}{\lambda_FC_X^2}}. \]

(3) 聚合风险的部分信度

假设 \(\frac{S-\mu_S}{\sigma_S}\) 服从标准正态分布，设信度因子为 \(z\) ，要求覆盖的概率为 \(1-\alpha\) ，则有

\[{\rm Pr}\left(-\frac{k\mu_S}{z\sigma_S}\leq\frac{S-\mu_S}{\sigma_S}\leq \frac{k\mu_S}{z\sigma_S}\right)\approx 2\Phi\left(\frac{k\mu_S}{z\sigma_S}\right)-1=1-\alpha. \]

此时部分信度的信度因子为

\[\frac{k\mu_S}{z\sigma_S}=\frac{k\sqrt{\lambda_N}\mu_X}{z\sqrt{\sigma_X^2+\mu_X^2}}=z_{\alpha/2} \quad \Longrightarrow \quad z=\frac{k\sqrt{\lambda_N}\mu_X}{z_{\alpha/2}\sqrt{\sigma_X^2+\mu_X^2}}=\sqrt{\frac{\lambda_N}{\lambda_F(1+C_X^2)}}. \]

例如：某一段时间内一组共有 \(18600\) 个保单组成的保单组合，对其中的 \(896\) 次索赔进行观察，每次索赔的平均损失为 \(45\) ，方差为 \(5067\) 。设完全信度依据覆盖均值的 \(90\%\) 的概率为 \(98\%\) ，即指定参数分别为 \(k=0.1\) 和 \(1-\alpha=0.98\) 。假设保单索赔次数为泊松分布，每份保单索赔次数的均值为 \(0.09\) 。计算下一期索赔次数、索赔额和聚合索赔的完全信度或部分信度。

(1) 保单组合的索赔次数 \(N\) 服从参数为 \(\lambda_N=18600\times0.09=1674\) 的泊松分布，当 \(\alpha=0.02\) 时，查正态分布表可得 \(z_{0.01}=2.3263\) ，于是

\[\lambda_F=\left(\frac{2.3263}{0.1}\right)^2=541.17<\lambda_N=1674. \]
故满足完全信度的条件，故索赔次数是完全信度 \(z=1\) 。

(2) 计算索赔额的变异系数为

\[C_X=\frac{\sigma_X}{\mu_X}=\frac{\sqrt{5067}}{45}=1.5818. \]
所以索赔额的完全信度需要的样本量为

\[\lambda_FC_X^2=541.17\times1.5818^2=1354.13>n=896, \]
没有达到完全信度的条件，故需要计算部分信度，信度因子为

\[z=\sqrt{\frac{896}{1354.13}}=0.8134. \]
(3) 计算聚合风险完全信度的条件为

\[\lambda_F(1+C_X^2)=541.17+1354.13=1895.3>\lambda_N=1674, \]
没有达到完全信度的条件，故需要计算部分信度，信度因子为

\[z=\sqrt{\frac{1674}{1895.3}}=0.9398. \]

上一篇：fastposter v2.8.2 发布电商海报生成器
下一篇：没有了

现代精算风险理论11：信度理论(1)

相关文章