- 第十一讲 信度理论(1)
- 第一节 基础知识
- 一、信度理论的背景
- 二、贝叶斯方法回顾
- 三、贝叶斯方法例题
- 第二节 有限波动信度
- 一、完全信度的判别准则
- 二、完全信度
- 三、部分信度
- 第一节 基础知识
在保险实务中,我们往往需要对一组保险合同来确定一个保费。当从一组保险合同中获得的数据不充分,因而无法提供风险费率的可靠估计时,就需要用到信度理论的方法。
信度理论在非寿险精算理论与实务中具有重要地位。非寿险合同是补偿性合同,非寿险的损失与每个赔案的具体情况以及相应的法规情况密切相关,因而损失经验需要经常修正以适应不断变化的外部环境。非寿险精算师在厘定费率时,既要依据过去的经验,即先验信息,也要根据风险情况的新变化加以调整。这是由非寿险经营的连续性所决定的。
非寿险保费的估算可以根据两类数据:
- 一类是通过观察得到的本险种一组保单的近期损失数据。这类数据确定的保费称为经验保费,记为 \(PM_\varepsilon\) 。
- 另一类是同险种保单早期损失数据或类似险种保单的同期损失数据,它是根据人们的主观选择得到的数据,所以称为先验信息数据。这类数据确定的保费称为先验信息保费,记为 \(PM_0\) 。
由这两类数据加权构成信度保费
\[P=zPM_\varepsilon+(1-z)PM_0, \]其中 \(z\) 为信度因子,表示实际损失数据的可信程度。
- 当 \(z\) 的值接近 \(1\) 时,表明实际损失数据提供的信息相当充分,据此足以获得正确的保费
- 当 \(z\) 的值接近 \(0\) 时,则只能基于先验信息估计,得到先验保费的估计值。
- 当 \(z=1\) 时,称为完全信度。此时,只需根据实际损失数据,利用区间估计的方法计算保险费。
- 当 \(0<z < 1\) 时,称为部分信度。在此种情况下,就需要研究如何合理确定 \(z\) 值。
信度理论有两种基本方法:
- 有限波动信度,旨在控制数据中随机波动对估计的影响。
- 最大精度信度,试图使估计误差尽可能的小。在最大精度信度方法中发展最完善的方法是最小平方信度,它力图使估计误差平方的期望值最小。
二、贝叶斯方法回顾某一公司去年每个工人平均工伤损失为 \(230\) 元。假设类似的公司每个工人工伤纯保费为 \(292\) 元,信度因子为 \(0.46\) ,这个公司工人工伤保险纯保费为
\[P=0.46\times230+(1-0.46)\times292=263.88. \]
(1) 基本概念和设定
设 \(X\) 是一随机损失,其分布依赖于某一参数 \(\theta\) ,其中 \(\theta\) 是某一随机变量 \(\Theta\) 的某一实现。将 \(\Theta\) 的分布称为先验分布,其密度函数为 \(f_\Theta(\theta\mid \gamma)\) ,\(\gamma\) 为参数。
在给定参数 \(\theta\) 的条件下,\(X\) 的密度为 \(f_{X\mid \Theta}(x\mid \theta)\) ,假设 \(\mathbf{X}=(X_1,X_2,\cdots,X_n)\) 为总体 \(X\) 的一个样本,在给定 \(\Theta\) 的条件下相互独立。
对于某一观测值 \(\mathbf{x}=(x_1,x_2,\cdots,x_n)\) ,样本 \(\mathbf{X}\) 的条件密度为
\[f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)=\prod_{i=1}^nf_{X\mid \Theta}(x_i\mid \theta), \]其中 \(f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)\) 即为似然函数。
在给定样本观测值 \(\mathbf x\) 的条件下,随机参数 \(\Theta\) 的分布称为后验分布,记为 \(f_{\Theta\mid \mathbf{X}}(\theta\mid \mathbf{x})\) 。利用 \(\Theta\) 的后验分布,计算随机损失均值的估计,这样的估计称为贝叶斯估计,即为下一期的损失的估计。
(2) 后验分布的计算方法
如果给定 \(\Theta\) 的分布 \(f_\Theta(\theta)\) 和给定 \(\Theta\) 的条件下 \(\mathbf{X}\) 的分布 \(f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)\) ,则 \(\Theta\) 和 \(\mathbf{X}\) 的联合分布为
\[f_{\Theta,\mathbf{X}}(\theta,\mathbf{x})=f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)f_\Theta(\theta). \]设 \(\Omega_\Theta=\{\theta:f_\Theta(\theta)>0\}\) 为 \(\Theta\) 的支撑,则 \(\mathbf{X}\) 的边际分布为
\[f_{ \mathbf{X} }(\mathbf{x})=\int_{\Omega_\Theta}f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)f_\Theta(\theta){\rm d}\theta. \]在给定数据 \(\mathbf{X}\) 的条件下 \(\Theta\) 的分布
\[f_{\Theta\mid \mathbf{X}}(\theta\mid \mathbf{x})=\frac{f_{\Theta,\mathbf{X}}(\theta,\mathbf{x})}{f_{ \mathbf{X} }(\mathbf{x})}=\frac{f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)f_\Theta(\theta)}{\int_{\Omega_\Theta}f_{\mathbf{X}\mid \Theta}(\mathbf{x}\mid \theta)f_\Theta(\theta){\rm d}\theta} \]即为 \(\Theta\) 的后验分布。
(3) 根据损失函数计算贝叶斯估计
这里只介绍均值的估计,即在给定 \(\mathbf{X}=\mathbf{x}\) 的条件下,计算 \(\mu_X(\Theta)=\mathbb{E}[X\mid \Theta]\) 的贝叶斯估计。
假设 \(L(\mu_X(\Theta),w(\mathbf{x}))\) 为损失函数,\(w(\mathbf{x})\) 为相应于该损失函数 \(\mu_X(\Theta)\) 的一个估计。
记贝叶斯估计为 \(w^*(\mathbf{x})\) ,则 \(w^*(\mathbf{x})\) 应满足
\[w^*(\mathbf{x})=\underset{w(\cdot)}{\arg\min}\ \mathbb{E}\left[L(\mu_X(\Theta),w(\mathbf{x}))\mid \mathbf{x}\right]. \]常用的损失函数有
-
平方损失函数:
\[L(\mu_X(\Theta),w(\mathbf{x}))=\left[\mu_X(\Theta)-w(\mathbf{x})\right]^2. \]此时 \(\mu_X(\Theta)\) 的贝叶斯估计为后验分布的均值。
-
绝对值损失函数:
\[L(\mu_X(\Theta),w(\mathbf{x}))=\left|\mu_X(\Theta)-w(\mathbf{x})\right|. \]此时 \(\mu_X(\Theta)\) 的贝叶斯估计为后验分布的中位数。
-
\(0\text{-}1\) 损失函数:
\[L(\mu_X(\Theta),w(\mathbf{x}))=\mathbf{1}_{\{\mu_X(\Theta)-w(\mathbf{x})\}}. \]此时 \(\mu_X(\Theta)\) 的贝叶斯估计为后验分布的众数。
(4) 根据损失函数计算贝叶斯预测
在给定 \(\mathbf{X}=\mathbf{x}\) 的条件下,\(X_{n+1}\) 的密度函数为
\[\begin{aligned} f_{X_{n+1}\mid\mathbf{X}}(x_{n+1}\mid\mathbf{x})&=\frac{f_{X_{n+1},\mathbf{X}}(x_{n+1},\mathbf{x})}{f_{\mathbf{X}}(\mathbf{x})} \\ \\ &=\frac{\int_{\theta\in\Omega_{\Theta}}f_{X_{n+1},\mathbf{X}\mid\Theta}(x_{n+1},\mathbf{x}\mid \theta)f_{\Theta}(\theta){\rm d}\theta}{f_{\mathbf{X}}(\mathbf{x})} \\ \\ &=\frac{\int_{\theta\in\Omega_{\Theta}}\left[\prod_{i=1}^{n+1}f_{X_i|\Theta}(x_i|\theta)\right]f_{\Theta}(\theta){\rm d}\theta}{f_{\mathbf{X}}(\mathbf{x})}. \end{aligned} \]在给定 \(\mathbf{X}=\mathbf{x}\) 的条件下,\(\Theta\) 的后验分布为
\[f_{\Theta\mid\mathbf{X}}(\theta\mid\mathbf{x})=\frac{f_{\mathbf{X},\Theta}(\mathbf{x},\theta)}{f_{\mathbf{X}}(\mathbf{x})}=\frac{\prod_{i=1}^{n}f_{X_i|\Theta}(x_i|\theta)f_{\Theta}(\theta)}{f_{\mathbf{X}}(\mathbf{x})}. \\ \\ \Downarrow \\ \\ \prod_{i=1}^{n}f_{X_i|\Theta}(x_i|\theta)f_{\Theta}(\theta)=f_{\Theta\mid\mathbf{X}}(\theta\mid\mathbf{x})f_{\mathbf{X}}(\mathbf{x}). \]\(X_{n+1}\) 的密度函数为
\[f_{X_{n+1}\mid\mathbf{X}}(x_{n+1}\mid\mathbf{x})=\int_{\theta\in\Omega_{\Theta}}f_{X_{n+1}\mid\Theta}(x_{n+1}\mid\theta)f_{\Theta\mid\mathbf{X}}(\theta\mid\mathbf{x}){\rm d}\theta. \]\(X_{n+1}\) 的预测值可以采用给定 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(X_{n+1}\) 的条件期望来描述,即
\[\mathbb{E}\left[X_{n+1}\mid\mathbf{X}=\mathbf{x}\right]=\int_0^\infty x_{n+1}f_{X_{n+1}\mid\mathbf{X}}(x_{n+1}\mid \mathbf{x}){\rm d}x_{n+1}=\mathbb{E}\left[\mu_X(\Theta)\mid\mathbf{x}\right]. \]三、贝叶斯方法例题首先给出一个两点分布-贝塔分布的例题。
假设总体 \(X\) 服从两点分布 \(X\sim B(1,\theta)\) ,参数 \(\theta\) 为随机变量 \(\Theta\) 的取值,其分布为 \(\Theta\sim {\rm Be}(\alpha,\beta)\) 。又设 \(\mathbf{X}=(X_1,X_2,\cdots,X_n)\) 是从总体 \(X\) 中抽取的简单随机样本,设 \(\mathbf{x}=(x_1,x_2,\cdots,x_n)\) 是该样本的一组观测值。
(1) 计算给定样本 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(\Theta\) 的后验分布。
首先计算条件概率密度为
\[f_{\mathbf{X}\mid\Theta}(\mathbf{x}\mid \theta)=\prod_{i=1}^n\theta^{x_i}(1-\theta)^{1-x_i} ,\quad x_i=0,1. \]参数 \(\Theta\) 的密度函数为
\[f_{\Theta}(\theta)=\frac{\theta^{\alpha-1}(1-\theta)^{\beta-1}}{\Beta(\alpha,\beta)}, \]计算 \(\mathbf{X}\) 和 \(\Theta\) 的联合分布为
\[f_{\mathbf{X},\Theta}(\theta,\mathbf{x})=f_{\mathbf{X}\mid\Theta}(\mathbf{x}\mid \theta) f_\Theta(\theta)=\frac{\theta^{\alpha+\sum_{i=1}^nx_i-1}(1-\theta)^{\left(\beta-\sum_{i=1}^nx_i+n\right)-1}}{\Beta(\alpha,\beta)}. \]得出 \(\mathbf{X}\) 的分布为
\[f_{\mathbf{X}}(\mathbf{x})=\frac{1}{\Beta(\alpha,\beta)}\int_0^1 \theta^{\alpha+\sum_{i=1}^nx_i-1}(1-\theta)^{\left(\beta-\sum_{i=1}^nx_i+n\right)-1}{\rm d}\theta=\frac{\Beta(\alpha+n\bar{x},\beta-n\bar{x}+n)}{\Beta(\alpha,\beta)}. \]计算 \(\Theta\) 的后验分布为
\[f_{\Theta\mid\mathbf{X}}(\theta\mid\mathbf{x})=\frac{f_{\mathbf{X},\Theta}(\theta,\mathbf{x})}{f_{\mathbf{X}}(\mathbf{x})}=\frac{\theta^{\alpha+n\bar{x}-1}(1-\theta)^{\left(\beta-n\bar{x}+n\right)-1}}{\Beta(\alpha+n\bar{x},\beta-n\bar{x}+n)}. \]该后验分布仍为贝塔分布 \(\Theta\mid\mathbf{X}\sim {\rm Be}(\alpha+n\bar{x},\beta-n\bar{x}+n)\) 。
(2) 计算后验分布的均值。
由之前的讨论可知,后验分布仍为贝塔分布,其参数分别为
\[\alpha^*=\alpha+n\bar{x} ,\quad \beta^*=\beta+n-n\bar{x}, \]因此,后验分布的均值为
\[\mathbb{E}\left[\Theta\mid\mathbf{x}\right]=\frac{\alpha^*}{\alpha^*+\beta^*}=\frac{\alpha+n\bar{x}}{\alpha+\beta+n}. \](3) 计算给定样本 \(\mathbf{X}=\mathbf{x}\) 的条件下,下一期风险损失 \(X_{n+1}\) 的期望值。
由于 \(X\) 服从两点分布 \(B(1,\theta)\) ,所以
\[\mu_X(\Theta)=\mathbb{E}\left[X\mid\Theta\right]=\Theta. \]给定 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(X_{n+1}\) 的条件期望为
\[\mathbb{E}\left[X_{n+1}\mid\mathbf{X}=\mathbf{x}\right]=\mathbb{E}\left[\mu_X(\Theta)\mid\mathbf{x}\right]=\mathbb{E}\left[\Theta\mid\mathbf{x}\right]=\frac{\alpha+n\bar{x}}{\alpha+\beta+n}. \]从中可以分离得到贝叶斯信度估计:
\[\frac{\alpha+n\bar{x}}{\alpha+\beta+n}=\frac{\alpha+\beta}{\alpha+\beta+n}\times\frac{\alpha}{\alpha+\beta}+\frac{n}{\alpha+\beta+n}\times\bar{x}. \]其中信度因子为 \(z=n/(\alpha+\beta+n)\) 。
下面给出一个二项分布-贝塔分布的例题。
假设总体 \(X\) 服从二项分布 \(X\sim B(2,\theta)\) ,设 \(\mathbf{X}=(X_1,X_2,\cdots,X_n)\) 是来自总体 \(X\) 的一个简单随机样本,如果参数 \(\theta\) 为随机变量 \(\Theta\sim {\rm Be}(\alpha,\beta)\) 的取值。
(1) 计算后验分布的均值。
可以验证,\(\Theta\) 的后验分布为 \({\rm Be}(\alpha+n\bar{x},\beta+2n-n\bar{x})\) ,所以后验分布的均值为
\[\mathbb{E}\left[\Theta\mid\mathbf{x}\right]=\frac{\alpha+n\bar{x}}{\alpha+n\bar{x}+\beta+2n-n\bar{x}}=\frac{\alpha+n\bar{x}}{\alpha+\beta+2n}. \](2) 计算给定样本 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(X_{n+1}\) 的预测值。
由于 \(X\) 服从二项分布 \(B(2,\theta)\) ,所以
\[\mu_X(\Theta)=\mathbb{E}\left[X\mid\Theta\right]=2\Theta. \]给定 \(\mathbf{X}=\mathbf{x}\) 的条件下 \(X_{n+1}\) 的条件期望为
\[\mathbb{E}\left[X_{n+1}\mid\mathbf{X}=\mathbf{x}\right]=\mathbb{E}\left[\mu_X(\Theta)\mid\mathbf{x}\right]=\mathbb{E}\left[2\Theta\mid\mathbf{x}\right]=\frac{2\left(\alpha+n\bar{x}\right)}{\alpha+\beta+n}. \]记信度因子为 \(z=2n/(\alpha+\beta+2n)\) ,则可以得到贝叶斯信度估计:
\[\frac{2\left(\alpha+n\bar{x}\right)}{\alpha+\beta+n}=\frac{\alpha+\beta}{\alpha+\beta+2n}\times\frac{2\alpha}{\alpha+\beta}+\frac{2n}{\alpha+\beta+2n}\times\bar{x}. \]
最后给出一个泊松分布-伽马分布的例题。
第二节 有限波动信度 一、完全信度的判别准则假设索赔次数 \(X\sim P(\lambda)\) ,其先验分布 \(\Lambda\sim\Gamma(\alpha,\beta)\) ,现有 \(n\) 个样本 \(\mathbf{X}=(X_1,X_2,\cdots,X_n)\) ,给出下一年索赔次数 \(X_{n+1}\) 的预测值。
由后验分布可知
\[\begin{aligned} \mathbb{E}\left[X_{n+1}\mid\mathbf{X}=\mathbf{x}\right]&=\mathbb{E}\left[\mu_X(\Lambda)\mid\mathbf{x}\right] \\ \\ &=\mathbb{E}\left[\mathbb{E}\left[X\mid\Lambda\right]\mid\mathbf{x}\right] \\ \\ &=\mathbb{E}\left[\Lambda\mid\mathbf{x}\right] \\ \\ &=\left(\alpha+n\bar{x}\right)\frac{\beta}{n\beta+1} \\ \\ &=\frac{n\beta}{n\beta+1}\bar{x}+\frac{1}{n\beta+1}\alpha\beta. \end{aligned} \]从上面的分解中可以看出
\[\widehat{X}_{n+1}=z\bar{x}+(1-z)\mathbb{E}(X), \]其中信度因子为 \(z=n\beta/(n\beta+1)\) ,先验均值为 \(\mathbb{E}(X)=\alpha\beta\) ,经验均值为 \(\bar{x}\) 。
在灾害保险等领域中,往往要根据风险因素对风险进行分类。考虑其中的一个类别,假设已经收集到某个时期的观察值。
存在的两个问题是:(1) 所收集到的资料对后期保费的决定是否能够完全依赖,换句话说,在决定保费的时候,是否还需要依赖其他的一些信息,如其他风险类别的资料等;(2) 多少样本量是经典信度理论方法决定完全信度所需要的最小样本量。事实上,这依赖于损失度量的选择。
有限波动信度旨在控制数据中随机波动对估计的影响,其数学判别准则如下:对于风险 \(S\) ,给定一个置信度为 \(1-\alpha\) ,以及常数 \(k\) ,要求 \(S\) 在均值附近波动的概率大于 \(1-\alpha\) ,即
\[{\rm Pr}\left(\mu_S-k\mu_S\leq S\leq \mu_S+k\mu_S\right)\geq 1-\alpha. \]对给定的 \(k\) 和 \(1-\alpha\) ,使上式成立所需要的最小样本量即为完全信度所需要的样本量。此时计算信度保费可采用 \(z=1\) ,即为完全信度。
二、完全信度(1) 索赔次数的完全信度
假设索赔次数为随机变量 \(N\) ,均值为 \(\mu_N\) ,方差为 \(\sigma_N^2\) 。对给定的 \(k\) 和 \(1-\alpha\) ,则 \(N\) 在其均值附近波动的概率为
\[{\rm Pr}\left(\mu_N-k\mu_N\leq N\leq \mu_N+k\mu_N\right)={\rm Pr}\left(-\frac{k\mu_N}{\sigma_N}\leq\frac{N-\mu_N}{\sigma_N}\leq \frac{k\mu_N}{\sigma_N}\right). \]假设 \(\frac{N-\mu_N}{\sigma_N}\) 服从标准正态分布,要求覆盖的概率为 \(1-\alpha\) ,则有
\[{\rm Pr}\left(-\frac{k\mu_N}{\sigma_N}\leq\frac{N-\mu_N}{\sigma_N}\leq \frac{k\mu_N}{\sigma_N}\right)\approx 2\Phi\left(\frac{k\mu_N}{\sigma_N}\right)-1=1-\alpha. \]如果 \(N\sim P(\lambda_N)\) ,则 \(\mu_N=\lambda_N,\ \sigma_N=\sqrt{\lambda_N}\) ,此时完全信度需要满足的条件是
\[\frac{k\mu_N}{\sigma_N}=k\sqrt{\lambda_N}\geq z_{\alpha/2} \quad \Longrightarrow \quad \lambda_N\geq \left(\frac{z_{\alpha/2}}{k}\right)^2\xlongequal{def}\lambda_F. \]即如果索赔次数发生的频率比较大,则可以采用完全信度。
(2) 索赔额的完全信度
假设索赔额为随机变量 \(X\) ,均值为 \(\mu_X\) ,方差为 \(\sigma_X^2\) 。现收集到 \(n\) 个样本 \(X_1,X_2,\cdots,X_n\) ,则可用样本均值 \(\bar{X}\) 去估计均值 \(\mu_X\) ,计算 \(\bar{X}\) 的均方误差为
\[{\rm Mse}(\bar{X})=\mathbb{E}\left[\bar{X}-\mathbb{E}(X)\right]^2=\frac{\sigma_X}{\sqrt{n}}. \]则 \(X\) 在样本均值 \(\bar{X}\) 附近波动的概率为
\[{\rm Pr}\left(\mu_X-k\mu_X\leq\bar{X}\leq\mu_X+k\mu_X\right)={\rm Pr}\left(-\frac{k\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{k\mu_X}{\sigma_X/\sqrt{n}}\right). \]假设 \(\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\) 为标准正态分布,要求覆盖的概率为 \(1-\alpha\) ,则
\[{\rm Pr}\left(-\frac{k\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{k\mu_X}{\sigma_X/\sqrt{n}}\right)=2\Phi\left(\frac{k\mu_X}{\sigma_X/\sqrt{n}}\right)-1=1-\alpha. \]此时完全信度需要满足的条件是
\[\frac{k\mu_X}{\sigma_X/\sqrt{n}}\geq z_{\alpha/2} \quad \Longrightarrow \quad n\geq\left(\frac{z_{\alpha/2}}{k}\right)^2\left(\frac{\sigma_X}{\mu_X}\right)^2\xlongequal{def}\lambda_FC_X^2. \]即当样本量充分大时,可以采用完全信度。
(3) 聚合风险的完全信度
假设聚合风险为 \(S=\sum_{i=1}^NX_i\) ,其中索赔次数 \(N\sim P(\lambda_N)\) ,计算可得
\[\mu_S=\lambda_N\mu_X,\quad \sigma_S^2=\lambda_N\left(\sigma_X^2+\mu_X^2\right). \]类似于索赔额和索赔次数,假设 \(\frac{S-\mu_S}{\sigma_S}\) 服从标准正态分布,要求覆盖的概率为 \(1-\alpha\) ,则有
\[{\rm Pr}\left(-\frac{k\mu_S}{\sigma_S}\leq\frac{S-\mu_S}{\sigma_S}\leq \frac{k\mu_S}{\sigma_S}\right)\approx 2\Phi\left(\frac{k\mu_S}{\sigma_S}\right)-1=1-\alpha. \]此时完全信度需要满足的条件是
\[\frac{k\mu_S}{\sigma_S}=\frac{k\lambda_N\mu_X}{\sqrt{\lambda_N\left(\sigma_X^2+\mu_X^2\right)}}=\frac{k\sqrt{\lambda_N}\mu_X}{\sqrt{\sigma_X^2+\mu_X^2}}\geq z_{\alpha/2}, \]即如果 \(\lambda_N\) 满足下面的条件时,可采用完全信度
\[\lambda_N\geq\left(\frac{z_{\alpha/2}}{k}\right)^2\left(\frac{\sigma_X^2+\mu_X^2}{\mu_X^2}\right)=\lambda_F(1+C_X^2)=\lambda_F+\lambda_FC_X^2. \]即聚合损失的完全信度 \(=\) 索赔次数的完全信度 \(+\) 索赔额的完全信度。
注意:这里都采用了最简单的正态分布去近似 \(N,\bar{X}\) 或 \(S\) 的分布,如果采用平移伽马分布或 NP 近似方法,同样可以得出完全信度的类似结果。
三、部分信度(1) 索赔次数的部分信度
假设 \(\frac{N-\mu_N}{\sigma_N}\) 服从标准正态分布,设信度因子为 \(z\) ,要求覆盖的概率为 \(1-\alpha\) ,则有
\[{\rm Pr}\left(-\frac{k\mu_N}{z\sigma_N}\leq\frac{N-\mu_N}{\sigma_N}\leq \frac{k\mu_N}{z\sigma_N}\right)\approx 2\Phi\left(\frac{k\mu_N}{z\sigma_N}\right)-1=1-\alpha. \]这是因为在完全信度条件下,随机变量 \(N\) 在其均值附近波动的概率小于 \(1-\alpha\) ,因此我们采用部分信度方法,需要扩大这个区间,使得 \(N\) 落入这个区间的概率等于 \(1-\alpha\) 。最简单的方法是直接将该区间扩大到原来的 \(1/z\) 倍,其中 \(z\) 是信度因子,满足 \(0<z<1\) 。
如果 \(N\sim P(\lambda_N)\) ,则 \(\mu_N=\lambda_N,\ \sigma_N=\sqrt{\lambda_N}\) ,此时部分信度的信度因子为
\[\frac{k\mu_N}{z\sigma_N}=\frac{k\sqrt{\lambda_N}}{z}=z_{\alpha/2} \quad \Longrightarrow \quad z=\left(\frac{k}{z_{\alpha/2}}\right)\sqrt{\lambda_N}=\sqrt{\frac{\lambda_N}{\lambda_F}}. \](2) 索赔额的部分信度
假设 \(\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\) 为标准正态分布,设信度因子为 \(z\) ,要求覆盖的概率为 \(1-\alpha\) ,则有
\[{\rm Pr}\left(-\frac{k\mu_X}{z\sigma_X/\sqrt{n}}\leq\frac{\bar{X}-\mu_X}{\sigma_X/\sqrt{n}}\leq\frac{k\mu_X}{z\sigma_X/\sqrt{n}}\right)=2\Phi\left(\frac{k\mu_X}{z\sigma_X/\sqrt{n}}\right)-1=1-\alpha. \]此时部分信度的信度因子为
\[\frac{k\mu_X}{z\sigma_X/\sqrt{n}}=z_{\alpha/2} \quad \Longrightarrow \quad z=\frac{k\mu_X}{z_{\alpha/2}\sigma_X/\sqrt{n}}=\sqrt{\frac{n}{\lambda_FC_X^2}}. \](3) 聚合风险的部分信度
假设 \(\frac{S-\mu_S}{\sigma_S}\) 服从标准正态分布,设信度因子为 \(z\) ,要求覆盖的概率为 \(1-\alpha\) ,则有
\[{\rm Pr}\left(-\frac{k\mu_S}{z\sigma_S}\leq\frac{S-\mu_S}{\sigma_S}\leq \frac{k\mu_S}{z\sigma_S}\right)\approx 2\Phi\left(\frac{k\mu_S}{z\sigma_S}\right)-1=1-\alpha. \]此时部分信度的信度因子为
\[\frac{k\mu_S}{z\sigma_S}=\frac{k\sqrt{\lambda_N}\mu_X}{z\sqrt{\sigma_X^2+\mu_X^2}}=z_{\alpha/2} \quad \Longrightarrow \quad z=\frac{k\sqrt{\lambda_N}\mu_X}{z_{\alpha/2}\sqrt{\sigma_X^2+\mu_X^2}}=\sqrt{\frac{\lambda_N}{\lambda_F(1+C_X^2)}}. \]例如:某一段时间内一组共有 \(18600\) 个保单组成的保单组合,对其中的 \(896\) 次索赔进行观察,每次索赔的平均损失为 \(45\) ,方差为 \(5067\) 。设完全信度依据覆盖均值的 \(90\%\) 的概率为 \(98\%\) ,即指定参数分别为 \(k=0.1\) 和 \(1-\alpha=0.98\) 。假设保单索赔次数为泊松分布,每份保单索赔次数的均值为 \(0.09\) 。计算下一期索赔次数、索赔额和聚合索赔的完全信度或部分信度。
(1) 保单组合的索赔次数 \(N\) 服从参数为 \(\lambda_N=18600\times0.09=1674\) 的泊松分布,当 \(\alpha=0.02\) 时,查正态分布表可得 \(z_{0.01}=2.3263\) ,于是
\[\lambda_F=\left(\frac{2.3263}{0.1}\right)^2=541.17<\lambda_N=1674. \]故满足完全信度的条件,故索赔次数是完全信度 \(z=1\) 。
(2) 计算索赔额的变异系数为
\[C_X=\frac{\sigma_X}{\mu_X}=\frac{\sqrt{5067}}{45}=1.5818. \]所以索赔额的完全信度需要的样本量为
\[\lambda_FC_X^2=541.17\times1.5818^2=1354.13>n=896, \]没有达到完全信度的条件,故需要计算部分信度,信度因子为
\[z=\sqrt{\frac{896}{1354.13}}=0.8134. \](3) 计算聚合风险完全信度的条件为
\[\lambda_F(1+C_X^2)=541.17+1354.13=1895.3>\lambda_N=1674, \]没有达到完全信度的条件,故需要计算部分信度,信度因子为
\[z=\sqrt{\frac{1674}{1895.3}}=0.9398. \]