健康保险定价及管理相关的精算模型与方法。以下内容结合了健康险精算理论、中国医保支付改革实践及监管要求。

编号

类型

领域

模型/方法

算法核心思想与步骤

算法逐步推理思考的数学方程式和数字/数值

关联知识 (法规/教材/实务)

221

健康险定价

医疗保险

基于DRG/DIP支付的医疗险定价调整模型

1. 背景:中国医保支付方式从“按项目付费”改为按疾病诊断相关分组(DRG)或病种分值(DIP)打包付费,导致患者自付金额结构变化,直接影响商业医疗险(尤其是百万医疗险)的理赔额和定价基础。
2. 核心:定价模型从基于历史项目清单费用,转向基于DRG病组支付标准患者就医行为变化进行预测。
3. 步骤:a) 获取医保DRG/DIP分组规则及支付标准。b) 分析目标客户群的历史住院病例,映射到DRG组。c) 估算在DRG支付下,患者的自付比例和自费项目金额(可能因医院控费而减少)。d) 结合保障责任(如免赔额、报销比例),重新计算预期理赔成本。

理赔额估算公式调整
预期单次住院理赔额 ≈ Max(0, [DRG支付标准 × (1 - 医保政策报销比例) + 自费项目预估金额 - 免赔额]) × 合同约定报销比例。
关键变化:DRG支付标准通常低于按项目付费的总费用,且自费项目可能被压缩。因此,传统定价模型中基于历史次均费用的参数需要下调。
:某阑尾炎手术DRG支付标准为1.5万元,原项目总费用2万元。假设医保报销70%,产品免赔额1万元,报销比例100%。
- 旧模式(项目制):患者自付部分 = 2万 × 30% = 0.6万元。未超免赔额,理赔额为0。
- 新模式(DRG):患者自付部分 = 1.5万 × 30% = 0.45万元。未超免赔额,理赔额仍为0。但若自费项目被严格控制,整体赔付压力下降。

国家医保局《DRG/DIP支付方式改革三年行动计划》;商业健康险产品需适应医保结算方式变化,重新设计责任和定价。

222

健康险准备金

长期健康险

保证续保责任的额外责任准备金评估

1. 监管要求:对于含有保证续保条款保证费率的健康险产品,除了计提标准的未到期责任准备金外,还必须计提保证责任的额外责任准备金
2. 目的:覆盖未来保证续保期间内,预期赔款与费用之和超过保证费率部分的风险。
3. 方法:采用未来法,计算额外责任准备金在评估时点的精算现值。

计算公式
保单年度末额外责任准备金 = Σ [未来各保单年度t的 (预期赔款支出t + 费用支出t - 保证保费t) × 续保概率t × v^t ]
其中,v^t 为贴现因子,贴现率不得高于监管规定的未到期责任准备金评估利率。
计算步骤
1. 预测未来保证续保期间内,各年的预期赔款(考虑发病率趋势、医疗通胀)和费用。
2. 确定各年的保证费率(合同约定)。
3. 计算各年的“成本与保费缺口”。
4. 用续保概率和贴现率将未来各年缺口折现至评估日并求和。
:某保证续保6年的医疗险,第3保单年末评估。预测第4-6年每年缺口分别为+200元、+500元、+800元。假设续保概率为95%,贴现率为2%。则额外准备金 = 200×0.95×v + 500×0.95×v² + 800×0.95×v³。

《普通型人身保险精算规定》(银保监办发〔2020〕7号)第十七条;长期健康险责任准备金的评估需严格遵循监管对赔付假设(发生率、医疗通胀≥3%)的要求。

223

社会医疗保险精算

医疗保险(社保)

医保统筹基金长期精算平衡模型

1. 目标:评估职工基本医疗保险统筹基金在中长期(如2025-2050年)的收支状况,预测基金结余或赤字,为政策调整(如费率、待遇)提供依据。
2. 核心:构建基金收入与支出的动态预测模型,考虑人口结构老龄化、工资增长、医疗费用增长、政策改革(如门诊共济)等因素。
3. 方法:多采用队列要素法进行人口预测,结合保险精算模型模拟基金流量。

模型基本等式
第t年基金累计结余 = 第t-1年累计结余 + 第t年基金收入 - 第t年基金支出。
基金收入​ = Σ (分年龄、性别的参保在职人数 × 人均缴费工资 × 总缴费率)。需考虑工资增长率、参保率变化。
基金支出​ = Σ (分年龄、性别的参保人数 × 人均医疗费用 × 政策报销比例)。需考虑医疗费用增长率、发病率、待遇政策调整(如门诊共济改革增加支出)。
政策模拟:通过调整参数(如缴费率、退休年龄、个人账户划拨比例、报销范围),模拟不同改革情景下基金穿底(结余为负)的时间点。

国务院办公厅《关于建立健全职工基本医疗保险门诊共济保障机制的指导意见》;精算模型用于评估“门诊共济改革”等重大政策对基金可持续性的影响。

224

健康险风控

全健康险种

基于机器学习的健康险理赔反欺诈模型

1. 问题:健康险欺诈形式多样(如虚增费用、冒名就医、虚假病历),造成重大损失。
2. 方法:利用监督学习(如有标签的历史欺诈案例)或无监督学习(如聚类发现异常模式)构建识别模型。
3. 流程:a) 数据融合:整合保险公司理赔数据、医疗机构数据(如诊疗记录)、第三方数据(如征信)。b) 特征工程:构建如“就诊频率异常”、“疾病与治疗方式不匹配”、“费用偏离度”等特征。c) 模型训练与识别。

常用算法
- 无监督学习(K-Means聚类):在没有先验标签的情况下,将理赔案件按特征(如医院等级、诊断、总费用、药品占比)聚类。那些远离所有聚类中心或属于极小簇的案件被视为异常,需人工审核。
- 监督学习(随机森林、GBDT):使用历史已确认的欺诈/非欺诈案件训练分类模型。模型输出案件为欺诈的概率分数。
决策:设定阈值,对高于阈值的案件启动调查。
特征示例
1. 单次住院费用超过同DRG组支付标准2倍。
2. 同一被保险人在短时间内在多家不同医院有相似诊断的理赔。
3. 药品费用占比异常高,且多为非医保目录药品。

健康险反欺诈是主动风险管理的重要环节;依赖于大数据融合与特征工程能力。

225

健康险定价

全健康险种

健康险大数据融合定价与风险细分模型

1. 背景:传统定价仅用理赔和承保数据。大数据时代,可融合多源数据:保险公司内部数据、医疗机构临床数据、可穿戴设备健康数据、基因检测数据、生活方式数据等。
2. 目标:实现更精准的风险细分和个性化定价,识别传统模型无法发现的风险关联。
3. 方法:采用高级统计模型(如两阶段模型、零膨胀模型)或机器学习模型,处理多维度、高维度的异构数据。

两阶段模型(Two-Part Model):常用于医疗费用预测。
第一阶段(是否发生理赔):用Logistic回归等模型预测理赔概率 P(Claim > 0 |X)。
第二阶段(给定发生理赔后的金额):用Gamma回归或对数正态回归等模型预测理赔额的条件期望 E(Claim |Claim>0, X)。
最终预期赔款​ = P(Claim > 0) × E(Claim |Claim>0)。
大数据特征示例
- 临床数据:具体的检查指标、病史长度、并发症数量。
- 行为数据:每日步数、睡眠质量、运动频率(来自可穿戴设备)。
- 基因数据:特定疾病易感基因位点(受严格监管)。
挑战:数据标准化、隐私保护、模型可解释性。

健康保险精算需结合多源数据进行建模分析;大数据应用需符合《个人信息保护法》和医疗数据伦理规范。

编号

类型

领域

模型/方法

算法核心思想与步骤

算法逐步推理思考的数学方程式和数字/数值

关联知识 (法规/实务/优缺点)

226

健康险定价

长期医疗险

医疗通胀趋势预测模型 (Getzen Model / McMaster Model)

1. 目标:预测未来长期(如20-30年)的医疗费用增长率,这是长期医疗险定价和准备金评估最关键的假设之一。
2. 核心思想:医疗通胀并非孤立,它与宏观经济(如GDP增长)、人口结构、技术进步及政策调控强相关。模型旨在建立医疗费用增长与这些驱动因素之间的量化关系。
3. 步骤:a) 识别驱动因素(如人均GDP增长率、老龄化指数、医疗技术扩散指数)。b) 收集历史数据。c) 建立计量经济学模型(如多元回归、时间序列模型)拟合关系。d) 预测未来各驱动因素,代入模型得到医疗通胀预测。

Getzen Model简化形式
医疗费用增长率_t = α + β1 * GDP增长率_t + β2 * 老龄化率_t + β3 * 政策哑变量_t + ε_t
建模细节
- 数据:需至少10-20年的全国或地区级人均医疗支出、GDP、人口年龄结构数据。
- 参数估计:使用OLS或GMM等方法估计系数β。β1通常为正且大于1,表明医疗支出增长快于GDP增长。
- 外生预测:需独立预测未来GDP增长和人口结构变化。
- 调整:需结合专家判断,对模型结果进行合理性调整,并考虑中国特有的医保控费(如DRG/DIP)政策的压制效应。
:假设模型估计β1=1.2,未来5年GDP年均增长5%,则医疗费用基础增长率为6%。再叠加每年1%的老龄化影响,总医疗通胀预测为7%。

优点
1. 理论扎实,将医疗通胀与宏观经济根本动力挂钩。
2. 提供长期预测框架,优于简单历史平均法。
缺点
1. 对基础数据质量和长度要求高。
2. 模型参数可能随时间结构性变化(如医保改革)。
3. 预测结果对GDP等外生变量预测高度敏感。
实务:中国精算师在长期医疗险评估中,监管要求使用的医疗通胀假设不得低于3%。需结合国际模型与中国本土数据进行校准。

227

健康险定价/准备金

全健康险种

高额医疗费用建模与极值理论 (EVT) 应用

1. 问题:医疗费用分布高度右偏,少数特大额赔案(如器官移植、罕见病靶向药)对总赔款影响巨大。传统分布(如Gamma、对数正态)对尾部拟合不足。
2. 核心思想:EVT专门研究极端事件的统计规律。使用广义帕累托分布 (GPD)​ 对超过某一高阈值(Threshold)的损失额进行建模,以更准确地估计尾部风险和纯保费。
3. 步骤:a) 确定阈值u(如第95分位数)。b) 对超过u的所有损失额 X - u拟合GPD。c) 估计超出损失的条件分布和未决赔款准备金(IBNER)。

GPD分布函数
G(x; ξ, σ) = 1 - [1 + (ξ*x)/σ]^{-1/ξ}, for ξ≠0
其中,x > 0,σ > 0,ξ为形状参数。
建模细节
- 阈值选择:需权衡偏差与方差。常用方法有平均超额图、Hill图。
- 参数估计:采用极大似然估计(MLE)或矩估计法。
- 尾部估计:对于任意x > u,P(X > x) = P(X > u) * [1 - G(x-u)]
- 大额赔款准备金IBNER = E[X \| X > u] * P(X > u) * 未决案件数
:分析10万笔医疗赔案,确定阈值u=50万元。超过u的赔案有50笔,其超额额拟合GPD得到ξ=0.5,σ=30万。则可估计发生单笔超过100万元赔案的概率,以及为这些特大额案件需计提的准备金。

优点
1. 为极端尾部风险提供坚实的统计理论基础。
2. 能更准确地估计巨灾风险保费和资本要求。
缺点
1. 阈值选择主观,对结果影响大。
2. 极端数据稀少,参数估计可能不稳定。
3. 模型假设(独立同分布)在医疗赔案中可能不成立(如流行病)。
实务:常用于高端医疗、重疾险的定价和再保险安排,以及对未决赔款准备金进行压力测试。

228

健康险风险管理

长期/保证续保医疗险

续保率与选择性退保建模 (CAST模型)

1. 问题:在保证续保的长期医疗险中,健康体可能因保费上涨而退保(选择性退保),而病体因无法投保其他产品而留下,导致风险池恶化,引发“死亡螺旋”。
2. 核心思想累积反选择理论 (CAST)​ 将退保率建模为保费上涨幅度、被保险人健康状况和市场竞争的函数。退保概率与风险水平负相关。
3. 步骤:a) 将保单持有人按风险等级分组。b) 为每组估计一个退保函数,反映其续保意愿对保费变化的弹性。c) 在长期现金流预测中动态模拟各组的留存与退出。

退保率函数(简化)
LapseRate_i(t) = baseLapse_i + β_i * (PremiumIncrease(t) - CompetitorPriceAdvantage)
其中,i表示风险组别(如健康体、慢性病体),β_i为价格弹性系数(健康体的

β

229

健康险定价

全健康险种

基于微观模拟 (Microsimulation) 的定价模型

1. 核心思想:不依赖群体层面的聚合数据,而是模拟每个个体在保险期间内的健康状况演变、就医行为、理赔发生及金额,最后汇总得到总成本分布。这是一种“自下而上”的蒙特卡洛模拟方法。
2. 步骤:a) 构建虚拟人口,其人口学特征与目标市场一致。b) 为每个个体赋予初始健康状态(如健康、慢性病、癌症)。c) 定义状态转移矩阵(基于流行病学数据)。d) 在每次模拟中,根据转移概率和随机数决定个体是否患病、就医、产生理赔。e) 重复数千次模拟,得到总赔款的概率分布。

状态转移模型(以三状态为例)
状态:健康(H) -> 患病(S) -> 死亡(D) 或 康复(R)。
转移概率矩阵(年):
P = [[P(H->H), P(H->S), P(H->D)],
[P(S->H), P(S->S), P(S->D)],
[0, 0, 1 ]]
建模细节
- 数据:需要详细的流行病学数据(发病率、治愈率、死亡率)、医疗服务利用数据(门诊/住院概率、次均费用分布)。
- 关联性:可引入风险因子的相关性(如年龄与发病率正相关)。
- 政策影响:可模拟医保政策(如DRG支付)对个体就医选择和费用的影响。
- 输出:不仅得到期望赔款,还能得到赔款分布(如VaR, TVaR),用于资本计算。

优点
1. 灵活性极高,可评估复杂产品责任(如等待期、免赔额、限额、多次赔付)和动态策略(如费率调整)。
2. 能直观展示风险分布和尾部风险。
3. 便于进行情景测试和敏感性分析。
缺点
1. 模型构建复杂,计算成本高昂。
2. 对底层转移概率和费用分布的数据质量要求极高。
3. 模型校验困难。
实务:常用于创新产品(如带健康管理的保险)、评估医保支付改革(DRG/DIP)影响、以及为高端定制化产品定价。

230

健康险资本管理

全健康险种

健康险风险边际与资本要求模型 (Solvency II / C-ROSS)

1. 目标:计算为覆盖健康险业务(特别是长期保证续保业务)的非预期损失所需的经济资本或监管资本。
2. 核心:在最佳估计准备金(BEL)基础上,增加风险边际(RM)​ 以反映技术风险(如发病率、长寿、费用、退保风险)。在偿付能力体系下,还需计算资本要求(SCR)
3. 方法:通常采用成本资本法(Cost of Capital, CoC)​ 计算RM,采用情景法或内部模型法计算SCR。

风险边际(RM)计算(CoC法)
RM = ∑_{t>=0} (SCR_t * CoC_rate) / (1+r_{t+1})^{t+1}
其中,SCR_t是未来各时间点t的偿付能力资本要求预测,CoC_rate是资本成本率(如6%),r_{t+1}是无风险利率。
健康险SCR计算(标准公式简化)
SCR_健康 = BES * σ_健康,其中BES为健康险保费与准备金之和,σ_健康为监管给定的波动率系数(如15%)。对于长期险,还需考虑长寿风险、退保风险等模块。
建模细节
- 现金流投影:需在无风险利率下,对未来所有现金流(保费、赔款、费用、退保金)进行投影。
- 风险校准:σ系数或内部模型的风险参数需基于历史数据或行业基准校准。
- 聚合:健康险资本需与市场风险、信用风险等模块考虑相关性后聚合。

优点
1. CoC法与经济资本概念一致,被国际偿付能力标准广泛采用。
2. 标准公式提供了统一、可比的计算框架。
缺点
1. 标准公式的系数可能无法准确反映公司特定风险。
2. CoC法计算复杂,需要对未来多年的SCR进行预测。
3. 对长期医疗险的退保风险、医疗通胀风险难以量化。
实务:在中国偿二代(C-ROSS)二期下,健康险(尤其是保证续保产品)的风险资本要求被显著提高,要求公司持有更多资本以应对长期风险。精算师需定期进行资本评估和压力测试。

编号

类型

领域

模型/方法

算法核心思想与步骤

算法逐步推理思考的数学方程式和数字/数值

关联知识 (法规/实务/优缺点)

231

非寿险定价

财产险/巨灾险

巨灾模型 (Catastrophe Model)

1. 目标:量化地震、台风、洪水等极端自然巨灾事件的潜在损失,用于定价、累积风险管理和再保险安排。
2. 核心:由三大模块构成的物理随机模拟模型
a) 灾害模块:基于地理、气象数据生成上万次模拟的“事件集”,包含每个事件的强度、路径、发生概率。
b) 易损性模块:建立不同强度灾害(如风速、震级)对不同建筑结构造成损坏的“损失率函数”。
c) 金融模块:将物理损失转化为保险损失,考虑保单条件(免赔额、限额、分保结构)。

建模流程
1. 事件采样:从事件集中抽取N个事件,每个事件有年发生概率p_i和强度场。
2. 定位资产:将保险标的的地理位置(经纬度)和风险特征(建筑类型、价值)置于网格中。
3. 计算损失:对于每个事件和每个标的,根据其位置的灾害强度,通过易损性函数计算损失率,乘以保险价值得到损失额L_ij。
4. 聚合与调整:对单个事件,汇总所有标的损失,并应用保单条款:Insured Loss_i = Σ min( max(L_ij - Deductible, 0), Limit)
5. 生成损失超越曲线:将事件按损失降序排列,计算年超越概率 AEP = Σ_{k: Loss_k > x} p_k

优点
1. 为低频率、高损失的巨灾风险提供了科学的量化基础。
2. 能评估地域累积风险,指导再保险购买。
3. 输出结果(如PMLE、AEP)是资本模型的关键输入。
缺点
1. 是“黑箱”模型,高度依赖商业模型(如AIR、RMS)的参数和假设,透明度低。
2. 对历史数据稀有的新型风险(如气候变迁下的极端降水)预测不确定性大。
3. 模型购置和维护成本高昂。
实务:是偿付能力II和偿二代下计算巨灾风险资本要求的核心工具。保险公司需进行模型验证,包括与历史损失对比、进行敏感性测试。

232

再保险定价

非寿险/再保险

暴露定价法与暴露曲线 (Exposure Rating)

1. 适用场景:为新业务、缺乏可靠历史损失数据的业务或作为损失成本法的补充进行再保险定价。
2. 核心思想:不直接使用分入方的历史损失数据,而是使用行业标准暴露曲线(反映损失额分布)和分入方的风险暴露信息(如总保额、风险分布),来估计再保险层(如超赔层)的预期损失。
3. 步骤:a) 获取分入方业务的风险特征和保额分布。b) 选择或拟合合适的暴露曲线。c) 计算每个风险单位的预期损失在再保险层的分摊比例。d) 汇总得到再保层的纯风险保费。

关键公式
对于超赔再保险(起赔点A,限额L),单个风险单位(保额SI)的预期损失进入该层的比例为:
ELR_layer = (G((A+L)/SI) - G(A/SI)) / (1 - G(A/SI))
其中 G(x)暴露曲线,表示损失额不超过保额比例x的累积概率。
建模细节
- 暴露曲线来源:常用行业曲线(如Lloyd‘s曲线、ReMetrica曲线)或根据公司自身大额损失数据拟合。
- 保额分布:需知不同保额段的风险数量或总保额,而非简单平均。
- 基础损失率:需要估计总预期损失率(ELR)或赔款与保额比(L/S)。
:某火险业务,总保额10亿,选用行业曲线。计算对于起赔点1000万、限额1000万的超赔层,ELR_layer = 2.5%。若基础ELR为1%,则再保层纯风险保费 = 10亿 * 1% * 2.5% = 2.5万元。

优点
1. 不依赖分入方特定损失数据,可用于新业务或数据质量差的业务。
2. 相对客观,基于行业经验。
3. 能快速评估再保结构的成本。
缺点
1. 假设风险同质,可能无法反映分入方特定的风险质量或承保水平。
2. 对暴露曲线的选择非常敏感,曲线未必适用于所有业务类型。
3. 忽略了损失频率,只关注损失严重程度分布。
实务:常与损失成本法结合,作为交叉验证。在比例再保险定价中,也可使用暴露法评估分保佣金和利润佣金。

233

企业风险管理

全险种

动态财务分析 (DFA)

1. 目标:在随机的经济和承保环境下,模拟保险公司未来多年(如5-10年)的完整财务报表和资本状况,评估战略决策(如业务组合、投资策略、再保险安排)对公司价值、盈利和偿付能力的影响。
2. 核心:一个多情景、多年度、整合性的蒙特卡洛模拟模型,将资产模型、负债模型、资本模型和公司策略规则(如分红、增资)动态耦合。
3. 步骤:a) 生成未来各年的随机经济情景(利率、股市)和保险风险情景(赔付、费用)。b) 根据公司策略,逐年计算资产负债表、利润表和现金流。c) 重复数千次,得到关键财务指标(如净资产、综合成本率、偿付能力充足率)的分布。

模型架构
Capital_t = Capital_{t-1} + (UnderwritingProfit_t + InvestmentIncome_t - Tax_t - Dividend_t + Other_t)
其中每一项都是随机变量或依赖于随机变量的函数。
建模细节
- 风险相关:必须定义承保风险(如赔付)与投资风险(如股市)之间的相关性(如灾难年可能伴随低利率和低股市)。
- 策略反馈:模型需嵌入管理规则,如“当偿付能力充足率低于150%时,停止分红并启动增资”。
- 输出分析:主要输出是目标指标(如破产概率、资本回报率分布)以及各输入变量对结果的敏感性分析风险贡献度分析
:模拟10,000次未来5年的路径,统计第5年末净资产为负(技术性破产)的路径有150次,则5年破产概率为1.5%。

优点
1. 提供前瞻性、动态的全面风险视图,是ORSA(自有风险与偿付能力评估)的核心工具。
2. 能评估战略决策的长期影响和交互效应。
3. 帮助识别主要风险驱动因素和资本优化机会。
缺点
1. 模型极其复杂,构建、维护和验证成本极高。
2. 结果严重依赖于模型假设(如风险分布、相关性、管理策略),存在“垃圾进,垃圾出”的风险。
3. 计算量大,运行时间长。
实务:是大型保险公司和集团进行资本规划、并购评估和压力测试的战略级工具。监管机构鼓励使用DFA进行更深入的风险评估。

234

数据科学应用

理赔/运营

自然语言处理 (NLP) 在理赔文本自动化分类中的应用

1. 问题:理赔报案描述、查勘报告、医疗病历等非结构化文本数据蕴含巨大价值,但人工处理效率低、成本高。
2. 目标:利用NLP技术自动从文本中提取关键信息,进行分类(如事故责任、欺诈嫌疑、损伤部位)或实体识别(如人名、地点、车辆部件),以辅助理赔审核、风险分级和流程自动化。
3. 方法:a) 文本预处理(分词、去停用词)。b) 文本向量化(如TF-IDF, Word2Vec, BERT嵌入)。c) 训练监督分类模型(如SVM、随机森林、神经网络)。

典型流程
1. 数据标注:人工对历史理赔文本标注分类标签(如“责任明确-本方全责”、“责任争议”、“单方事故”)。
2. 特征工程:传统方法使用TF-IDF矩阵;深度学习方法使用预训练词向量或上下文嵌入(如BERT的[CLS] token向量)。
3. 模型训练与评估:将数据集分为训练集、验证集、测试集。评估指标包括准确率、精确率、召回率、F1分数。
4. 部署与应用:模型集成到理赔核心系统,对新报案文本进行实时分类,将高欺诈风险或复杂案件自动路由给资深审核员。
:车险报案描述:“我车在路口左转时,对方直行车速很快撞到我右侧车门。” 模型应能提取关键实体(“左转车”、“直行车”),并分类为“责任初步判定-转弯未让直行,本方主责”。

优点
1. 极大提升非结构化数据处理效率和一致性。
2. 实现理赔案件的智能路由和优先处理,优化运营资源。
3. 能从海量文本中发现人工难以察觉的欺诈模式。
缺点
1. 需要大量高质量的标注数据,标注成本高。
2. 模型可解释性差,作为辅助工具时,仍需人工复核关键决策。
3. 对领域特定术语和表述(如医学、法律术语)需要针对性的预训练或微调。
实务:是保险科技(InsurTech)的核心应用之一。结合OCR(识别图片/扫描件文字)和RPA(机器人流程自动化),可实现从报案到支付的端到端智能化理赔。

235

金融建模

资产端/ALM

利率期限结构模型 (CIR, Hull-White)

1. 目标:在资产负债管理(ALM)和金融衍生品定价中,对未来的无风险利率路径进行随机模拟,以评估利率风险、计算嵌入式期权价值(如退保期权)和进行经济价值评估。
2. 核心:用一个或一组随机微分方程(SDE)来描述短期利率的演变过程,并确保模型能拟合当前的利率期限结构(即初始收益率曲线)。
3. 常用模型
- CIR模型:保证利率非负,常用于经济情景生成。
- Hull-White模型:均值回归过程,能完美拟合初始期限结构,常用于负债公允价值评估。

Hull-White单因子模型 SDE
dr(t) = [θ(t) - a*r(t)]dt + σ dW(t)
其中:
- r(t):短期瞬时利率。
- a:均值回归速度。
- σ:波动率。
- θ(t):时间函数,用于拟合初始期限结构。
- dW(t):维纳过程(随机项)。
建模细节
- 校准:利用当前市场上的利率互换、利率上限/下限期权价格,通过优化算法反解出参数aσ,并确定θ(t)
- 模拟:使用欧拉离散化等方法,生成未来多年的多条利率路径。
- 应用:在每条路径下,折现未来的保险现金流,得到负债的市场价值分布;或计算含权资产(如可赎回债券)的价值。
:评估一份含有高保证利率的储蓄型保单。当模拟的未来利率路径持续走低时,保单的保证利率显得更有价值,负债公允价值上升;反之则下降。通过数千次模拟,可以得到该负债公允价值的一个概率分布。

优点
1. 提供了对利率风险的动态、随机建模框架,比静态的久期-凸度分析更精确。
2. Hull-White等无套利模型能确保估值与当前市场一致。
3. 是计算有效久期有效凸度,以及评估嵌入式期权风险的基础。
缺点
1. 模型复杂,参数校准需要深厚的金融工程知识和市场数据。
2. 单因子模型假设所有利率变动完全相关,可能无法完美反映收益率曲线的复杂变化(如扭转)。
3. 模型风险高,参数估计的不确定性会传导至结果。
实务:在IFRS 17和偿付能力II/偿二代下,用于计算金融假设变化对负债公允价值的影响,是ALM和风险管理的关键工具。

编号

类型

领域

模型/方法

算法核心思想与步骤

算法逐步推理思考的数学方程式和数字/数值

关联知识 (法规/实务/优缺点)

236

寿险精算

长期险/重疾险

多状态马尔可夫模型 (Multi-State Markov Model)

1. 核心思想:将被保险人的健康状况建模为多个离散状态(如“健康”、“患病”、“残疾”、“死亡”)之间的随机转移过程。转移强度(瞬时发生率)是年龄和时间的函数。
2. 应用:为包含多种给付责任(如重疾、失能、身故)的复杂长期健康险(如重疾险、长期护理险)进行定价和准备金评估。
3. 步骤:a) 定义状态空间和可能的转移路径。b) 基于人口或经验数据估计转移强度 μ_{ij}(x)(从状态i到状态j,在年龄x时的强度)。c) 求解Kolmogorov前向微分方程,计算转移概率 p_{ij}(x, t)。d) 基于转移概率计算保险责任的精算现值。

Kolmogorov前向方程
d/dt p_{ij}(x, t) = Σ_{k≠j} [p_{ik}(x, t) * μ_{kj}(x+t)] - p_{ij}(x, t) * Σ_{k≠j} μ_{jk}(x+t)
精算现值计算
对于在状态j持续期间每年给付1元的年金,其现值为:
ä_x^j = ∫_0^∞ v^t * p_{jj}(x, t) dt
其中 p_{jj}(x, t)为从x岁开始,在t时刻仍处于状态j的概率。
:一个三状态模型(健康H,重疾S,死亡D)。定价一个保额为10万元的重疾险,等待期90天。需计算从H到S的转移强度 μ_HS,并考虑等待期内患病不赔的条款。

优点
1. 能精确刻画复杂保险责任(如多次给付、状态依赖给付)和保单条件(如等待期、生存期)。
2. 理论严谨,是处理多状态风险的标准框架。
缺点
1. 数据要求极高,需要详细的个体状态转移历史数据来可靠估计转移强度。
2. 模型假设转移强度仅依赖于当前年龄和状态(马尔可夫性),可能忽略停留时间的影响(需用半马尔可夫模型)。
3. 计算复杂,尤其是状态较多时。
实务:中国重疾表(2020)的编制部分采用了多状态模型思想。IFRS 17下,对含有多重保障的合同进行分组和现金流预测时,也常借助此模型。

237

寿险精算

产品开发/评估

利润测试 (现金流预测) 模型

1. 核心思想:在特定经济与经营假设下,预测新业务或有效业务在未来整个保单期间内的年度现金流,并计算关键盈利指标(如净现值NPV、内部收益率IRR、新业务价值NBV),以评估产品的盈利能力和可行性。
2. 步骤:a) 建立保单模型(包括保费、保额、责任、退保规则)。b) 设定精算假设(死亡率、发病率、退保率、费用率、投资收益率、税率)。c) 逐年计算:保费收入、理赔支出、费用支出、准备金提转差、税金、股东现金流。d) 以风险贴现率(RDR)将股东税后利润折现,得到利润现值。

关键公式
年度税后利润_t = 保费收入_t - 理赔支出_t - 费用支出_t - 准备金增加_t - 税金_t
股东现金流_t = 税后利润_t - 资本需求释放_t
NPV = Σ_{t=0}^n 股东现金流_t / (1+RDR)^t
IRR是使NPV=0的折现率。
新业务价值 (NBV):通常指首年新业务在销售时点的NPV。
:测试一款终身寿险,假设RDR=10%。预测未来30年现金流,计算得NPV为正值,IRR为12%,表明产品在给定假设下能为股东创造价值。

优点
1. 是产品定价、价值管理和资本规划的核心工具。
2. 能进行敏感性测试,识别关键风险驱动因素(如死亡率、利率、退保率)。
3. 为内含价值(EV)计算提供基础。
缺点
1. 结果高度依赖于假设,尤其是长期投资收益率和风险贴现率。
2. 通常是确定性测试,未充分考虑随机波动(需结合随机模拟)。
3. 模型复杂,维护成本高。
实务:是监管报备新产品和公司内部决策的必备分析。需进行不利情景测试(如利率下降50个基点、死亡率恶化10%),以评估产品韧性。

238

寿险估值

公司估值/财务报告

内含价值 (EV) 与评估价值 (AV) 评估模型

1. 核心思想:EV反映保险公司现有业务(有效业务)的经济价值,等于调整后净资产 (ANAV)​ 加上有效业务价值 (VIF),再扣除持有要求资本的成本 (CoC)。AV则在EV基础上加上未来新业务价值的现值,反映公司持续经营价值。
2. 步骤:a) 计算ANAV:以市场价值评估资产,调整负债(如剔除递延税、评估准备金等)。b) 计算VIF:对有效业务未来可分配股东利润进行预测并折现(使用风险贴现率RDR)。c) 计算要求资本及其成本。d) EV = ANAV + VIF - CoC。e) AV = EV + 未来新业务价值现值。

标准公式 (中国精算师协会)
EV = 自由盈余 + (要求资本 - 持有要求资本的成本) + 有效业务价值
其中,有效业务价值 = Σ_t (预计未来股东税后利润_t) / (1+RDR)^t
要求资本的成本 = 要求资本 × (RDR - 投资收益率)
关键假设:RDR(通常为无风险利率+风险溢价)、投资收益率、死亡率、发病率、费用率、退保率。
:某寿险公司评估日ANAV为500亿,VIF为300亿,要求资本为100亿,假设RDR=10%,投资收益率=5%。则CoC = 100亿 × (10%-5%) = 5亿。EV = 500 + 300 - 5 = 795亿。

优点
1. 比传统会计利润更能反映寿险业务的长期价值和盈利能力。
2. 是资本市场对保险公司进行估值(P/EV倍数)的核心基准。
3. 有助于管理层进行基于价值的决策。
缺点
1. 计算复杂,严重依赖长期经济与精算假设,主观性强。
2. 不同公司假设不同,导致EV可比性受限。
3. 对利率和投资收益率非常敏感。
实务:上市保险公司需定期披露EV报告。EV评估需遵循《精算实践标准:人身保险内含价值评估标准》。RDR的设定是争议焦点,通常参考长期国债收益率加上300-400个基点的风险溢价。

239

偿付能力

全险种/监管

偿二代 (C-ROSS) 保险风险最低资本标准公式计算

1. 核心思想:根据中国偿二代监管规则,保险风险最低资本(MC)采用综合因子法计算,公式为 MC = 风险暴露 (EX) × 风险因子 (RF),其中 RF = RF0 × (1+K)RF0为基础因子,K为特征因子(由多个特征系数k_i相加得到)。
2. 步骤:a) 识别业务类型(如车险、非车险、寿险、健康险等)。b) 确定各类型的风险暴露EX(如自留保费、未决赔款准备金)。c) 查找监管规则中的基础因子RF0。d) 根据公司自身风险特征计算特征因子K(如综合成本率、回溯偏差率、分保比例等)。e) 计算各子模块资本,再通过相关系数矩阵聚合。

非寿险保费风险示例 (车险)
EX= 最近12个月自留保费。
RF0由监管给定(如车险为0.15)。
K = k1 + k2 + k3 + k4 + k5,其中:
k1基于最近6个月综合成本率(≤95%则k1=-0.05),k2基于6个月综合成本率变动,k3基于非比例分保净分出比例,k4k5为调控系数。
聚合公式
MC_保险风险 = sqrt( MC_保费及准备金^2 + MC_巨灾^2 + 2*ρ*MC_保费及准备金*MC_巨灾 ),其中ρ为相关系数(如0.25)。

优点
1. 简单透明:规则明确,计算相对简单,便于监管和比较。
2. 风险敏感:通过特征因子K引入公司个体风险特征。
3. 中国特色:考虑了回溯偏差等中国市场的特定风险。
缺点
1. 过于简化:因子法可能无法完全捕捉公司特有的风险轮廓,尤其是尾部风险。
2. 顺周期性:特征因子(如基于近期综合成本率)可能加剧资本要求的顺周期波动。
3. 对新型风险反应滞后:标准公式更新慢,难以快速反映新兴风险(如网络安全风险)。
实务:是绝大多数中国保险公司计算监管资本的方法。对于风险复杂的公司,可申请使用内部模型,但审批严格。

240

养老金精算

企业年金/社保

给付分配法 (Projected Unit Credit Method, PUC)

1. 核心思想:将雇员在退休时预计能获得的总养老金给付,按服务期比例分配到其职业生涯的每一年。每年确认的养老金成本(服务成本)等于当年服务所“赚得”的那部分未来给付的精算现值。
2. 步骤:a) 预测雇员退休时的最终工资。b) 根据养老金计划公式(如:退休前平均工资 × 服务年限 × 1%),计算预计退休时总给付额。c) 将该总给付额按服务年限比例分配至截至评估日的已服务年度。d) 计算累计给付义务 (ABO)​ 和预计给付义务 (PBO)

关键公式
PBO_x = (预计退休时年薪 × 给付比例 × 已服务年限) × 从退休年龄y到死亡的年金现值因子 × 从x岁存活到y岁的概率 × v^(y-x)
服务成本服务成本_t = PBO_t - PBO_{t-1} + 利息成本 - 当期支付
利息成本利息成本 = PBO_{t-1} × 折现率
:员工30岁加入,预计65岁退休,计划公式为退休前5年平均工资的2%乘以服务年限。当前40岁,已服务10年,预计退休时年薪为50万元。则截至40岁的PBO需计算:已赚得的年养老金 = 50万 × 2% × 10年 = 10万元/年。然后将这笔从65岁开始的生存年金,考虑生存概率和折现,折现到40岁时的现值。

优点
1. 匹配原则:将养老金成本与雇员提供服务期间相匹配,符合权责发生制会计原则。
2. 国际通用:是国际会计准则(IAS 19)和美国会计准则(ASC 715)推荐的主要方法。
3. 透明度高:能清晰显示养老金负债的积累过程。
缺点
1. 对假设敏感:严重依赖对最终工资、离职率、死亡率、折现率的长期假设。
2. 波动性:因折现率变动导致的精算损益会直接计入损益表或其他综合收益(OCI),引起利润波动。
3. 计算复杂:需要对每个雇员或同质雇员组进行计算。

241

养老金精算

企业年金/会计

精算损益的确认与摊销 (Corridor Approach)

1. 问题:由于实际经验(如投资回报、工资增长)与精算假设的差异,以及折现率变动,会产生精算损益,导致养老金负债(PBO)和计划资产公允价值剧烈波动。
2. 核心思想:为平滑利润表影响,IAS 19允许采用“走廊法”延迟确认精算损益。仅当累计未确认精算损益超过“走廊”(即PBO与计划资产市场价值两者中较大者的10%)时,才将超出部分在预计剩余平均服务年限内进行摊销,计入当期损益。
3. 步骤:a) 计算当期产生的精算损益。b) 计算累计未确认精算损益。c) 计算“走廊”限额。d) 如果累计未确认精算损益超过走廊,则将超出部分除以预计剩余平均服务年限,得到本期摊销额。

计算公式
走廊限额 = Max(PBO期初, 计划资产市场价值期初) × 10%
本期摊销额 = (累计未确认精算损益 - 走廊限额) / 预计剩余平均服务年限
预计剩余平均服务年限:指当前仍参与计划的雇员,预计未来将继续为公司服务的平均年数。
:期初PBO为1亿,计划资产为0.9亿。累计未确认精算损益为1500万(损失)。走廊限额 = Max(1亿, 0.9亿) × 10% = 1000万。超出部分 = 1500万 - 1000万 = 500万。假设平均剩余服务年限为10年,则本期摊销额 = 500万 / 10 = 50万,计入利润表。

优点
1. 平滑利润:避免精算假设的短期波动对当期利润造成过大冲击,使财务报表更稳定。
2. 操作性强:提供了明确的计算规则。
缺点
1. 延迟反映:未能及时在损益表中反映养老金计划的真实经济状况变化。
2. 主观性:“预计剩余平均服务年限”的估计具有主观性。
3. 复杂性:增加了会计处理的复杂性。
实务:IAS 19也允许企业选择将全部精算损益立即计入其他综合收益 (OCI),从而避免摊销。许多公司选择OCI法以简化处理并提高透明度。

242

经验分析

死亡率/索赔率

修匀技术 - Whittaker-Henderson方法

1. 问题:原始经验数据(如分年龄死亡率、索赔频率)由于样本量小,往往呈现不规则波动。修匀旨在消除随机波动,揭示潜在趋势,得到平滑、合理的估计值。
2. 核心思想:在拟合优度(接近原始数据)和平滑度(相邻年龄间变化平缓)之间寻求最优平衡。通过最小化一个包含拟合误差惩罚项和平滑度惩罚项的目标函数来实现。
3. 步骤:a) 设定修匀后的值 f_x(x=1,2,...,n)。b) 构建目标函数:Z = Σ w_x (y_x - f_x)^2 + λ Σ (Δ^m f_x)^2。c) 选择平滑参数λ和差分阶数m(常用m=2,惩罚二阶差分,即曲率)。d) 求解使Z最小化的 f_x序列。

目标函数
Z = Σ_{x=1}^n w_x (y_x - f_x)^2 + λ Σ_{x=1}^{n-m} (Δ^m f_x)^2
其中:
y_x:原始观察值(如死亡率)。
f_x:修匀后的值。
w_x:权重(通常与暴露数E_x成正比,w_x = E_x)。
λ:平滑参数,控制平滑程度(λ越大,结果越平滑)。
Δ^2 f_x = f_{x+2} - 2f_{x+1} + f_x(二阶差分)。
求解:对目标函数Z关于所有f_x求偏导并令其为零,得到一个线性方程组,可用矩阵运算求解。

优点
1. 灵活可控:通过调整λ,可在拟合与平滑之间取得理想平衡。
2. 局部适应:权重w_x允许对数据质量不同的年龄点给予不同重视。
3. 理论优美:是经典的修匀方法,被广泛研究和应用。
缺点
1. 参数选择主观:λ和m的选择缺乏客观标准,依赖精算师判断。
2. 端点问题:序列两端的修匀效果可能不佳。
3. 可能过度平滑:如果λ过大,会掩盖真实的局部变化特征。
实务:广泛用于生命表编制、车险费率因子平滑。现代方法也使用样条修匀贝叶斯分层模型

243

信度理论

非寿险定价

Bühlmann-Straub信度模型

1. 核心思想:在经验费率厘定中,如何将个体风险的经验数据与整体风险的经验数据相结合。该模型是Bühlmann模型的推广,适用于不同风险单位具有不同风险暴露(如车数、保费)​ 的情形。
2. 目标:估计第i个风险在第n+1期的纯保费 μ_i。信度估计量是个人经验均值与总体均值的加权平均:Z * 个人经验均值 + (1-Z) * 总体均值
3. 步骤:a) 计算过程方差(EPV,衡量风险内部波动)和假设均值方差(VHM,衡量风险间差异)。b) 计算信度因子Z。

模型设定
设有k个风险,风险i有m_i个观察期。X_{it}为风险i在第t期的损失率(总损失/风险暴露P_{it})。
个体均值\bar{X}_i = (Σ_t P_{it} X_{it}) / P_i,其中P_i = Σ_t P_{it}
总体均值\bar{X} = (Σ_i P_i \bar{X}_i) / Σ_i P_i
过程方差 (EPV) 估计\hat{v} = Σ_i Σ_t P_{it} (X_{it} - \bar{X}_i)^2 / Σ_i (m_i - 1)
假设均值方差 (VHM) 估计\hat{a} = [ Σ_i P_i (\bar{X}_i - \bar{X})^2 - (k-1)\hat{v} ] / [ Σ_i P_i - (Σ_i P_i^2)/(Σ_i P_i) ]
信度因子Z_i = P_i / (P_i + \hat{v}/\hat{a})
信度保费\hat{μ}_i = Z_i \bar{X}_i + (1-Z_i) \bar{X}

优点
1. 处理异质暴露:能妥善处理不同风险单位规模不同的情况,是实务中最常用的信度模型之一。
2. 最优线性无偏预测 (BLUP):在平方损失函数下,信度估计量是最优的。
缺点
1. 参数估计不稳定:当风险数量k较少时,VHM的估计值\hat{a}可能为负(无意义),需进行调整。
2. 分布假设:模型隐含了损失服从特定分布的假设(如正态),可能与实际不符。
3. 未考虑时间趋势:基本模型假设风险参数不随时间变化。
实务:广泛应用于车险、工伤险的经验费率调整奖惩系统 (BMS)​ 的构建。

244

随机模拟

依赖关系建模

Copula函数在聚合风险模型中的应用

1. 问题:在计算经济资本或进行动态财务分析时,需要模拟多个相关风险因子(如股市回报、利率、巨灾损失、死亡率)的联合分布。它们的边缘分布可能不同,且相关性非线性。
2. 核心思想:Copula是一种将多个随机变量的边缘分布与其依赖结构分离建模的工具。Sklar定理指出,任何多元联合分布函数都可以用其边缘分布和一个Copula函数表示:F(x1, x2, ..., xn) = C(F1(x1), F2(x2), ..., Fn(xn))
3. 步骤:a) 为每个风险因子拟合边缘分布。b) 选择合适的Copula函数(如Gaussian, t, Clayton, Gumbel)并估计其参数。c) 使用Copula生成具有指定依赖结构的联合随机样本。

Sklar定理
H(x, y) = C(F(x), G(y)),其中H是联合分布,FG是边缘分布,C是Copula函数。
模拟步骤(以Gaussian Copula为例)
1. 估计各风险因子的边缘分布 F_i
2. 估计相关系数矩阵 Σ(描述风险因子间的线性相关)。
3. 生成来自多元正态分布 N(0, Σ)的样本 (z1, z2, ..., zn)
4. 通过标准正态CDF转换:u_i = Φ(z_i),得到在[0,1]上均匀分布且具有指定相关性的样本。
5. 应用边缘分布的反函数:x_i = F_i^{-1}(u_i),得到最终的相关样本。
:模拟股市回报(边缘分布为t分布)和利率变化(边缘分布为正态分布)的相关性。使用t-Copula可以捕捉尾部相关性(即极端事件同时发生的可能性更高)。

优点
1. 灵活性:可以自由组合不同的边缘分布,并灵活地建模各种依赖结构(如非对称、尾部相关)。
2. 广泛应用:是金融和保险领域聚合风险、资产配置、衍生品定价的标准工具。
缺点
1. Copula选择困难:选择错误的Copula函数会严重扭曲依赖关系,尤其是尾部相关性。
2. 参数估计复杂:高维情况下的参数估计和模拟计算量巨大。
3. 静态依赖:大多数Copula模型假设依赖结构不随时间变化,这可能不符合实际。
实务:在Solvency II和C-ROSS的内部模型中,常用Copula(特别是t-Copula)来聚合市场风险、保险风险、信用风险等模块,以计算整体经济资本。

245

随机模拟

蒙特卡洛模拟

拉丁超立方抽样 (Latin Hypercube Sampling, LHS)

1. 问题:传统的蒙特卡洛随机抽样在模拟高维、低概率事件时效率低下,需要大量模拟次数才能获得稳定的结果,计算成本高。
2. 核心思想:一种分层抽样技术,确保每个输入随机变量的整个分布范围都被均匀地抽样到,从而用更少的模拟次数达到与传统蒙特卡洛方法相同的精度。
3. 步骤:a) 确定要模拟的N个随机变量及其分布。b) 确定模拟次数M。c) 将每个随机变量的累积分布函数(CDF)范围[0,1]等分为M个区间。d) 在每个区间内随机抽取一个值。e) 将M个区间内的抽样值随机配对,形成M个模拟情景。

算法流程
设模拟次数M=1000,有2个随机变量X(正态分布)和Y(对数正态分布)。
1. 将X的CDF范围[0,1]分为1000个等宽区间:[0, 0.001), [0.001, 0.002), ..., [0.999, 1]
2. 在每个区间内随机取一点,如第i个区间取 u_i^X ~ Uniform((i-1)/M, i/M)
3. 对Y进行同样操作,得到 u_i^Y
4. 将 {u_i^X}{u_i^Y}这两个序列随机打乱顺序后配对,得到 (u_1^X, u_1^Y), ..., (u_M^X, u_M^Y)。这一步是关键,它打破了变量间的强制排序,允许任何相关性结构(需结合其他方法,如Copula)。
5. 通过反函数 x_i = F_X^{-1}(u_i^X), y_i = F_Y^{-1}(u_i^Y)得到样本。

优点
1. 高效:相比简单随机抽样,LHS能以更少的模拟次数(通常少一个数量级)达到相同的估计精度,尤其适用于计算尾部风险度量(如VaR, TVaR)。
2. 全面覆盖:强制样本覆盖每个变量的整个分布范围,避免抽样盲区。
3. 易于实现:算法相对简单。
缺点
1. 打乱顺序可能破坏相关性:如果直接随机打乱,会破坏变量间预设的相关性。需与中值拉丁超立方抽样或结合Copula的方法一起使用,以保持相关性结构。
2. 对非连续分布效果减弱:对于离散分布或混合分布,分层优势可能不明显。
实务:广泛用于经济资本计算、动态财务分析(DFA)、期权定价等需要大量模拟的领域,以节省计算时间。

246

资本模型

全险种

风险调整资本回报率 (RAROC) 与经济资本配置

1. 核心思想:将经济资本作为稀缺资源进行配置,以风险调整后的收益率作为决策依据。RAROC = (预期收益 - 预期损失 - 成本) / 经济资本。通过比较不同业务线或产品的RAROC,优化资本配置,将资本分配给能创造最高风险调整回报的单位。
2. 步骤:a) 计算各业务单元(BU)的预期利润。b) 使用内部模型或监管标准公式计算各BU占用的经济资本(EC)。c) 计算各BU的RAROC。d) 设定公司整体的最低资本回报率 hurdle rate(通常基于资本成本)。e) 将资本优先配置给RAROC高于hurdle rate的BU,并削减或退出RAROC低的业务。

RAROC计算公式
RAROC = (净收入 - 预期损失) / 经济资本
其中,净收入通常指风险调整后的利润,可能扣除资本成本。
经济资本配置:常用欧拉分配法,即每个BU的边际资本贡献等于其经济资本。总经济资本 EC_total = Σ EC_i
边际RAROC:增加一单位资本到某BU所带来的RAROC变化,用于增量决策。
:车险BU预期利润1亿,占用经济资本8亿,RAROC=12.5%。健康险BU预期利润0.5亿,占用经济资本3亿,RAROC=16.7%。若hurdle rate为12%,则两者都达标,但健康险的资本使用效率更高。

优点
1. 风险与收益结合:将收益与所承担的风险直接挂钩,鼓励承担“有效风险”。
2. 优化资源配置:为业务决策(定价、承保、投资)提供统一的衡量标准。
3. 与股东价值创造一致:通常,RAROC高于资本成本(COC)的业务创造股东价值。
缺点
1. 经济资本计算的不确定性:EC的估计本身存在模型风险,影响RAROC的可靠性。
2. 忽略协同效应:简单加总的资本配置可能忽略业务间的风险分散效应。
3. 可能引发短期行为:管理者可能为提升短期RAROC而拒绝有长期价值但短期占用资本多的项目。
实务:是保险公司资产负债管理 (ALM)​ 和战略规划的核心工具。需与经济增加值 (EVA)​ 等指标结合使用。

247

风险管理

全险种

压力测试与情景分析

1. 定义压力测试评估公司在极端但可能发生的不利情景下的资本充足性和盈利能力。情景分析则评估在多种可能未来情景(包括有利和不利)下的结果。
2. 核心思想:通过构造极端或特殊情景,定性或定量地分析其对公司的潜在影响,以识别脆弱性、评估风险承受能力、制定应急预案。
3. 步骤:a) 情景设计:基于历史事件(如2008金融危机)、假设性事件(如特大疫情)或监管规定情景(如偿二代压力测试)。b) 影响传导:明确情景如何影响关键风险因子(如利率、股市、索赔率)。c) 建模计算:在情景下重新计算财务指标(如偿付能力充足率、净利润)。d) 结果分析与应对:评估影响程度,制定缓解措施(如调整投资组合、购买再保险)。

常见监管压力情景 (C-ROSS)
1. 利率风险:收益率曲线平行上移/下移100个基点。
2. 权益价格风险:沪深300指数下跌30%。
3. 房地产价格风险:投资性房地产价格下跌20%。
4. 汇率风险:人民币对美元贬值10%。
5. 保险风险:非寿险赔付率上升10个百分点;寿险死亡率/发病率恶化15%。
公司自定义情景
- 疫情情景:医疗险索赔激增,投资市场暴跌。
- 网络攻击情景:核心系统瘫痪,造成巨额营业中断损失和客户数据泄露赔偿。
输出:压力测试报告,展示关键指标在基准情景和压力情景下的对比。

优点
1. 前瞻性:帮助公司思考“如果...会怎样”的问题,弥补了VaR等基于历史数据方法的不足。
2. 沟通工具:向董事会和监管机构清晰展示公司的风险轮廓和韧性。
3. 满足监管:是偿二代第二支柱(定性监管要求)的核心组成部分。
缺点
1. 情景选择主观:难以确保覆盖所有“未知的未知”。
2. 模型风险:在极端情景下,模型假设(如线性关系)可能失效。
3. 可能引发过度反应:对极端但概率极低的情景过度准备,可能导致资本效率低下。
实务:需定期(如每季度)进行,并纳入公司的风险偏好框架。结果用于恢复与处置计划的制定。

248

数据科学

客户管理/营销

聚类分析用于客户细分与精准营销

1. 问题:保险公司拥有海量客户数据,需要识别具有相似特征和需求的客户群体,以便进行差异化产品设计、定价、服务和营销。
2. 核心思想无监督学习方法,将客户按照多个变量(如人口统计、保单特征、理赔历史、消费行为)的相似性自动分组,使得组内客户高度相似,组间客户差异明显。
3. 步骤:a) 数据准备与特征选择。b) 数据标准化。c) 选择聚类算法(如K-Means, DBSCAN, 层次聚类)。d) 确定最佳聚类数量(如肘部法则、轮廓系数)。e) 解释聚类结果,为每个群体打标签(如“高价值低风险家庭”、“年轻单身高风险司机”)。

K-Means算法流程
1. 随机选择K个点作为初始聚类中心。
2. 分配步骤:将每个数据点分配到距离其最近的聚类中心所在的簇。
3. 更新步骤:重新计算每个簇中所有点的均值,作为新的聚类中心。
4. 重复步骤2和3,直到聚类中心不再变化或达到最大迭代次数。
目标函数(误差平方和SSE)
`SSE = Σ{i=1}^K Σ{x∈C_i}

249

时间序列

非寿险/预测

时间序列模型用于索赔次数/频率预测

1. 问题:预测未来一段时间(如下一季度、下一年)的索赔次数或频率,用于业务规划、预算编制和准备金评估。
2. 核心思想:利用历史数据中存在的趋势季节性自相关模式,建立数学模型进行外推预测。常用模型包括ARIMA季节性ARIMA (SARIMA)​ 和状态空间模型
3. 步骤:a) 数据平稳化检验(如ADF检验)。b) 识别模型阶数(p, d, q)。c) 参数估计。d) 模型诊断(残差白噪声检验)。e) 预测与预测区间计算。

ARIMA(p,d,q)模型
(1 - φ_1B - ... - φ_pB^p) (1-B)^d Y_t = c + (1 + θ_1B + ... + θ_qB^q) ε_t
其中:
Y_t:时间序列在t时刻的值。
B:后移算子,B Y_t = Y_{t-1}
d:差分阶数,使序列平稳。
p:自回归阶数。
q:移动平均阶数。
ε_t:白噪声误差项。
SARIMA(p,d,q)(P,D,Q)_s模型:额外考虑周期为s的季节性成分。
:预测月度车险索赔次数。数据显示明显的年度季节性(s=12)。经过一阶非季节性差分(d=1)和一阶季节性差分(D=1)后序列平稳。通过自相关图(ACF)和偏自相关图(PACF)识别出 p=1, q=1, P=1, Q=1。拟合SARIMA(1,1,1)(1,1,1)_12模型进行预测。

优点
1. 捕捉动态模式:能有效建模时间序列中的趋势、周期和自相关结构。
2. 提供预测区间:不仅能给出点预测,还能给出预测的不确定性范围(置信区间)。
3. 成熟广泛:有成熟的统计理论和软件支持。
缺点
1. 线性假设:传统ARIMA是线性模型,可能无法捕捉复杂的非线性关系。
2. 对外生变量处理不便:虽然可以扩展为ARIMAX,但不如回归模型直观。
3. 需要足够历史数据:对于新业务或变化剧烈的业务,预测效果不佳。
实务:常用于IBNR准备金的初步估计,以及销售和理赔量的短期预测。现代方法也使用​ Prophet(Facebook开源库)​ 或​ LSTM神经网络进行更灵活的预测。

250

广义线性模型

非寿险定价

Tweedie分布用于聚合建模

1. 问题:在车险定价中,通常分别建模索赔频率(泊松分布)和索赔强度(Gamma分布),然后相乘得到纯保费。但有时希望直接对聚合损失(总赔款)进行建模,特别是当数据在0处有大量堆积(即多数保单无索赔)时。
2. 核心思想:Tweedie分布是指数分散模型 (EDM)​ 家族的一员,其方差函数为 Var(Y) = φ * μ^p,其中p是幂参数。当 1 < p < 2时,Tweedie分布是复合泊松-伽马分布的EDM表现形式,能直接对零膨胀的连续非负损失数据进行建模。
3. 步骤:a) 确定响应变量为保单的总损失(可能为0)。b) 选择链接函数(通常是对数链接)。c) 在GLM框架下,指定分布族为Tweedie(p),并估计参数p(通常通过最大似然或轮廓似然)。d) 拟合模型,得到每个风险单位的预期总损失。

Tweedie分布的概率密度:无显式形式,但其矩母函数已知,可用于参数估计。
关键性质:当 1 < p < 2时,Tweedie变量Y可以表示为 Y = Σ_{i=1}^N X_i,其中N ~ Poisson(λ),X_ii.i.d. ~ Gamma(α, γ),且N与X_i独立。此时,E[Y] = μ = λ * α * γVar(Y) = φ * μ^p
参数关系p = (α+2)/(α+1)λ = μ^{2-p} / [φ(2-p)]α = (2-p)/(p-1)
GLM设定
g(E[Y]) = g(μ) = η = β_0 + β_1 x_1 + ... + β_k x_k, 其中g(·)通常为对数函数。
:在R的glm函数中,使用family = tweedie(var.power = p, link.power = 0),其中link.power=0表示对数链接。通过tweedie.profile函数可以估计最优的p值。

优点
1. 一站式建模:直接对总损失建模,无需分开频率和强度模型,简化了流程。
2. 处理零膨胀数据:天然适合保险损失数据中有大量零值的特点。
3. 属于GLM框架:可以方便地引入分类变量和连续变量作为解释变量。
缺点
1. 可解释性稍弱:不如分开建模能清晰看到频率和强度各自的影响因素。
2. 计算较慢:因为密度函数无显式形式,参数估计(尤其是p的估计)需要数值积分或近似,计算量较大。
3. 假设复合结构:隐含了频率和强度独立的假设,这可能不总是成立。
实务:在车险定价中应用日益广泛,尤其适用于聚合数据或当分开建模不可行时。也常用于IBNR准备金

编号

类型

领域

模型/方法

算法核心思想与步骤

算法逐步推理思考的数学方程式和数字/数值

关联知识 (法规/实务/优缺点)

251

数据科学

理赔/反欺诈

图神经网络 (GNN) 在团伙欺诈识别中的应用

1. 问题:传统反欺诈模型聚焦单个案件,难以识别有组织的、关联性的团伙欺诈(如车险“碰瓷”团伙、健康险骗保网络)。
2. 核心思想:将理赔案件、人员(投保人、受益人、修理厂、医生)、车辆、地点等实体构建为“图”结构(节点和边)。利用GNN捕捉图中节点间的复杂关系和传播模式,从而识别异常子图(即欺诈团伙)。
3. 步骤:a) 构建异构图:定义节点类型和关系边(如“同一报案电话”、“同一修理厂”、“相同就诊医生”)。b) 为节点和边赋予特征(如案件金额、历史索赔次数)。c) 使用GNN模型(如GraphSAGE, GAT)进行节点嵌入或图分类训练。d) 识别高风险社区或异常子图。

GraphSAGE聚合公式
对于节点v,在第k层的嵌入 h_v^k通过聚合其邻居 N(v)的信息得到:
h_{N(v)}^k = AGGREGATE_k({h_u^{k-1}, ∀u∈N(v)})
h_v^k = σ(W^k · CONCAT(h_v^{k-1}, h_{N(v)}^k))
其中 AGGREGATE可以是均值、池化或LSTM聚合器。
建模细节
- 半监督学习:使用少量已标记的欺诈/非欺诈案件作为训练起点。
- 无监督异常检测:使用图自编码器,重构误差高的子图被视为异常。
- 动态图:可纳入时间维度,识别新兴的欺诈模式。

优点
1. 关系推理:能发现隐藏的、复杂的关联关系,这是传统方法无法做到的。
2. 精准打击:从识别单个案件升级为识别整个犯罪网络,打击效果更彻底。
3. 主动预警:对新案件,可通过其关联的图结构特征实时评估风险。
缺点
1. 数据要求高:需要构建高质量的关系图谱,依赖底层数据关联的准确性和完整性。
2. 模型复杂:GNN模型训练和解释难度大,需要专业的数据科学团队。
3. 误报管理:可能将正常关联(如家庭保单)误判为团伙,需业务规则辅助判断。
实务:是保险科技反欺诈的尖端应用。需与调查团队紧密合作,将模型输出转化为可行动的调查线索。

252

健康险精算

长期护理保险

活动能力 (ADL) 衰退模型与护理成本预测

1. 问题:长期护理保险的给付触发条件通常与被保险人的“日常生活活动能力”丧失数量相关。需要预测个体从健康状态到需要护理,再到不同护理等级(如居家护理、机构护理)的转移概率及相应成本。
2. 核心思想:构建一个多状态马尔可夫模型,状态包括:健康、1项ADL受损、2项ADL受损、...、需要机构护理、死亡。转移强度是年龄、性别、初始健康状况的函数。护理成本与所处状态强相关。
3. 步骤:a) 基于队列研究数据(如NLTCS, HRS)估计ADL衰退的转移强度。b) 结合护理服务市场数据,估计每个状态下的年均护理费用。c) 模拟个体生命周期路径,计算护理保险责任的精算现值。

多状态模型(示例)
状态:H(健康), I1(1项ADL受损), I2(2项ADL受损), HC(需要居家护理), NC(需要护理院护理), D(死亡)。
转移强度μ_{H->I1}(x), μ_{I1->HC}(x), μ_{HC->D}(x)等。
成本赋值:每个非健康状态关联一个年均护理成本 C_s(如 C_HC=5万元/年, C_NC=15万元/年)。
精算现值APV = Σ_{t} v^t * [ Σ_{s∈{HC,NC}} p_{x,0->s}(t) * C_s ],其中 p_{x,0->s}(t)是从投保年龄x的健康状态在t年后处于状态s的概率。

优点
1. 贴近产品责任:直接对保险给付的触发条件(ADL状态)进行建模,定价更精准。
2. 灵活性:可评估不同给付方式(现金给付、服务给付)和等待期的影响。
缺点
1. 数据稀缺:中国本土的ADL长期跟踪数据非常缺乏,严重依赖国外数据调整,存在适用性问题。
2. 成本通胀难测:护理服务成本的通胀率远高于CPI,长期预测不确定性大。
3. 道德风险:对ADL状态的认定存在主观性,容易引发理赔纠纷。
实务:中国长期护理保险处于发展初期,相关经验数据积累不足。定价时需非常谨慎,通常采用保守假设,并设置严格的核保和理赔管理规则。

253

非寿险准备金

未决赔款准备金

Bornhuetter-Ferguson (BF) 方法

1. 核心思想:一种结合先验信息(预期损失率)和已发生经验的稳健准备金评估方法。适用于发展早期、数据波动大或新业务,其核心公式为:最终损失 = 已报告损失 + (1 - 报告进展因子) × 先验预期最终损失。
2. 步骤:a) 选择一个先验的预期最终损失(如基于已赚保费×预期损失率)。b) 使用链梯法等计算已报告损失的发展因子,得到报告进展率。c) 对于每个事故年,最终损失估计 = 已报告损失 + (1 - 报告进展率) × 先验预期最终损失。

BF方法公式
L_i,ult = C_i,reported + (1 - λ_i) * ELR * P_i,earned
其中:
L_i,ult:事故年i的最终损失估计。
C_i,reported:事故年i至评估日的已报告赔款。
λ_i:事故年i至评估日的累计报告进展率(来自链梯法)。
ELR:预期最终损失率(先验假设)。
P_i,earned:事故年i的已赚保费。
:某新业务事故年,已赚保费1000万,ELR假设为65%。至评估日已报告赔款200万,报告进展率λ估计为40%。则BF法估计最终损失 = 200 + (1-0.4)*0.65 * 1000 = 200 + 390 = 590万。IBNR准备金 = 590 - 200 = 390万。

优点
1. 稳健性强:对早期事故年,当已报告数据不稳定时,通过引入先验预期进行平滑,结果比纯链梯法更稳定。
2. 避免过度外推:对于长尾业务或异常进展,不会完全依赖可能不可靠的早期进展模式。
缺点
1. 主观性:先验预期损失率(ELR)的选择具有主观性,对结果影响大。
2. 双重计算:如果业务实际经验持续偏离先验假设,方法不会自动修正,可能导致系统性偏差。
实务:是评估长尾业务(如责任险)和新业务准备金的常用方法。常与链梯法、预期损失率法结合使用,作为三角阵法的补充或稳健性检查。

254

企业风险管理

资本管理

风险偏好框架与风险限额体系

1. 核心思想:将公司董事会确定的风险偏好(愿意承担的风险类型和水平)转化为可量化、可监控、可执行的风险限额,并分解到各业务条线和风险类别,形成一套完整的传导和管理机制。
2. 步骤:a) 风险偏好陈述:定性描述公司对各类风险的态度(如规避、中性、追求)。b) 风险容忍度量化:使用关键风险指标(如经济资本在险值VaR、偿付能力充足率、最大累计损失)设定公司级上限。c) 风险限额分配:将公司级限额根据风险轮廓和战略,分解为业务单元/风险类别的子限额。d) 监控与报告:建立定期监控机制,对限额突破设置预警和处置流程。

风险容忍度量化示例
- 市场风险:在99.5%置信度下,1年经济资本在险值不超过X亿元。
- 保险风险:巨灾事件导致当年综合成本率不超过115%。
- 流动性风险:流动性覆盖率(LCR)在任何时点不低于120%。
- 整体资本:偿付能力充足率持续高于150%。
风险限额分解示例:将整体经济资本限额10亿,按风险贡献度分解:车险业务线3亿、财产险业务线2亿、信用风险1.5亿、市场风险3.5亿。各业务线再进一步分解至产品、渠道、区域。

优点
1. 战略落地:将抽象的风险偏好转化为具体的日常管理工具。
2. 主动管理:通过前置限额,控制风险敞口,防止过度风险承担。
3. 清晰问责:明确了各层级管理者的风险管理责任。
缺点
1. 设定困难:量化风险容忍度需要复杂的模型支持,且董事会与管理层可能对“可接受”水平存在分歧。
2. 僵化风险:过于刚性的限额可能限制有益的业务机会,需要动态调整机制。
3. 模型依赖:限额体系的有效性依赖于底层风险计量模型的准确性。
实务:是偿二代第二支柱“风险管理要求与评估”(SARMRA)的核心内容。限额体系通常与风险调整绩效评估(RAPM)​ 和资本配置流程相结合。

255

数据科学

定价/核保

集成学习 (如XGBoost, LightGBM) 在非寿险定价中的应用

1. 问题:传统GLM在处理大量特征、复杂非线性关系和交互效应时能力有限。集成学习通过组合多个弱学习器(通常是决策树)来构建强预测模型,在保险定价竞赛和实践中表现卓越。
2. 核心思想梯度提升树 (GBDT)​ 是主流方法。它迭代地训练一系列决策树,每棵树学习之前所有树组合的残差,最终预测是所有树预测值的加权和。XGBoost和LightGBM是其高效实现。
3. 步骤:a) 数据准备:特征工程、处理缺失值、编码分类变量。b) 模型训练:使用历史保单和索赔数据,以索赔频率/强度或纯保费为目标变量。c) 超参数调优:通过交叉验证优化树的数量、深度、学习率等。d) 特征重要性分析:输出各变量对预测的贡献度。

XGBoost目标函数
Obj(θ) = Σ_i L(y_i, ŷ_i) + Σ_k Ω(f_k)
其中:
L是损失函数(如泊松损失的负对数似然)。
`Ω(f_k) = γT + 0.5λ

256

寿险/健康险

产品开发

失能收入保险的定价与准备金评估模型

1. 问题:失能收入保险保障因疾病或伤害导致失能、无法工作时的收入损失。其定价和评估高度复杂,依赖于失能发生率失能持续期恢复率死亡率的多重 decrement 模型。
2. 核心思想:构建一个多状态模型,状态包括:健康、失能、恢复、死亡。关键假设是失能后的恢复力(力 of recovery)和死亡力(力 of mortality),它们通常与失能持续时间(病期)相关。
3. 步骤:a) 根据职业类别、年龄、性别确定初始失能发生率。b) 使用持续期表(伤残持续表)估计失能后的恢复概率和死亡概率,这些概率是失能持续时间的函数。c) 结合保单条款(如等待期、给付期、给付额)计算精算现值和准备金。

多状态模型与现金流
状态:A(Active/健康), D(Disabled/失能), R(Recovered/恢复), Dead(死亡)。
关键概率
- p_{AD}(x): x岁健康者在年内失能的概率。
- μ_D^{(r)}(x,d): x岁、已失能d年者的恢复力。
- μ_D^{(m)}(x,d): x岁、已失能d年者的死亡力(通常高于健康者)。
准备金计算:对于已失能d年的被保险人,其未来给付的精算现值为生存年金的现值,其中生存概率需要考虑从失能状态向恢复或死亡状态的转移。

优点
1. 精细建模:能准确反映失能保险的长尾性和状态依赖性,是处理此类风险的行业标准方法。
2. 条款敏感:能灵活纳入各种保单条款,如部分失能给付、未来收入增加选项等。
缺点
1. 数据极度稀缺:失能发生率、尤其是持续期表数据非常难以获取,且对经济周期、社会福利政策敏感。
2. 道德风险高:对“失能”的定义和认定主观性强,容易引发逆选择和理赔纠纷。
3. 模型复杂:涉及多重 decrement 和持续期依赖,计算繁琐。
实务:是精算中最复杂的领域之一。通常采用再保险公司提供的经验表(如瑞士再的《残疾表》)作为基础,再根据本公司经验进行调整。核保和理赔管理至关重要。

257

金融建模

资产负债管理

随机资产负债管理 (Stochastic ALM) 模型

1. 核心思想:在随机的经济情景(利率、股市、汇率等)下,动态模拟资产和负债的现金流与市场价值,评估公司的偿付能力盈利流动性在不同情景下的表现,以优化资产配置和产品策略。
2. 步骤:a) 生成数千条一致的经济情景(使用利率模型、权益模型等)。b) 在每条情景下,投影资产组合的收益和负债的现金流/价值。c) 计算每条情景下的关键指标(如净资产、偿付能力充足率、流动性缺口)。d) 统计分析结果分布,计算风险指标(如破产概率、资本短缺的期望值)。e) 优化资产配置,使目标函数(如预期收益下风险最小)最优。

模型核心
Surplus_t = MarketValueOfAssets_t - FairValueOfLiabilities_t
在每条随机路径下,计算 Surplus_t的路径。
优化问题
Minimize: RiskMeasure(Surplus_T的分布), e.g., CVaR_{95%}(-ΔSurplus)
Subject to: ExpectedReturn(Surplus_T) >= Target
以及各类约束(如监管资本要求、流动性约束、信用评级约束)
常用风险度量:资本短缺概率、在险价值 (VaR)、条件在险价值 (CVaR/TVaR)。

优点
1. 全面风险评估:同时考虑多种风险来源及其相互作用,提供更完整的风险视图。
2. 前瞻性决策支持:用于测试不同资产配置策略、对冲策略和产品策略在不确定未来下的效果。
3. 满足监管与评级要求:是ORSA和获得高信用评级的关键分析工具。
缺点
1. 极度复杂:模型构建、校准、验证和运行成本极高。
2. 垃圾进,垃圾出:结果严重依赖于经济情景生成器和负债模型的假设。
3. 计算密集:需要强大的IT基础设施。
实务:大型保险集团和寿险公司的ALM核心工具。用于制定战略性资产配置 (SAA)​ 和评估嵌入式期权(如退保权、保证利率)的风险。

258

运营管理

费用分析

作业成本法 (Activity-Based Costing, ABC) 在保险费用分摊中的应用

1. 问题:传统费用分摊方法(如按保费比例)可能扭曲不同产品、渠道的真实盈利能力,因为不同业务的复杂性和所需服务支持不同。
2. 核心思想:将间接费用(后台支持、IT、管理等)更精确地追溯到消耗这些资源的“作业”(如新单录入、核保、理赔处理、客户服务),再根据各成本对象(产品、渠道、客户)消耗的作业量,将作业成本分摊给它们。
3. 步骤:a) 识别主要作业和作业中心。b) 将资源成本(如人力、系统)分配至作业中心,形成作业成本池。c) 确定作业成本动因(如新单数、理赔案件数、服务电话次数)。d) 计算作业成本动因率。e) 根据各成本对象消耗的动因量分摊费用。

成本动因率计算
作业成本动因率 = 作业中心总成本 / 该作业总动因量
:“核保作业中心”年总成本300万(含人力、系统分摊),全年处理10万张新单。则核保作业成本动因率 = 300万 / 10万 = 30元/单。
产品费用分摊:产品A全年产生1万张新单,则分摊的核保费用 = 1万 * 30元 = 30万元。

优点
1. 成本核算精准:提供更真实的产品/渠道盈利视图,支持精细化定价和资源分配决策。
2. 流程优化:通过分析作业成本,识别并消除低效或不增值的作业。
3. 支持客户细分:可计算不同客户群的维护成本,用于客户价值分析。
缺点
1. 实施复杂:需要详细的过程分析和数据收集,初期投入大。
2. 主观判断:资源到作业、作业到动因的分配存在一定主观性。
3. 维护成本高:业务流程变化时需要更新模型。
实务:常用于分析渠道盈利能力(如代理人渠道 vs. 网销渠道)、评估客户终身价值 (CLV)、以及为费用附加费率的差异化提供依据。

259

再保险优化

资本管理

再保险结构优化模型 (基于风险度量)

1. 问题:如何选择最优的再保险方案(如比例分保 vs. 超赔分保,各层的起赔点和限额),在给定的再保险预算下,最大化公司的风险调整后绩效(如RAROC)或最小化风险(如盈余的波动性)。
2. 核心思想:将再保险购买决策建模为一个约束优化问题。决策变量是再保险结构的参数(如分保比例、起赔点、限额),目标函数是某个风险调整后的绩效指标,约束条件是再保险保费支出不超过预算。
3. 步骤:a) 定义决策变量和可行域。b) 使用公司风险模型(如内部模型)模拟不同再保险结构下的损失分布。c) 计算目标函数(如预期利润 / 经济资本)。d) 使用优化算法(如梯度下降、遗传算法)搜索最优解。

优化问题表述
Maximize: f(R) = (ExpectedProfit - ReinsurancePremium) / EconomicCapital(R)
Subject to: ReinsurancePremium(R) <= Budget
其中 R代表再保险结构参数向量。
模拟与计算
1. 模拟原始损失分布 L
2. 对于给定的再保险结构 R,计算自留损失 L_retained = g(L, R)和再保险成本 P(R)
3. 基于 L_retained的分布计算经济资本 EC(R)(如TVaR)。
4. 计算目标函数值 f(R)
:为车险业务选择超赔再保险,决策变量是起赔点 A和限额 L。优化目标是最大化RAROC,约束是再保费不超过500万。通过模拟搜索最优的 (A, L)组合。

优点
1. 决策科学化:将再保险购买从经验判断转变为基于模型的量化决策。
2. 资本效率:帮助公司以最小成本获得最大的风险缓释效果,优化资本使用。
3. 全局优化:能同时考虑多个再保险层和多种再保险形式的组合。
缺点
1. 模型依赖:完全依赖于底层损失分布模型和风险度量模型的准确性。
2. 忽略市场因素:模型假设再保费是精算公平的,而实际再保费受市场周期影响巨大。
3. 计算复杂:需要大量的模拟和优化计算。
实务:通常作为年度再保险续转谈判的决策支持工具。需结合再保人的报价和公司的风险偏好进行最终决策。

260

养老金精算

计划资产评估

养老金计划资产的公允价值评估与预期回报率设定

1. 问题:在养老金会计中,计划资产的市值波动直接影响净养老金成本(或收益)。需要评估资产公允价值,并设定长期预期回报率用于计算预期资产收益。
2. 核心思想公允价值通常按市场价值计量。长期预期回报率是基于资产配置策略,对各类资产长期平均回报率的加权平均估计,需考虑当前市场条件和未来预期。
3. 步骤:a) 确定资产配置政策(如股票40%,债券50%,另类投资10%)。b) 对每类资产,基于历史数据、当前估值和未来经济展望,设定其长期名义预期回报率。c) 计算加权平均预期回报率。d) 在财务报表中披露公允价值及预期回报率假设。

预期回报率计算
ER_portfolio = Σ (w_i * ER_i)
其中:
w_i:第i类资产的配置比例。
ER_i:第i类资产的长期预期回报率。
各类资产预期回报率设定参考
- 发达市场股票:无风险利率 + 股权风险溢价 (如3%-5%)。
- 债券:当前收益率曲线隐含的远期利率。
- 房地产:租金收益率 + 预期资本增值率。
:配置为股40%(ER=7%)、债50%(ER=3%)、另类10%(ER=6%),则组合预期回报率 = 0.4 * 7% + 0.5 * 3% + 0.1 * 6% = 4.9%。

优点
1. 反映经济实质:长期预期回报率反映了资产配置的长期收益潜力,平滑短期市场波动对利润表的影响。
2. 透明度:要求披露假设,提高了财务报告的可比性。
缺点
1. 主观性:长期预期回报率的设定具有高度主观性,公司可能通过乐观假设来降低当期养老金成本。
2. 与市值脱节:预期回报率是长期平滑值,而资产公允价值随市场实时波动,两者差异形成“未实现损益”。
3. 假设变更影响:调整预期回报率假设会直接影响未来多年的利润表。
实务:是养老金会计中争议最大的假设之一。审计师和监管机构会重点关注其合理性。公司通常会参考精算顾问和投资顾问的建议,并披露敏感性分析。

261

会计准则

保险合同

IFRS 17下的合同服务边际 (CSM) 摊销模型

1. 核心思想:IFRS 17核心模型要求,在合同组初始确认时,将未来预期的“有利”利润(即履约现金流现值小于收取保费现值的部分)确认为一项负债——合同服务边际(CSM)。CSM在后续期间,随着服务的提供,按提供的保障单位比例系统地摊销释放至利润表。
2. 步骤:a) 初始确认时,计算CSM = PV(保费) - PV(履约现金流),若为正值。b) 确定保障单位(如保额、风险暴露、预期赔款)。c) 每期,计算当期提供的保障单位占合同组总保障单位的比例。d) 当期摊销的CSM = 期初CSM余额 × (当期保障单位 / 剩余总保障单位)。e) 更新CSM余额。

CSM摊销公式(基于保障单位法)
CSM摊销额_t = CSM_{t-1} × (保障单位_t / 剩余保障单位_{t-1})
CSM_t = CSM_{t-1} - CSM摊销额_t + 当期利息增长
其中,CSM初始折现率计提利息。
保障单位确定:对于保障成分,通常与保险保障相关(如保额、预期赔款);对于储蓄/投资成分,则与账户价值相关。
:一份3年期定期寿险,总保额300万(每年100万),初始CSM为30。则第一年摊销 = 30 × (100/300) = 10。年末CSM余额为20,加上按折现率计提的利息。

优点
1. 利润释放与服务匹配:将利润的确认与保险服务的提供相挂钩,提高了会计匹配性。
2. 减少新业务亏损:防止新业务因首年高获取成本而立即出现会计亏损。
3. 提升可比性:统一了全球保险合同的会计处理。
缺点
1. 极度复杂:CSM的计算、摊销、调整(如经验调整)规则非常复杂,对系统和数据要求极高。
2. 利润表波动:虽然CSM本身平滑利润,但当期服务业绩和财务业绩的波动仍会直接进入利润表。
3. 主观判断:保障单位的确定、分组规则等涉及重大判断,影响报表结果。
实务:是IFRS 17实施的核心挑战。保险公司需要重建财务和精算系统,并建立新的财务报告流程。

262

经验分析

死亡率/脱退率

Cox比例风险模型 (Cox Proportional Hazards Model)

1. 问题:在分析保单持有人死亡或退保的风险时,不仅关心时间,还关心多个协变量(如年龄、性别、保额、缴费方式)对风险的影响。Cox模型是一种半参数生存分析模型,用于评估各因素对“风险率”的影响。
2. 核心思想:模型不指定基准风险函数的具体形式,只假设各协变量的效应是乘性的,且不随时间变化(比例风险假设)。模型形式为:`h(t

X) = h0(t) * exp(β1X1 + β2X2 + ... + βpXp)。<br>3. **步骤**:a) 准备生存数据(时间、事件指示变量、协变量)。b) 使用偏似然法估计系数β。c) 检验比例风险假设。d) 解释风险比HR = exp(β)`。

模型公式
h_i(t) = h_0(t) * exp(β_1 x_{i1} + β_2 x_{i2} + ... + β_p x_{ip})
其中:
h_i(t):个体i在时间t的风险函数(如死亡力)。
h_0(t):基准风险函数,任意形式。
x_{ij}:个体i的第j个协变量。
β_j:第j个协变量的系数。
风险比 (HR)HR_j = exp(β_j)。表示在其他变量不变的情况下,该协变量增加一个单位,风险变为原来的 exp(β_j)倍。
:分析退保风险,协变量包括“年龄”、“保单年度”、“缴费频率(年缴=0,月缴=1)”。得到 β_缴费频率 = 0.5,则 HR = exp(0.5) ≈ 1.65,表明月缴保单的退保风险是年缴保单的1.65倍。

263

非寿险定价

分类费率

广义可加模型 (GAM) 在风险因子建模中的应用

1. 问题:GLM假设预测变量与响应变量的对数线性关系,但实际中可能存在非线性关系(如年龄与车险索赔频率呈U型)。GAM放松了这一假设,允许使用平滑函数来拟合非线性效应。
2. 核心思想:将线性预测子中的部分线性项 β_j * x_j替换为平滑函数 s_j(x_j),模型形式为:g(E[Y]) = β_0 + s_1(x_1) + s_2(x_2) + ... + f(x_k, z_l) + ...。其中 s()可以是样条函数等。
3. 步骤:a) 选择分布族和链接函数(同GLM)。b) 对每个连续变量,选择平滑函数类型和自由度。c) 使用反向拟合或惩罚似然法估计模型。d) 可视化平滑函数,解释变量效应。

GAM模型公式
g(μ_i) = β_0 + s_1(x_{i1}) + s_2(x_{i2}) + ... + β_k * z_{ik} + ...
其中 s_j()是平滑函数,常用薄板样条三次回归样条
拟合过程:通过惩罚似然最大化来估计,惩罚项控制函数的粗糙度:
l(β) - λ ∫ [s_j''(x)]^2 dx,其中 λ是平滑参数,控制拟合度与平滑度的权衡。
输出解释:可以绘制 s_j(x_j)关于 x_j的图,直观展示该变量的非线性效应。例如,可能发现车险索赔频率在驾驶员年龄25岁和65岁左右有两个高峰。

优点
1. 捕捉非线性:能自动发现并拟合连续变量的非线性模式,无需手动分箱或构造多项式项。
2. 可解释性:结果仍具有较好的可解释性,可以通过函数图理解变量影响。
3. 灵活性高:可以包含线性项、平滑项和交互项,形式灵活。
缺点
1. 计算量大于GLM:估计平滑函数需要更多计算资源。
2. 过拟合风险:如果平滑参数 λ过小或自由度设置过高,容易过拟合。
3. 变量选择:不像GLM那样有成熟的变量选择程序(如逐步回归)。
实务:在车险定价中用于对连续变量(如年龄、车龄、发动机功率)进行更精细的建模。通常与GLM结合使用:先用GAM探索变量关系,再将发现的非线性模式通过分箱或样条基函数引入GLM,以满足监管对可解释性的要求。

264

资本模型

模型验证

回溯测试 (Backtesting) 与模型校准

1. 核心思想:通过比较模型预测结果(如VaR、预期赔款)与实际观察结果,来评估模型的有效性和校准质量。这是模型风险管理的关键环节。
2. 步骤
- VaR回溯测试:在给定的置信水平(如99.5%)下,统计实际损失超过VaR预测值的次数(“突破”次数),检验其是否与理论期望(如0.5%)在统计上无显著差异(使用二项检验或Kupiec检验)。
- 赔款准备金回溯测试:比较历年对同一事故年的最终损失预测值与最终实际值,计算预测误差(如百分比误差),分析其是否存在系统性偏差(如持续低估或高估)。

Kupiec检验(失败率检验)
设观察天数为T,失败天数(损失>VaR)为N,理论失败概率为p(如0.005)。
似然比统计量:
LR = -2 ln[ (1-p)^{T-N} p^N ] + 2 ln[ (1-N/T)^{T-N} (N/T)^N ]
在原假设(模型正确)下,LR服从自由度为1的卡方分布。若LR > χ²_{1,α},则拒绝原假设,认为模型不准确。
准备金预测误差分析
对于事故年i,在发展年j的预测值为 C_{i, ult}^{(j)},最终实际值为 C_{i, ult}
预测误差:e_i^{(j)} = (C_{i, ult}^{(j)} - C_{i, ult}) / C_{i, ult}
分析所有 e_i^{(j)}的均值(应接近0)、标准差和自相关性。

优点
1. 客观评估:提供量化证据来评估模型表现,是模型验证的基石。
2. 持续改进:通过定期回溯测试,发现模型缺陷,驱动模型迭代和优化。
3. 满足监管:偿二代和Solvency II都要求对内部模型进行严格的反向测试。
缺点
1. 数据要求:需要足够长的历史数据序列才能进行有意义的统计检验。
2. “模型风险无法消除”:回溯测试只能证伪,不能证明模型完全正确。即使通过检验,模型仍可能存在未识别的缺陷。
3. 对极端事件不敏感:VaR回溯测试对尾部事件的检验能力有限,因为极端事件样本极少。
实务:需定期(如每季度、每年)对关键风险模型(市场风险、保险风险、准备金模型)进行回溯测试。结果需向模型治理委员会和监管机构报告。

265

养老金精算

成本法

进入年龄正常成本法 (Entry Age Normal Cost Method)

1. 问题:在养老金计划会计中,需要将预计给付义务(PBO)的总成本在雇员的整个服务期内进行分摊,以计算每年的养老金成本(服务成本+利息成本)。进入年龄正常成本法是常用的分摊方法之一。
2. 核心思想:假设雇员从加入计划年龄开始,每年缴纳一笔“正常成本”,直到退休年龄,这些缴费的精算现值等于其退休时总养老金给付的精算现值。每年的服务成本就是这笔假设的年缴费额。
3. 步骤:a) 确定雇员加入计划时的年龄(entry age)。b) 预测其退休时的养老金年给付额。c) 计算从加入年龄到退休年龄,每年均匀缴费(正常成本)的精算现值等于退休给付精算现值的年缴费额。d) 该年缴费额即为每年的服务成本(在工资增长假设下可能需调整)。

计算公式
设加入年龄为e,退休年龄为r,工资增长率为s,折现率为i
退休时年养老金给付 B_r = AccrualRate * FinalSalary * (r-e)
FinalSalary = Salary_e * (1+s)^{r-e}
e岁到r-1岁每年初缴付正常成本NC,其精算现值等于B_rr岁开始的生存年金在e岁的精算现值。
`NC * ä_{e:r-e

}^{(12)} = B_r * r-e p_e * v^{r-e} * ä{r}^{(12)}<br>其中ä{e:r-e

精算与风险管理领域的核心模型与方法,涵盖更前沿的科技应用、特定风险建模及运营财务等方向。

编号

类型

领域

模型/方法

算法核心思想与步骤

算法逐步推理思考的数学方程式和数字/数值

关联知识 (法规/实务/优缺点)

266

非寿险定价

车联网保险

基于驾驶行为的定价模型 (Usage-Based Insurance, UBI)

1. 核心思想:利用车载设备或手机APP收集个体驾驶行为数据(如里程、急加速、急刹车、夜间驾驶、转弯速度等),建立风险评分模型,实现基于实际使用和行为的差异化、动态定价。
2. 步骤:a) 数据采集:通过OBD、手机传感器等收集原始驾驶数据。b) 特征工程:从原始数据中提取风险特征(如百公里急刹车次数、高速行驶占比)。c) 建模:使用GLM、GBDT等模型,以索赔频率/强度为目标变量,驾驶行为特征为核心解释变量进行建模。d) 定价:将模型输出的风险评分转换为保费折扣或加成。

风险评分计算
风险评分 = β_0 + β_1 * 特征1 + β_2 * 特征2 + ...
例如:风险评分 = 1.0 + 0.05*(百公里急刹次数) + 0.1*(夜间驾驶比例) - 0.02*(平均速度稳定性)
保费计算
最终保费 = 基础保费 × (1 + 风险评分调整系数)
:基础保费5000元。某驾驶员风险评分为-0.1(驾驶行为好),调整系数对应9折,则最终保费为4500元。另一驾驶员评分为+0.2,调整系数为1.2,则保费为6000元。

优点
1. 公平性:保费更直接反映个体真实风险,实现“善驾者低保费”。
2. 风险预防:反馈驾驶行为数据可帮助驾驶员改善习惯,降低出险概率。
3. 客户细分:提供全新的风险细分维度。
缺点
1. 数据隐私:收集详细驾驶数据涉及严重的隐私和安全问题,需获得用户明确授权并合规使用。
2. 逆选择:风险高的驾驶员可能不愿参与,导致风险池恶化。
3. 硬件与实施成本:设备安装、数据传输和处理成本较高。
实务:是车险创新的重要方向。通常以前装(与车企合作)或后装(OBD设备)形式开展。需解决数据标准、模型可解释性及隐私合规挑战。

267

巨灾模型

财产险/再保险

巨灾模型 (Catastrophe Model) 的组件与流程

1. 核心思想:通过物理模型、历史数据和随机模拟,量化自然灾害(地震、台风、洪水)或人为灾难(恐怖袭击、网络攻击)对保险 portfolio 造成的潜在损失分布。
2. 核心组件:a) 灾害模块:生成随机事件集(如十万个模拟台风),包括事件频率、位置、强度参数。b) 暴露模块:输入保险标的的地理位置、建筑特征、保额等信息。c) 易损性模块:建立强度参数(如风速、震级)与标的损失率的关系函数。d) 金融模块:根据保单条款(免赔额、限额、分保结构)计算保险损失。

损失计算流程
对于每个模拟事件j和每个风险单位i:
1. 获取事件在i处的强度 I_ij(如峰值地面加速度PGA)。
2. 通过易损性函数 f(I)得到平均损失率 LR_ij
3. 考虑不确定性,从 LR_ij的分布中抽取一个具体损失率 lr_ij
4. 计算标的损失:Loss_ij = lr_ij * 保险价值_i
5. 应用保单条款:InsuredLoss_ij = min( max(Loss_ij - 免赔额_i, 0), 限额_i)
6. 聚合所有风险单位i,得到事件j的总损失 L_j
7. 对所有模拟事件j的损失 L_j进行统计分析,得到年损失分布。

优点
1. 科学量化:为难以用历史数据统计的极端事件提供了物理基础的量化工具。
2. 风险细分:能识别高风险区域和标的,指导承保和定价。
3. 再保险优化:是设计超赔再保险层和计算纯风险保费的核心依据。
缺点
1. 模型不确定性高:对灾害物理过程、易损性曲线的假设存在大量不确定性,不同模型商结果差异可能很大。
2. 黑箱操作:商业模型细节不公开,使用者难以完全理解和验证。
3. 数据质量依赖:暴露数据(标的经纬度、结构)的准确性对结果影响巨大。
实务:是财产险公司风险管理和再保险购买的必备工具。监管机构(如偿二代)认可其用于计算巨灾风险资本要求。公司常使用多个模型商的結果进行对比和综合判断。

268

信用风险

债券投资/再保险

信用违约互换 (CDS) 定价与信用利差模型

1. 问题:保险公司持有大量债券和应收再保险款,面临交易对手违约风险。CDS是一种转移此风险的衍生工具,需对其合理定价。
2. 核心思想:CDS的保费(利差)应等于预期信用损失的现值。在风险中性测度下,通过构建无套利模型,将CDS利差与标的实体(参考实体)的违约概率和违约回收率联系起来。
3. 步骤:a) 从市场交易的CDS报价中,可以反向推导出隐含的风险中性违约概率。b) 常用模型是信用曲线 bootstrap,利用不同期限的CDS报价,构建出风险中性下的生存概率曲线。

简化定价公式
PV(保费支付) = PV(预期损失)
Σ_{t=1}^N S * D(t) * Q(t) * Δt = Σ_{t=1}^N LGD * D(t) * [Q(t-1) - Q(t)]
其中:
S:CDS年化利差(保费)。
D(t):无风险折现因子至时间t。
Q(t):参考实体存活至时间t的风险中性概率。
LGD:违约损失率(= 1 - 回收率)。
Δt:支付间隔。
信用曲线构建:从1年期CDS报价 S1可解出第一年的违约概率 λ1。然后利用 S1S2(2年期)报价,在已知 λ1的情况下,解出第二年的违约概率 λ2,以此类推。

优点
1. 市场一致性:CDS报价反映了市场对信用风险的实时、前瞻性看法。
2. 风险量化:为信用风险的经济资本计量提供了市场化的校准基准。
3. 对冲工具:可用于主动管理债券和再保险交易的信用风险敞口。
缺点
1. 流动性风险:非主要实体的CDS市场流动性差,报价可能失真。
2. 交易对手风险:CDS卖方自身可能违约,形成“连锁风险”。
3. 模型风险:定价模型依赖于风险中性假设和回收率假设,可能与实际有偏差。
实务:用于评估持有债券的信用利差风险,计算C-ROSS下的交易对手违约风险最低资本。在再保险信用风险管理中,可参考类似评级主体的CDS利差来评估再保人风险。

269

数据科学

文本分析/核保理赔

自然语言处理 (NLP) 在非结构化数据分析中的应用

1. 问题:保险业务中存在大量非结构化文本数据,如理赔调查报告、体检报告、客服录音转写、社交媒体信息,其中蕴含关键风险信息。
2. 核心思想:利用NLP技术(如文本分类、命名实体识别、情感分析、主题建模)自动从文本中提取结构化信息,用于风险识别、流程自动化和服务提升。
3. 应用场景:a) 智能核保:自动解析体检报告,提取异常指标。b) 理赔反欺诈:分析报案描述,识别矛盾点和欺诈模式关键词。c) 客户服务:分析客服对话,识别客户不满和潜在投诉风险。d) 舆情监控:分析社交媒体,感知品牌声誉和新兴风险。

技术流程示例(理赔报告分类)
1. 文本预处理:分词、去除停用词、词干化。
2. 特征表示:将文本转化为数值向量,如TF-IDF或词嵌入(Word2Vec, BERT)。
3. 模型训练:使用带标签的历史数据(如“欺诈/非欺诈”),训练分类模型(如SVM、神经网络)。
4. 预测与部署:对新报案描述自动输出风险评分。
命名实体识别 (NER):从文本中识别并提取关键实体,如“人物:张三”、“地点:XX路口”、“时间:2023-10-01”、“伤情:左腿骨折”。

优点
1. 释放数据价值:将沉睡的非结构化数据转化为可用的风险信号。
2. 提升效率与一致性:自动化处理,减少人工阅读和判断的时间与偏差。
3. 发现隐藏模式:通过主题建模等无监督方法,发现未知的索赔模式或客户需求。
缺点
1. 模型训练成本高:需要大量高质量的标注数据,领域特定(如医学、法律)的标注更昂贵。
2. 语境理解挑战:对歧义、反讽、专业术语的理解仍不如人类。
3. 可解释性差:深度学习模型决策过程不透明,在核保、拒赔等关键决策中需谨慎使用。
实务:通常作为辅助工具,为核保员、理赔员提供预警或初步筛选,由人工做最终决策。需持续迭代模型以适应新的欺诈手段或业务术语。

270

运营财务

费用控制

预算编制与预测的滚动预测模型

1. 问题:传统的年度预算周期长、僵化,难以应对市场快速变化。滚动预测通过持续更新未来一定时期(如未来12个月)的财务预测,使预算管理更动态、敏捷。
2. 核心思想:每季度(或每月)以最新实际经营数据和市场展望为基础,重新预测未来4个季度(或12个月)的损益、现金流和关键绩效指标(KPI),形成“永远向前看”的预测机制。
3. 步骤:a) 数据更新:纳入最新月份的实际财务和业务数据。b) 假设修订:根据市场变化、战略调整更新关键驱动因子假设(如保费增长率、综合成本率、投资收益率)。c) 模型重算:在财务预测模型中运行新假设,生成更新的滚动预测报表。d) 差异分析与行动:对比滚动预测与年度预算、上次滚动预测的差异,分析原因并制定管理行动。

模型核心:集成式财务模型,链接:
保费收入预测 = ∑(产品线新单预测 + 续期预测)
赔付支出预测 = 已发生赔款预测 + IBNR变动
费用预测 = 固定费用 + 变动费用率 × 业务量
投资收入预测 = 平均投资资产 × 预期投资收益率
净利润预测 = 保费收入 - 赔付支出 - 费用 + 投资收入 - 税金
滚动机制:每季度末,将刚结束季度的实际数固定,删除最远的一个预测季度,在末尾新增一个预测季度,形成新的12个月视野。

优点
1. 前瞻性管理:迫使管理层持续关注未来,及时调整策略。
2. 提高预测准确性:通过频繁更新,预测更贴近现实。
3. 资源灵活配置:为动态的资源分配和绩效评估提供依据。
缺点
1. 管理成本高:需要频繁的预测流程和跨部门协作。
2. 可能削弱预算约束:如果滚动预测频繁大幅调整,可能失去预算的严肃性和目标导向作用。
3. 对数据系统和模型要求高:需要集成的财务模型和及时的数据支持。
实务:正逐渐取代或补充传统的固定年度预算。成功的滚动预测需要强大的财务分析团队、高效的业务流程以及高层管理者的支持。它不仅是财务工具,更是战略沟通和绩效管理的工具。

271

寿险评估

内含价值

新业务价值 (NBV) 与价值驱动分析

1. 核心思想:NBV衡量一年内新签保单在签单时点对未来股东利润贡献的现值,是衡量寿险公司增长质量和盈利能力的关键指标。价值驱动分析旨在分解NBV的变化,识别关键影响因素。
2. 计算:NBV = 新业务首年保费 × 新业务价值率。新业务价值率是经过风险贴现后的边际利润率。
3. 驱动分析:通过敏感性分析或贡献度分析,量化各因素对NBV变动的影响,如:销量(保费)变化、产品结构变化、利润率变化(受定价、费用、投资假设影响)、风险贴现率变化等。

NBV计算公式
NBV = Σ (新业务首年保费_i × 新业务价值率_i)
其中,对于产品i,新业务价值率_i = (PV(未来股东利润) / 首年保费)
价值驱动分解(示例)
NBV变动 = 销量效应​ + 结构效应​ + 利润率效应​ + 其他效应
- 销量效应:假设产品结构和利润率不变,仅因总保费变化引起的NBV变动。
- 结构效应:假设总保费和利润率不变,仅因高价值率产品占比变化引起的变动。
- 利润率效应:假设总保费和结构不变,仅因各产品价值率变化引起的变动。

优点
1. 衡量增长质量:区分“规模增长”与“价值增长”,避免盲目追求保费规模。
2. 战略决策支持:帮助管理层理解价值来源,指导资源向高价值业务倾斜。
3. 资本市场沟通:是投资者评估寿险公司前景的核心指标之一。
缺点
1. 依赖精算假设:NBV对风险贴现率、投资收益率等长期假设非常敏感。
2. 可能鼓励短期行为:为提升当期NBV,可能销售对长期不利的产品(如高保证利率产品)。
3. 可比性问题:不同公司假设不同,需谨慎比较。
实务:在寿险公司季度和年度业绩报告中重点披露。管理层通过月度/季度NBV追踪和驱动分析,及时调整销售策略和产品策略。

272

非寿险准备金

未决赔款准备金

准备金进展分析 (Reserve Development Analysis)

1. 问题:评估过去计提的准备金是否充足,识别系统性偏差(如持续低估或高估),并为未来准备金评估假设提供依据。
2. 核心思想:比较历年对同一事故年在不同评估时点的准备金(或最终损失)估计值,观察其随着时间推移(即随着更多赔案信息发展)的变化(进展)模式。
3. 步骤:a) 编制“进展三角阵”,行是事故年,列是发展年,数据是累计赔款或已发生赔款。b) 计算相邻发展年的“进展因子”(链梯法基础)。c) 分析进展因子的历史趋势、稳定性及异常值。d) 计算“准备金释放(不利发展)”金额,即最新评估值与上年同期评估值的差异。

进展因子计算
对于发展年d,进展因子 f_d = Σ_{i=0}^{n-d} C_{i, d} / Σ_{i=0}^{n-d} C_{i, d-1},其中 C_{i,d}是事故年i在发展年d末的累计赔款。
准备金释放分析
事故年i在评估日t的准备金为 R_{i,t}。从t-1到t期间,该事故年的准备金变动 ΔR_{i,t} = R_{i,t} - R_{i,t-1}
ΔR_{i,t} > 0,表示不利发展(需补提准备金);若 < 0,表示有利发展(释放准备金)。
:分析过去10年准备金进展,发现车险 bodily injury 业务的发展因子呈上升趋势,表明过去低估了长尾性,未来评估需采用更保守的假设。

优点
1. 核心监控工具:是精算师监控准备金充足性的最重要工具,也是审计和监管审查的重点。
2. 识别系统性偏差:通过长期趋势分析,可发现业务结构、理赔管理或外部环境变化对准备金的影响。
3. 提供历史基准:为未来准备金评估假设(如选定链梯法因子)提供经验依据。
缺点
1. 后视性:主要反映过去经验,对未来变化的预测能力有限。
2. 受一次性事件干扰:大额赔案、法律变更等一次性事件可能扭曲进展模式。
3. 需要长期数据:对于新业务或快速变化的业务,历史进展模式参考价值有限。
实务:每季度/每年必须进行。分析结果需向管理层、审计委员会和监管机构报告。是准备金充足性测试的关键输入。

273

企业风险管理

风险聚合

风险聚合的Copula选择与尾部相关性建模

1. 问题:在计算整体经济资本时,需要聚合市场、信用、保险等不同风险模块的损失分布。风险间的依赖关系,尤其是极端情况下的尾部相关性,对聚合结果的尾部风险(如99.5% VaR)有决定性影响。
2. 核心思想:使用Copula函数建模风险间的依赖结构。不同的Copula刻画不同的依赖模式,特别是对尾部相关性的刻画:Gaussian Copula尾部独立,t-Copula和Clayton/Gumbel Copula具有尾部相关性。
3. 步骤:a) 通过统计检验(如Kendall's tau)分析风险因子间的秩相关性。b) 根据业务逻辑(如市场恐慌时,股市下跌与信用利差扩大往往同时发生)判断是否存在尾部相关性。c) 选择适当的Copula族并估计参数。d) 进行敏感性分析,比较不同Copula假设对聚合资本的影响。

尾部相关系数
上尾相关系数:`λ_u = lim_{q->1} P[F_1(X) > q

F_2(Y) > q]。<br>下尾相关系数:λ_l = lim_{q->0} P[F_1(X) < q

274

数据科学

客户管理

客户终身价值 (CLV) 预测模型

1. 核心思想:预测一个客户在未来整个关系周期内能为公司带来的净利润的现值。用于客户细分、资源分配和营销决策。
2. 核心组件:CLV = Σ [ (客户贡献t - 服务成本t) × 留存概率_t ] / (1+d)^t。关键在于预测:a) 客户贡献:保费、投资收益等。b) 服务成本:佣金、理赔、运营费用。c) 留存概率:客户在未来各期继续投保的概率。
3. 建模方法:a) 传统RFM模型:基于近期购买、频率、金额进行简单分段。b) 概率模型:如Pareto/NBD模型预测交易次数,Gamma-Gamma模型预测交易金额。c) 机器学习模型:使用GBDT、神经网络直接预测未来价值。

Pareto/NBD模型框架
假设客户购买行为服从泊松过程,流失时间服从指数分布。
客户i的购买率 λ_i ~ Gamma(r, α),流失率 μ_i ~ Gamma(s, β)
给定观察期内的交易历史 (x, t_x, T),可计算该客户在未来时段 (T, T+Δt)内的预期交易次数 E[X(T, T+Δt)]
Gamma-Gamma模型
在给定交易次数下,客户单次交易金额 Z的分布,用于预测未来交易金额。
CLV计算
CLV_i = Σ_{t=1}^∞ [E(Contribution_{i,t}) - E(Cost_{i,t})] * P(Active at t) / (1+d)^t

优点
1. 聚焦长期价值:引导公司从追求单笔交易转向维护长期客户关系。
2. 精准营销:识别高价值客户和潜在流失客户,进行差异化投入。
3. 衡量营销效果:评估客户获取成本是否能在其生命周期内收回。
缺点
1. 预测不确定性高:长期预测受众多因素影响(竞争、经济周期、个人情况),准确性有限。
2. 数据需求高:需要完整的客户交易和互动历史数据。
3. 模型复杂:概率模型假设较强,机器学习模型可解释性差。
实务:在寿险中用于评估代理人渠道的客户价值;在财险中用于车险续保管理和交叉销售。常与客户分群结合,将客户分为高价值、成长型、风险型、流失型等,制定不同策略。

275

养老金精算

计划设计

现金余额计划 (Cash Balance Plan) 的精算等价原理

1. 计划特点:一种混合型养老金计划,兼具确定给付型(DB)和确定缴费型(DC)特征。雇主承诺每年按员工工资的一定比例(如5%)向一个“虚拟账户”存入一笔“缴费”,并承诺一个固定的利息信用利率(如30年期国债利率)。员工退休时领取其账户余额转换的年金。
2. 精算等价:计划的设计核心在于确保承诺的缴费和利息信用,在精算意义上等于传统DB计划下承诺的退休给付。这涉及到将最终的账户余额通过一个转换系数(通常基于年金因子)转化为终身年金。
3. 负债评估:计划的负债等于所有员工虚拟账户的当前余额,加上未来缴费和利息信用的精算现值。这比传统DB计划更透明、更易理解。

账户余额积累
账户余额_{t} = 账户余额_{t-1} × (1 + 信用利率) + 当年缴费(工资×缴费率)
退休给付
退休时可选择一次性领取账户余额,或转换为终身年金:
年养老金 = 账户余额 / 年金转换因子
转换因子:通常基于达到退休年龄时的性别、利率和死亡率假设计算。例如,假设利率为5%,则每100元账户余额可转换为约7元的年养老金(粗略估计)。
负债计算
负债 = Σ (当前账户余额 + PV(未来缴费) + PV(未来利息信用))

优点
1. 对员工友好:账户余额清晰可见,易于理解,便携性优于传统DB计划。
2. 对雇主稳定:负债相对稳定,受利率波动影响小于传统DB(因为信用利率是预先设定的)。
3. 过渡工具:是企业从传统DB计划转向DC计划的常见过渡方案。
缺点
1. 利率风险转移:如果实际投资回报低于信用利率,雇主需承担差额损失。
2. 转换因子风险:退休时的转换因子若设定不当,可能导致年金价值不足。
3. 监管复杂性:在会计和监管处理上仍属于DB计划,需按DB规则进行精算评估和披露。
实务:在美国中小企业中较为流行。精算师需要为计划设定合理的信用利率和转换因子,并定期进行精算估值。

276

金融建模

期权定价

Black-Scholes 模型在保险嵌入式期权估值中的应用

1. 问题:许多保险产品包含嵌入式期权,如万能险的保证最低收益率、分红险的分红期权、投资连结险的保证最低身故利益等。这些期权具有金融期权特征,需用期权定价理论估值。
2. 核心思想:在风险中性测度下,期权的价值是其未来收益的期望现值。Black-Scholes模型为欧式看涨/看跌期权提供了封闭解,适用于估值某些简单的保险期权。
3. 应用示例保证最低积累利益可视为以账户价值为标的资产、以保证价值为执行价的看跌期权。分红期权可视为以公司利润为标的的看涨期权。

Black-Scholes 看跌期权公式
P = K*e^{-rT}*N(-d2) - S_0*N(-d1)
其中:
P:看跌期权价值。
S_0:标的资产当前价格(如账户价值)。
K:执行价格(如保证价值)。
r:无风险利率。
T:到期时间。
σ:标的资产波动率。
d1 = [ln(S_0/K) + (r+σ^2/2)T] / (σ√T)
d2 = d1 - σ√T
:估值一个5年后保证账户价值不低于100万的GMAB。当前账户价值90万,无风险利率3%,账户波动率15%。则 S_0=90, K=100, T=5, r=0.03, σ=0.15。代入公式计算看跌期权价值P,即为该保证的成本。

优点
1. 解析解:计算快速,易于理解和实施。
2. 市场一致性:使用可观察的市场参数(波动率、利率)。
缺点
1. 假设严格:假设波动率恒定、无股利、对数正态分布等,与保险负债的复杂现实不符。
2. 不适用于美式或路径依赖期权:保险期权常允许提前执行(如退保)或具有路径依赖特征(如 lookback 选项),BS模型不适用。
3. 难以处理死亡率风险:保险期权通常与生存概率相结合。
实务:BS模型是理解保险嵌入式期权价值的基础工具。对于更复杂的期权,通常采用蒙特卡洛模拟二叉树模型进行估值,并在IFRS 17和偿付能力监管下用于计算这些期权的市场价值资本要求

277

非寿险定价

细分市场/个性化

地理信息系统 (GIS) 与空间风险定价

1. 核心思想:将地理位置作为关键风险因子,利用GIS技术整合和分析空间数据(如犯罪率、交通密度、与消防局距离、自然灾害风险图、社会经济数据),对风险进行更精细的地理细分和定价。
2. 步骤:a) 数据层叠加:在电子地图上叠加保单位置点层、索赔位置点层、以及各种风险面图层(如洪水区、犯罪热区)。b) 空间分析:计算每个风险单位与各风险要素的距离或关联度(如位于百年洪水淹没区内)。c) 特征提取:为每个风险单位生成空间特征变量(如所在邮政编码区的平均索赔频率、500米内医院数量)。d) 建模:将空间特征作为变量加入定价模型(GLM或机器学习模型)。

空间特征创建示例
- 距离特征:到最近消防站的距离、到主干道的距离。
- 密度特征:1公里网格内历史索赔案件数。
- 区域特征:风险单位所在行政区域(如邮政编码)的平均索赔成本。
- 交互特征:风险单位类型(如木质结构)与所在野火风险区的交互项。
空间自相关检验:使用Moran's I指数检验索赔在空间上是否聚集。若存在显著空间自相关,则说明地理位置是重要风险因子。

优点
1. 风险识别更精准:能发现传统变量无法捕捉的局部风险模式(如特定街区的盗窃高发)。
2. 提升定价公平性:使保费更真实反映地理位置带来的风险差异。
3. 辅助核保与防灾:识别高风险区域,指导核保政策和防灾减损措施。
缺点
1. 数据获取与处理成本高:需要购买或维护地理数据,并进行复杂的空间数据处理。
2. 隐私与公平性质疑:使用精细的地理数据可能涉及隐私问题,并可能导致对某些区域的“红线”歧视(拒绝承保或收取过高保费)。
3. 动态更新:城市环境变化快,空间风险特征需要定期更新。
实务:广泛应用于车险(基于邮政编码定价)、家财险(洪水、地震风险)、商业财产险。是​ telematics​ 和物联网定价的补充。需遵守监管对使用邮政编码等地理因子定价的规定。

278

运营管理

理赔流程

理赔自动化与智能定损模型

1. 核心思想:利用图像识别、自然语言处理和规则引擎等技术,自动化处理理赔流程中的任务,特别是车险和简单财险的定损环节,以提升效率、降低成本和减少欺诈。
2. 应用场景:a) 自动理算:规则引擎根据保单条款和事故信息自动计算赔付金额。b) 图像定损:通过上传的车辆损伤照片,AI模型自动识别损伤部位、严重程度,并估算维修工时和配件价格。c) 文本分类与抽取:自动从报案描述中提取关键信息(事故原因、责任方)。

图像定损模型流程
1. 目标检测:识别图像中的车辆、损伤区域。
2. 损伤分类与分割:对损伤区域进行分类(刮擦、凹陷、破裂)和像素级分割。
3. 维修方案生成:基于损伤类型、位置和严重程度,匹配维修工艺(钣金、喷漆)和所需配件。
4. 价格估算:查询配件数据库和工时费率库,生成维修费用估算。
模型训练:需要大量标注好的车辆损伤图像数据,标注信息包括损伤边界框、类型、维修方案和成本。

优点
1. 效率革命:将简单案件的处理时间从小时/天级缩短到分钟级,实现“秒级定损”。
2. 成本节约:大幅减少定损员人力成本,降低外部合作修理厂的定损费用。
3. 一致性提升:减少人工定损的主观差异和潜在道德风险。
缺点
1. 技术局限性:对复杂损伤(如内部结构损伤)、特殊车型或恶劣拍摄条件的图片识别准确率有限。
2. 欺诈对抗:欺诈者可能利用AI的弱点(如对修图照片的误判)进行欺诈。
3. 初期投入大:需要投入大量资源进行数据标注、模型开发和系统集成。
实务:主流保险公司已广泛应用。通常采用“人机结合”模式:AI处理简单、标准案件,复杂案件转人工。系统需不断迭代以应对新的欺诈手段和车型变化。

279

会计准则

保险合同

IFRS 17 的变量收费法 (Variable Fee Approach, VFA)

1. 适用范围:主要适用于具有直接参与分红特征的保险合同,即合同持有人有权分享一个明确指定的 underlying pool of items(如投资基金)的收益,且保险公司承诺支付等于该 pool 价值减去“变量收费”的给付。
2. 核心思想:将合同负债视为公司有义务支付 pool 的价值,但同时公司有权收取一项“变量收费”(代表服务费和风险补偿)。负债的变动主要源于:a) pool 价值的变化;b) 变量收费的变动。变量收费的变动在提供服务的期间确认为收入。
3. 关键计算:合同服务边际(CSM)的调整不仅包括时间流逝和当期服务,还包括因 underlying items 价值变动引起的“变量收费”的变动。

VFA下的CSM调整
CSM_t = CSM_{t-1} + 利息 + 当期服务释放 + ΔFVA_t
其中 ΔFVA_t是当期因 underlying items(如投资基金)价值变动引起的变量收费的变动。
变量收费 (VF)​ 定义:
VF_t = PV(未来给付) - PV(未来收费),本质上代表了公司未来可获得的利润份额。
Underlying items 价值变动的影响:当 underlying items 价值上升时,未来给付现值上升,但变量收费也相应变动(ΔFVA),这部分变动调整CSM,而非立即计入损益,从而实现了利润的平滑。

优点
1. 匹配经济实质:反映了分红合同持有人与保险公司共同承担投资风险、分享投资收益的特征。
2. 减少波动:将投资波动的影响通过CSM在后续服务期间摊销,避免了投资市场波动对当期损益的剧烈冲击。
缺点
1. 极度复杂:是IFRS 17中最复杂的模型,对数据、系统和精算能力要求最高。
2. 主观判断:如何定义“明确指定的 pool”以及确定变量收费,涉及重大判断。
3. 实施挑战:需要与投资会计系统深度集成,实时跟踪 underlying items 的价值变动。
实务:适用于投资连结保险(有保证)、分红保险万能保险等。其正确应用是保险公司实施IFRS 17的最大挑战之一,需要精算、财务和IT部门的紧密协作。

280

风险管理

新兴风险

网络安全保险定价与风险累积管理模型

1. 问题:网络安全风险(数据泄露、勒索软件、业务中断)发生频率和严重性不断上升,但其损失分布缺乏历史数据,且具有极强的风险累积潜力(一次攻击可能影响大量保单)。
2. 核心思想:结合威胁情报安全控制评估精算模型进行定价。a) 威胁建模:分析被保企业的数字资产、潜在攻击路径和漏洞。b) 安全评分:通过问卷或扫描评估被保企业的网络安全成熟度。c) 损失分布建模:利用行业损失数据、模拟攻击场景,拟合频率和严重性分布。d) 累积风险建模:考虑共同依赖(如共用云服务商)导致的潜在系统性风险。

定价框架
纯保费 = 预期频率 × 预期损失
频率建模:常使用泊松分布或负二项分布,参数基于行业基准数据,并根据企业安全评分调整(如安全评分高的企业,频率参数打折)。
损失严重性建模:由于尾部极厚,常使用帕累托分布、对数正态分布或广义帕累托分布(GPD)。损失包括:事件响应成本、监管罚款、业务中断损失、勒索支付、法律费用等。
累积风险:使用网络攻击传播模型模拟恶意软件在互联系统间的传播,估计一次大规模攻击可能同时影响的保单数量。

优点
1. 促进风险减量:通过安全评分和保费折扣激励企业提升网络安全水平。
2. 新兴市场机会:是增长最快的险种之一,为保险公司带来新保费。
缺点
1. 数据匮乏:历史损失数据有限且不透明,建模不确定性极高。
2. 风险动态快速演变:攻击技术日新月异,模型容易过时。
3. 系统性风险突出:云服务集中化、软件供应链攻击等导致风险高度关联,传统再保险难以分散。
4. 潜在巨灾损失:一次国家级网络攻击可能导致行业崩溃性损失。
实务:定价高度依赖网络安全风险评估问卷。保险公司常与网络安全公司合作,提供扫描和监控服务。再保险安排至关重要,且再保人对此类业务非常谨慎,容量有限。

281

经验分析

死亡率/长寿风险

Lee-Carter 模型及其扩展

1. 问题:预测未来死亡率改善趋势,用于养老金和年金业务的长寿风险评估、寿险业务的死亡率改善假设。
2. 核心思想:Lee-Carter模型将年龄别死亡率的对数分解为:一个随年龄变化的平均死亡率水平、一个随时间变化的改善趋势、以及一个年龄特定的改善敏感度。ln(m_{x,t}) = a_x + b_x * k_t + ε_{x,t}。通过时间序列模型(如ARIMA)预测未来的 k_t,进而预测未来死亡率。
3. 扩展:为处理多人口(如分性别、地区)或高阶改善趋势,有诸多扩展模型,如APC(年龄-时期-队列)模型、CBD(Cairns-Blake-Dowd)模型等。

经典Lee-Carter模型
ln(m_{x,t}) = a_x + b_x * k_t + ε_{x,t}
其中:
m_{x,t}:x岁在年份t的中心死亡率。
a_x:年龄别平均死亡率对数。
b_x:年龄别改善模式(敏感度),表示 k_t变动对年龄x死亡率的影响程度。
k_t:时间趋势指数,捕捉死亡率随时间改善的整体水平。
估计与预测
1. 用奇异值分解(SVD)估计 a_x, b_x, k_t
2. 对估计出的 k_t序列拟合时间序列模型(如带漂移的随机游走:k_t = k_{t-1} + d + e_t)。
3. 预测未来的 k_t,代入模型得到未来死亡率预测。

优点
1. 简洁有效:模型形式简单,仅用三个参数就能捕捉死亡率的主要时空特征。
2. 成为行业标准:是人口学和精算学中预测死亡率的基准模型,被广泛用于官方人口预测和生命表编制。
缺点
1. 单一改善趋势:假设所有年龄的死亡率按同一趋势 k_t改善,且改善模式 b_x固定,这可能不符合实际(如不同年龄组改善速度不同)。
2. 不确定性处理不足:对预测区间(尤其是长期预测)的估计可能过于狭窄。
3. 对极端事件不敏感:如疫情导致的死亡率短期上升,模型难以捕捉。
实务:各国统计

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐