律商风险受邀参加“大数据与人工智能在保险行业的机遇与挑战”研讨会-山西快讯

近日，律商联讯风险信息（以下简称“律商风险”）数据科学负责人单翔受邀参加 “大数据与人工智能在保险行业的机遇与挑战”网络研讨会，并作为圆桌论坛嘉宾发表讲话。该会议由英国精算师协会（IFoA）与中国精算师协会(CAA)联合主办，邀请了英国精算师协会会员和中国精算师协会会员参加。

单翔作为圆桌论坛嘉宾，从车险领域，与参会嘉宾探讨了大数据与人工智能对车险行业的影响，及大数据与人工智能应用的挑战和考量。

大数据与人工智能对车险行业的影响

单翔从大数据在保险领域的进化流程、人工智能在算法的进化流程及AI在保险4个领域的应用价值阐述了大数据与人工智能对车险行业的影响。

首先，大数据在保险领域的进化流程。保险业在大数据的影响下正经历深刻变革。大数据促使保险业务将过去的操作流程数据化，以实现信息载体的无纸化。以车辆保险为例，传统的车辆保险业务主要依赖于机械性工艺和简单的电子元件。然而，随着技术的发展，传感器和网络的普及，保险业能够记录更多的数据。例如，车辆的运行数据，机油更换、加油记录以及启动次数的电子化信息等，从而更准确地评估车辆的风险状况。

保险业进入数据时代后，标准化数据的采集和处理变得至关重要。数据可能来自结构化和非结构化来源，需要进行标准处理并解决数据缺失等问题。保险公司逐步建立自己的数据库，但数据治理也成为关键，包括前端业务录入信息的准确性、车主信息及投保人信息的真实性等。

随着技术的发展，保险公司不仅拥有承保和理赔数据，还开始获取询价数据，这些数据来自不同的业务系统，因此数据链接变得非常重要。保险公司基于传统数据库建立数据仓库，使用统计分析工具查看数据，并进行多维拖拽分析。

此外，随着设备算力的增强，如联网车辆、智能手机和可穿戴设备等，保险业面临新的数据挑战和机遇。这些设备产生的数据颗粒度更细，数据量更大，需要新的数据计算和存储方式。云计算和边缘计算逐渐成为应对这些挑战的重要技术。无人驾驶和自动驾驶车辆的数据存储和记录方式正在发生变化，这些车辆会并发出大量数据，进行实时存储，为保险业带来了新的数据流。

其次，人工智能在算法的进化流程。早期，人工智能算法主要基于传统统计模型，这些模型可以归类为有监督的机器学习。广义线性模型在90年代的美国得到了广泛应用，特别是在保险定价领域。1943年，McCullock & Pitts提出MP神经元模型的概念，模拟人脑的工作方式。1950年，著名的密码分析学家艾伦·麦席森·图灵（Alan Mathison Turing）提出了图灵测试，作为人工智能是否具备真正智能的标准。60年代，神经网络的概念得到进一步发展，但单层感知器（Perceptron）主要解决线性问题，而多层模型缺乏有效的训练算法，导致人工智能经历了第一次寒冬。1986年，Hinton等在《Nature》发表论文提出基于反向传播机制的算法，解决了神经网络的计算问题，使神经网络再次回到人们的视野。同期，决策树、分类回归树CART等分类算法也被提出。这一阶段，网络训练依然面临BP梯度消失和梯度爆炸等难题，二次进入寒冬。2006年，Hinton等提出深度网络的训练方法《A Fast Learning Algorithm for Deep Belief Nets》，通过逐层预训练和微调的方法，解决了多层神经网络难以训练的问题。2012年，Alex、Ilya和Hinton在AlexNet图像识别竞赛中，基于CNN网络使用GPU求解深度学习模型，比赛取得了巨大成功，引领了深度学习的高潮。阿尔法狗（AlphaGo）在围棋比赛中击败人类，展示了强化学习的强大能力。2014年，生成对抗网络被提出，用于生成各种图像和产品，生成式AI兴起。

目前，人工智能算法已经广泛应用于各个领域，包括图像识别、语音识别、自然语言处理等。随机森林、神经网络等算法在保险定价、实时报价等领域发挥着重要作用。生成对抗网络等新技术也在不断发展，为人工智能的应用提供了更多可能性。

最后，AI在保险4个领域的应用价值。机器学习在保险行业的应用涵盖了定价、核保、核赔、反欺诈和前端客服等多个方面，为提高保险行业的效率和准确性提供了新的解决方案。

定价方面，传统精算定价首先关注的是定价问题,这一目标仍然没有变。使用机器学习算法进行定价，以更全面地考虑包括大量外部因素在内的各种变量，解决模型泄露问题（Model Leakage）。核保方面，机器学习在保险行业的另一个重要应用是核保。国内保险公司已经通过让代理人或客户填写保单信息来提高效率。自动核赔方面，通过特定的技术，如OOV（Out-Of-Vocabulary）对传递的单据和证明进行判定和执行。保险公司已经提供了理算公式，并经过提炼和处理，以更准确地计算损失。反欺诈方面，也是机器学习应用的一个重要方向。同时，声纹识别也被用于识别报案人身份，以避免欺诈行为。此外，机器学习还在前端客服方面发挥重要作用。聊天机器人可以实现智能客服和智能语音等功能，提高客户服务的质量和效率。

“关于机器学习技术在保险业中的应用，以律商风险在美国市场的车辆核保场景为例，通过拍照比对承保前后的车辆瑕疵情况，可以迅速判断车辆是否遭受损失，从而有效控制核保风险，并优化理赔流程。” 单翔在研讨会上表示，尽管这些创新应用在保险行业中展现出巨大的潜力，但仍面临一些挑战。首先，数据库和数据方式以及系统的转换问题成为制约技术应用的关键因素。保险公司需要克服数据存储和成本等方面的难题，实现系统的升级和转换。其次，监管因素的影响也不容忽视。在欧洲等地，监管要求可能更加严格，保险公司需要密切关注监管政策的变化，确保技术应用符合相关法规要求。此外，人员短缺和文化方面的障碍也是保险公司面临的重要问题。缺乏既懂保险又懂技术的复合型人才，以及员工对新技术应用的抵触情绪，都阻碍了保险行业的数字化转型进程。

据统计，目前仍有70%的保险公司认为自己在机器学习应用方面存在欠缺，而仅有30%的保险公司正在尝试开发相关应用。因此，保险公司需要加强顶层设计，实现一体化推进，同时注重培养具备跨学科知识的复合型人才，以推动保险行业的数字化转型和创新发展。

大数据与人工智能应用的挑战和考量

单翔在研讨会上表示，随着大数据时代的到来，数据安全成为了各行各业不可忽视的重要议题。在建模过程中，如何确保数据的安全性和多样性，同时关联数据以支持业务决策，成为了技术领域的核心挑战。特别是在调用接口时，涉及车辆信息、个人身份证等敏感信息的加密处理，以及查询字段的安全保障，都需要严谨的技术手段来确保数据安全。

针对这一挑战，联邦学习作为一种新兴的技术解决方案，正在逐渐受到业界的关注。该技术通过优化中央处理器和本地模型，实现数据在不出域的情况下进行模型迭代和优化。以谷歌提出的联邦学习概念为例，该技术通过不断缩小模型优化的梯度偏差，最终收敛到准确的预测结果，从而在保证数据安全的前提下，实现模型的高效迭代和优化。

与此同时，在精算科学领域，大数据和机器学习技术的应用也为定价工作带来了新的变革。以保险行业为例，尽管定价目标一直未变，即获取更加公平的费率并将分类费率做得更加精准，但大数据和机器学习技术的引入，使得这一目标更加容易实现。通过收集和分析更多的数据行数和特征，以及利用机器学习算法自动寻找变量之间的交互关系，保险公司可以更加准确地评估风险，从而制定出更加合理的费率。

然而，在享受大数据和机器学习技术带来的好处的同时，也需要警惕其可能带来的风险。首先，数据质量的问题不容忽视，数据偏见和歧视可能导致不公平的决策结果。其次，模型的全局最优解难以确定，需要谨慎选择和优化模型参数。此外，还需要关注模型结果的可解释性和透明度，以及建立人工监督和干预责任制度，以确保模型的公正性和准确性。

在数据安全方面，业界也提出了一系列原则来指导实践。这些原则包括考虑模型或解决方案对人们产生的实际影响、采取主动行为防止偏见产生、确保模型透明且可解释、建立人工监督和干预责任制度以及尊重隐私并倡导正义。这些原则的实施将有助于在大数据和机器学习技术的推动下，实现数据安全与业务发展的双赢。

在研讨会的最后，单翔表示，作为精算师，我们需要积极拥抱新技术，将其转化为实际工作中的生产力。利用这些新技术进行更高效的数据分析和预测，提高定价和准备金等方面的准确性，为保险行业的发展贡献力量。