案例背景
广发证券成立于1991年9月,是国内首批综合类证券公司,自1994年开始一直稳居全国十大券商行列,是市场上具有较高影响力的证券公司之一,也是业内最早一批建设AI平台的企业。广发证券营业部共计264个,在全国31个省市自治区均有覆盖。截至2018年12月31日,广发证券服务客户近300万,托管客户资产超4000亿元。2018年研发、信息技术总投入7.73亿元,位列上市券商TOP3;营业收入152.70亿元,资本实力及盈利能力在国内证券行业持续领先。
问题与需求
1、工具碎片化
广发证券以往在营销、风控、投研的人工智能化方面已经有了一定的积累,但各类数据挖掘工具均为单机搭建,导致无法提供分布式算法、分析语言不同、运行平台不同等问题出现。分析工具碎片化致使IT人员需要频繁地安装、运维各类工具,管理和更新各类算法包。
2、信息碎片化
工具的碎片化导致了信息的碎片化。对信息进行预测等分析时需要对信息进行特征抽取和模型建立,而原有的日志数据/非结构化数据在DB难以保存和使用。之前构建的特征信息无法积累、模型无法分享,极大地增加了数据探索、数据预处理、重复建模的工作成本。
3、平台封闭化
广发证券现有的传统数据挖掘未融合大数据平台,无法形成数据+模型+服务的完整生态体系,无法实现团队协作,如模型管理、模型分享等功能。企业的智能化建设流程比较复杂,业务的创新成本非常高。
4、数据时效性差
2018年是银保监会的监管元年,央行发布了《关于规范债券市场参与者债券交易业务的通知》,沪证监机构2号文发布《关于进一步加强证券基金经营债券交易监管的通知》以及证监办发89号文发布《关于进一步加强证券基金经营机构债券交易监管的通知》等配套文件,对于证券机构的实时风控要求不管提高。现有的平台无法满足海量数据的实时处理需求,以应对监管机构要求的结合实时交易数据进行准确的交易风控、集团风控等。
解决方案
广发智能平台的整体架构图如下,分为知识库和应答引擎、语义引擎、知识图谱、智能化管理平台和机器学习平台五个模块。
图:广发智能平台架构图
知识库和应答引擎。通过私有化部署方式,搭建基于语义智能应答服务以及基于机器学习的知识库和应答引擎。知识库通过自学习能力来实现知识库优化,满足各个渠道用户的提问需求及实现人机交互的功能。智能引擎在构建过程中,对用户输入的问题使用自然语言处理的命名实体识别、知识抽取、语义识别、指代消解等功能进行客户语义分析,准确理解客户的真实用途,自动作出应答。
语义引擎通过NER、知识抽取等技术自动抓取相关文本,对数据中的实体进行准确识别、属性抽取,实现新实体发现、实体间关系的确立、实体类型的准确划分及实体和关系的属性赋予,并且支持对文本打标签、打关键词、关联关系计算等功能。
知识图谱。通过已搭建的公司知识图谱构建的图网络关系,结合信用主体公司所发行的债券、股票等标的,以及正负面舆情数据,进而发现风险事件在知识图谱上传导,并影响公司标的价格变化的可视化全流程。知识图谱主要辅助于证券行业的投研、风控、合规、反洗钱和反欺诈。
智能化管理平台作为一个智能化的服务集成,兼具统一规范的服务接口,提供各项的服务、接入方式,实现统一管理。
机器学习平台。提供从数据探索、数据处理、模型构建、模型训练,直至模型应用发布和管理的全流程,并且用算力支撑知识图谱的构建和更新优化,有助于提取数据中蕴含的商业价值数据,提高企业核心竞争力。
实施效果
广发证券借助星环科技人工智能平台Sophon及其相关前沿技术,实现了金融行业知识图谱和问答体系的初步构建,为业务分析师提供可视化拖拉拽的数据/分析挖掘工具和专业算法库,实现团队协作、产品推荐、用户体验等各方位的运营效率提升。
1、可视化的数据分析挖掘工具,实现团队高效协作
通过星环的机器学习平台为业务分析师、算法专家、数据挖掘工程师等各个岗位提供了统一的可视化、拖拉拽的数据分析/挖掘web和客户端界面。平台内置100多种分布式算子(如常用机器学习算法、深度学习、自然语言处理),底层对接 Spark、Tensorflow、MXnet 等框架,集成了金融算法库和行业模板。使用者可自定义添加算子,并提供模型导出、模型管理、模型分享等功能,实现团队高效协作。广发证券机器学习平台为业务分析师提供可视化拖拉拽的数据分析挖掘工具,降低了业务人员学习代码的成本,满足各个部门平台要求的同时,减轻了IT部门运维管理的压力。同时,通过对模型的训练、优化,快速迭代,为上层应用提供了有力的算法支撑。
2、利用机器学习优化原有模型,将产品推荐成功率提高10倍
通过使用星环的智能平台,广发根据用户行为数据和用户的资产数据,提取用户特征,形成用户画像标签,标签分为用户画像和产品画像,总计数百个特征,包括用户购买股票的行为数据、资产数据、产品点击历史和购买历史等。通过智能平台进行机器学习算法建模,通过多个弱分类器(决策树)构造一个强分类器,结合用户个人属性、用户理财属性等二十多个特征构造产品购买模型,最终实现产品的有效推荐。
通过收集用户特征进行机器学习的产品推荐的成功率比之前的排序模型提高了10倍精准度,基金推荐的点击率也相应提高。对于广发证券来说,能够通过用户特征、产品特征、购买和点击行为数据的积累,不断优化产品推荐模型的成功率。
3、基于图像识别技术的用户输入流程优化,提高用户体验
在证券行业的用户身份认证场景中,当用户用身份证、银行卡进行信息录入时,智能平台使用图像识别技术自动提取用户上传的身份证和银行卡照片中的文本信息,减少用户输入成本,切实提高用户体验。星环的智能平台提供CAFFE和OPENCV的深度学习框架支持,并且提供文件系统的管理,管理用户上传的图片文件。由于券商对于数据的安全要求较高,星环智能平台支持文件和用户的权限隔离,确保用户数据的隐私安全。
4、基于星环Slipstream流处理引擎实现智能风控
基于星环Slipstream的流处理引擎,广发证券实现了对实时的交易行情数据进行智能风控,输出量化风控指标,构建风险数据集市,并生成风险管理驾驶舱。