查看原文
其他

金融,大模型落地的关键场景!

DataFunTalk
2024-09-10

垂直金融大模型如何落地?

RAG、Agent怎样应用?

因果推断、Uplift模型仍然发挥作用?

最新的大数据和数据治理实践?

金融公司数智化三部曲是什么?

作为大模型应用的关键场景之一,金融既接受大模型技术的快速引入,也同时对大模型提出了各种苛刻的要求。8月31日,09:00-17:00,DataFun将联合业内多位知名专家举办DataFunSummit2024:数智金融技术峰会并和大家一起探讨大模型领衔的数据和智能技术的最新态势,分享各自的研究成果与实践经验,共同推动大模型及相关技术在金融领域的深入应用。感兴趣的小伙伴欢迎识别二维码免费报名,收看直播:

扫码免费报名,收看直播

峰会日程

论坛介绍

详细介绍

王心怡 马上消费金融 算法工程师

个人介绍:王心怡,现就职于马上消费的算法工程师一职,本科毕业于天津大学信息管理与信息系统专业,硕士清华大学物流工程,目前主要研究兴趣在因果推断、运筹优化领域。

演讲题目:基于树模型的 Uplift 模型在马上消费中的应用

演讲提纲:

1. 引言

- 介绍马上消费金融公司的背景和业务概况。

- 阐述电话营销在金融领域的重要性。

- 提出问题:在什么时间段拨打电话能够最大化客户接通率

2. Uplift模型概述

- Uplift模型的基本原理与概念介绍。

- Uplift模型与传统预测模型的区别:不仅预测响应,还量化干预效果。

- 树模型在Uplift建模中的应用:如Causal Forest, Uplift Random Forest等。

3. 基于树模型的Uplift模型在电话营销中的应用

- 现有问题:电话营销的时间段选择如何影响客户的接通率。

- 解决方案:使用树模型的Uplift模型进行因果推断,确定最优拨打时间段。

- 数据处理和特征选择:包括客户历史行为数据、个人特征数据。

- 模型训练和验证:使用历史电销数据进行模型训练,使用部分数据验证模型效果。

听众收益:

1. 理解Uplift模型的基础知识及其在金融领域的应用场景

- 了解Uplift模型的原理及其相较于传统模型的优势。

- 掌握如何利用Uplift模型来优化营销决策。

2. 学习基于树模型的Uplift模型在电话营销中的实际应用

- 通过具体案例,理解如何使用数据驱动的方式优化营销策略。

- 了解模型开发过程中可能遇到的挑战及应对策略。

3. 获得提升电话营销效果的实用方法

- 学习如何通过数据分析和模型应用提升营销效果。

- 掌握在营销策略中使用Uplift模型的实际操作技巧。

落地挑战和方案重点:

1. 高质量营销数据的收集与处理

- 数据的时效性和准确性。

- 数据量大且分散,如何确保数据一致性。

2. 模型在实际应用中的稳定性和泛化能力

- 如何在模型开发和部署中保证稳定的效果。

- 应对不同客户群体和不同时段的模型表现差异。


霍亮宇 度小满 AI算法研究员

个人介绍:7博士毕业于北京航空航天大学,博士期间主要从事深度强化学习、模仿学习研究工作,相关研究成果发表在TPAMI、TCOM、AAAI等国际知名期刊和会议。博士毕业后进入度小满和中科院自动化所联合培养的博士后工作站,主要从事AI算法研发工作。工作期间主要负责轩辕金融大模型的强化对齐工作。构建了完善的RLHF训练框架,重点突破奖励模型存在的问题与难点,通过强化训练改善轩辕大模型的有用性、安全性和金融能力,显著提高与人类价值观的对齐程度。

演讲题目:金融大模型训练与对齐技术探索

演讲介绍:近年来,大语言模型已逐渐成为AI领域的研发热点。通过增加模型尺寸,并使用海量数据进行训练后,模型可获得各项知识并展现出了较强的通用能力,包括知识、理解、逻辑推理等。大语言模型有望为金融行业创造新的价值增量。然而在实践中我们发现目前的通用大语言模型难以胜任金融任务,其仍欠缺专业的金融知识,金融能力也不能满足金融任务的需求。此外通用大语言模型的训练和部署成本极高,这给其在金融领域的应用落地也带来了一系列挑战。为了解决这些问题,我们研发了金融领域的轩辕大模型。通过补充大量的高质量金融数据并采用一系列创新性做法对大模型进行预训练和SFT,显著提升了大模型金融知识和金融能力,同时保证了模型的通用性。在此基础上,我们通过RLHF技术进一步对齐了模型价值观与人类偏好,在保证金融能力的同时,减少潜在的安全性风险,显著提升了模型体验。

我们先后研发并发布了6B、13B和70B的轩辕金融大模型,在一系列测试基准中表现优异,覆盖了不同模型尺寸范围,构建了完整的大模型能力矩阵。本次分享主要介绍轩辕大模型研发过程中采取的相关技术,包括预训练、SFT、偏好奖励训练及RLHF等。此外也会介绍轩辕大模型的开源情况及其在金融业务中的应用落地情况。主要内容包括:

1. 从通用大模型到金融大模型的挑战

2. 度小满轩辕大模型的诞生之路

3. 金融大模型的训练与对齐经验探索

4. 金融大模型的落地与展望

听众收益:

1. 金融大模型训练过程

2. 大模型对齐的方法与经验

3. 金融大模型落地案例

落地挑战和方案重点:

1. 高质量金融数据的收集

2. 应用场景下的稳定性保证

张恺 东方财富 人工智能研究院 技术科研负责人

个人介绍:专注人工智能及大数据领域研究15+年,在东方财富/携程/优刻得等多家知名企业从事相关技术研发与团队管理工作,对大模型预训练及评测,互联网个性化推荐及广告算法服务有深入研究和实践,尤其在金融、旅游、AI领域有多项研究与实践,具备多次从零到一构建数据团队或算法团队的经验。

演讲题目:智能金融稳步前行:构建负责任的可信大模型

演讲介绍:在金融领域,人工智能正迅速成为推动行业创新的关键力量,但同时也伴随着大量的安全风险隐患,这无疑对于金融领域是一条严守的红线。本次演讲将深入探讨大型在金融领域的落地难点,并如何通过可信的方法缓解相应难点和挑战。分享将介绍我们选择的方案及其技术亮点。并通过实际案例,展示我们的解决思路和策略,以及这些策略如何有效应对落地挑战,最终实现业务的显著成效。具体内容包括:

1. 业务背景:

① 金融行业的现状与挑战

② 人工智能在金融领域的应用前景

2. 方案选型:

① 为什么选择大模型

② 大模型的技术优势与业务适配性

3. 落地挑战:模型的可解释性与合规性

4. 解决思路:

① 负责任的 AI 实践

② 模型透明度与伦理考量

5. 解决成效:业务流程优化案例

6. 未来规划:技术迭代与创新方向

7. 总结:

① 负责任的大模型在金融领域的长远影响

② 对行业未来发展的展望

听众收益:

1. 了解如何将人工智能大模型技术应用于金融领域,以及其带来的变革。

2. 掌握在金融领域实施可信 AI 的关键原则和实践方法。

3. 获取关于数据隐私保护、模型可解释性与合规性的实际解决方案和案例分析。

落地挑战和方案重点:

1. 数据隐私与安全:介绍如何通过先进的数据加密技术和访问控制来保护用户数据。

2. 合规性:讨论如何确保 AI 模型遵循金融行业的法规和标准。


张海涛 海康威视 金融架构师,国际注册云安全系统认证专家

个人介绍:金融从业10年以上,个人擅长AloT的大数据、流计算、AI人工智能等技术研究,QCon 大数据金牌讲师。Apache Beam 中文社区发起人之一及 ClickHouse Conner。自研大数据技术获得国家发明专利,落地的数智金融项目获得省部级科技进步奖三等奖。

演讲题目:银行快速数智化转型的改革先锋-视频分析大模型技术

演讲介绍:随着近几年经济下行,银行业现金业务线上化,实体网点逐年减少,人力成本的增加,金融机构数字化,国家金融监管局的监管力度加强,未来实体网点数字化、无人化、智能化成为未来的发展趋势。在数字化转型的大浪潮中,怎么解决以上的问题,快速实现稳定全面转型成为新的挑战。

演讲提纲:

1. 银行点、库、楼、房、区 50多种视频分析应用场景的介绍

2. 银行应用场景中需要哪些算法&挑战

3. 遇到的问题怎么去解决&未来发展趋势

听众收益:

1. 全面了解大模型在银行那些场景中应用。

2. 全国百万路视频、BP 级的流数据场景,分析架构怎么去设计?

3. 为什么要用大模型?大模型 NB 在那里?

落地挑战和方案重点:

1. 带宽是视频物联网技术发展的的痛

2. 规则的变化、环境的变化导致应用场景倍增。


扫码免费报名,收看直播

出品人:李渔 熵简科技 联合创始人兼CTO

个人介绍:熵简科技联合创始人,清华大学电子工程系博士,已在顶级会议及国际期刊发表18篇学术论文,申请专利10项,长期从事自然语言处理及深度学习与金融资管领域的交叉研究和应用探索,让科技赋能产业。目前负责熵简科技NLP技术中台的建设,包括层次化的分层架构、大数据泛采体系、持续部署的后台支持以及前沿算法的领域内落地等,为熵简科技的各大业务线提供底层技术支持和可落地的解决方案。曾获北京市优秀博士毕业生,清华大学优秀博士论文,腾讯云TVP专家等荣誉。

演讲题目:面向金融资管场景的 RAG 体系建设和落地实践

演讲介绍:大语言模型(LLM)在落地到金融资管场景时存在三方面的不足,包括无法提供及时信息、生成内容可能存在幻觉、金融专业深度不够,这大大限制了 LLM 在金融这类高实时性、高准确度场景上的落地效果。在本次演讲中,我们将分享熵简科技如何基于多年的金融数据治理经验和自然语言处理的积累,去构建专门面向金融资管场景的 RAG 体系,用以协同LLM解决上述三类问题。整个 RAG 体系包含识别率高达95%以上的PDF解析引擎、超长文档语义分割引擎、召回效率强于其他向量化模型50%的 FinBERT2模型以及检索效果高出OpenAI embedding 30%的FinSearch 语义检索引擎四大核心组件。整个 RAG 系统能够在 2000万数量级的金融文档上实现 97% 的检索召回率,辅助 LLM 在个股洞察、宏观研究、行业分析等方向接近初中级投研分析师水平,并逐步将LLM的服务能力向机构服务端、财富管理端演进。

演讲提纲:

1. 大语言模型在数智化金融资管系统建设上的典型需求和主要挑战

2. 熵简科技构建的面向金融资管场景的 RAG 体系及落地案例

3. RAG 体系的关键组件:三阶段训练而成的金融专属向量化模型 FinBERT2

4. RAG 体系的关键组件:打造接近人找资料能力的高性能检索系统

听众收益:

1. 了解大语言模型在数智化金融资管系统建设上的典型场景和主要挑战;

2. 了解如何通过领域内海量数据的预训练结合对比学习,构建明显优于当下最好开源向量模型以及闭源向量模型的向量化模型;

3. 了解如何通过构建千万级文档下超高召回率的检索系统;

落地挑战和方案重点:大语言模型(LLM)在落地到金融资管场景时存在三方面的天然不足,一则由于知识存在模型权重中且很难做到高频训练,因此无法提供及时的资讯;二则,当前阶段LLM无法完全抑制幻觉,这无法满足金融资管对于高准确性的要求;三则在金融专业度不够。

张庆 东方证券 算法工程师

个人介绍:张庆,博士在东方证券任职期间,负责公司内金融行业AI前沿技术的探索与研究,在券商自营、债券营销、财富管理等多个领域结合业务痛点成功落地和主持多个业务项目,拥有丰富的金融行业智能算法研究与模型设计经验。相关项目和课题曾荣获2023年上海青年金融业务创新大赛二等奖,2021年证券业协会优秀课题奖、深交所金融科技优秀课题、上海市企业管理现代化创新成果二等奖、第二届 NIFD-DCITS 金融科技创新案例等。

演讲题目:大语言模型在投研投顾中的应用与难点

演讲提纲:随着去年年初开始大语言模型的火热,金融领域中使用大语言模型构建应用辅助开展业务实现降本增效得到了广泛的关注,本次分享以大语言模型在投研投顾场景中如何应用,分析其实践过程中大语言模型应用的难点为切入点,讲述如何通过检索增强构建有效投研投顾应用,技术的适用范围及相关技术的未来展望。

听众收益:

1. 了解大语言模型在实际金融场景中应用时存在的问题

2. 在构建或选择 RAG 时,为什么效果不佳及如何改善

落地挑战和方案重点:

1. 基线 RAG 在长程关联和总结类问题上无法支持

2. 各类文档与检索要求的不同导致 RAG 定制化程度过高

王永合 平安壹钱包 大数据研发部算法负责人

个人介绍:2021年入职平安集团,现任平安壹钱包大数据研发部算法负责人。主要致力于大数据算法研发、工程落地、平台化建设等方面探索,先后负责推荐系统、实时推荐算法、大模型平台建设,并从0到1建设了智能风控运营的全生命周期闭环。

演讲题目:AIGC 辅助账户风险管理

演讲介绍:在金融科技的浪潮中,账户风险管理一直是金融机构关注的焦点。传统的人工驱动流程在处理复杂的欺诈案件时,不仅耗时且容易出错。随着大模型技术的兴起,我们有机会通过智能化手段,提高风险感知和风控决策的能力,从而降低人工失误率,提升运营效率。本次演讲将深入探讨如何利用大模型技术,实现账户风险管理的数字化转型,以及这一转型如何为金融机构带来实质性的价值。

演讲提纲:

1. 传统账户风险管理的流程与挑战

2. 总体目标与方案思路

3. 应用场景介绍

4. 案件风险点诊断

5. 电话照会剧本生成

6. 管控建议及案件小结生成

7. 后续规划

听众收益:

1. 对大模型技术在账户风险管理中应用的全面理解

2. 掌握如何通过数字化手段提升风控效率和准确性

3. 了解大模型技术在不同风险管理场景下的实际应用案例

4. 学习如何构建和优化风控策略,以适应不断变化的市场环境

5. 认识到大模型技术在金融科技领域的创新潜力和业务普适性

6. 洞察大模型技术如何帮助金融机构降低成本、提升服务质量,并增强竞争力

落地挑战和方案重点:

1. 目前对大模型的标注结果需要人工介入一一排查, 这一环节效率比较低,可进一步优化

2. 风控领域的风险是与时俱进的,但我们目前还无法做到自动化的感知新的风险点,还需要依赖运营人工进行总结并主动创建 workflow,并定期进行维护,实时性不高,且比较费人工


马琼旭 网商银行 高级算法专家

个人介绍:负责网商渠道营销智能化建设,先后负责整合营销、端外渠道拓展、全渠道运筹等流量建设项目,打造智能出价、序列投放等底层算法能力。先后主导参与多篇国际学术论文工作,接受CCF-A/B论文8篇,相关专利11篇。

演讲题目:金融流量营销中的算法应用

演讲介绍:介绍金融类产品在流量营销中涉及的主要问题与相关算法解决方案,围绕背景、挑战、算法问题定义与解决方案展开,进行框架式介绍。

演讲提纲:

1. 金融流量营销场景介绍

2. 场景中分别涉及的算法需求&挑战

3. 算法(多目标、因果)解决方案与未来探索方向

听众收益:

1. 了解数智能力在金融产品营销中的实际业务

2. 了解相关业务中涉及的算法应用

落地挑战和方案重点:

1. 数据稀疏与有偏

2. 场景多业务多,算法成本高

徐哲轩 蚂蚁集团 高级算法专家

个人介绍:蚂蚁集团保险营销策略与财产险算法负责人,主导蚂蚁保用户洞察,AIGC,营销定价等能力建设。曾在海外大厂从事推荐和搜索工作。

演讲题目:AIGC 在保险领域的初步探索

郑光煜 蚂蚁集团 高级算法工程师

个人介绍:郑光煜,现任蚂蚁集团财富技术部高级算法工程师,复旦大学硕士,主要研究方向为推荐系统、迁移学习、表示学习、自然语言处理等,曾在 ICLR、EMNLP 等国际顶级会议发表论文。

演讲题目:跨域多目标 Ranking 在金融营销领域的应用

演讲提纲:

1. 解决什么问题

2. 跨域多目标推荐的技术原理

3. 实际案例:结合真实业务场景理解技术应用的细节与挑战

4. 解决思路

听众收益:

1. 跨域多目标推荐模型的发展历程

2. 在金融营销领域对于跨域推荐的技术思考与落地实践

3. 多目标 Ranking 的落地实践


王卓 中国信息通信研究院 云计算与大数据研究所 大数据与智能化部高级业务主管

个人介绍:中国信通院云计算与大数据研究所大数据与智能化部高级业务主管,长期从事数据智能领域相关标准、政策和产业研究等工作。牵头制定完成20余项数据智能领域行业、团体标准,深度参与各年度《大数据白皮书》编写工作,牵头编制《数据智能白皮书》、《数据中台实践指南》等研究报告,牵头制定《企业数智化能力成熟度模型(EDMM)》系列标准,续推动面向应用方的企业数智化能力成熟度评估工作,具有丰富的产业研究、标准编制、评估及咨询经验。

演讲题目:企业数智化能力成熟度模型(EDMM)标准体系解读

演讲介绍:在当前技术背景和经济背景下,数智化转型成为多数企业提升自身竞争力的重要手段。面向企业数智化转型过程中可能会遇到的问题,中国信通院联合业界启动《企业数智化能力成熟度模型(EDMM)》系列标准,形成一套面向应用方企业的数智化能力框架体系,指导企业对照标准规划能力建设,并进一步通过成熟度评估以评促建,助力自身数智化转型顺利进行。本次分享将对EDMM系列标准进行系统性介绍和解读。

演讲提纲:

1. 数据智能背景

2. 企业数智化能力框架体系

3. 数智基础设施

4. 数智中台

5. 数智应用

6. 数智化转型长效机制

7. EDMM 系列评估

听众收益:

1. 了解数据智能的发展背景,以及数智化转型对企业的作用

2. 了解企业数智化能力的基本框架体系,详细了解各方向能力,为数智化转型的开展储备方法论

范彬彬 外资行 大数据研发团队负责人/数据专家

个人介绍:范彬彬,目前负责外资行的数据底座平台建设、数据应用(营销、运营,风险)规划与建设、数据治理的工作。7年以上从事银行金融科技开发、管理工作,具备头部股份制银行、外资银行的从业经验。熟悉银行电子渠道、支付、信贷风控贷后管理全流程、银行核心总账、监管报送、开放银行平台等从0到1的完整落地建设经验,丰富的银行应用系统架构规划经验。

演讲题目:中小银行大数据应用实践

演讲介绍:本次演讲重点介绍中小银行大数据探索建设之路,在知中行,在行中知。基于数据质量,数据开放,数据开发等多重痛点之下,可控的成本投入的基础之上,完成数据智能应用建设和推广。

演讲提纲:

1. 建设背景与目标

2. 大数据平台的整体规划与架构

3. 大数据智能应用落地实践的思考

4. 建设效果和战略延续

听众收益:在面对成本和效率等多方因素下,中小银行探索出一套切实可行,经验可复制的大数据平台和应用落地的最佳实践。(仓湖一体、银行数据建模、数据智能化应用)

落地挑战和方案重点:

1. 数据质量管控

2. 数据开放能力

3. 数据开发管理

扫码免费报名,收看直播

继续滑动看下一个
DataFunTalk
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存