Fin-R1:一款基于Qwen2.5的金融推理型大语言模型

Fin-R1是什么?

Fin-R1 是一款由上海财经大学统计与数据科学学院张立文教授团队(SUFE-aiFLM-Lab)联合财跃星辰开发的金融领域推理型大语言模型,Fin-R1模型以 Qwen2.5-7B-Instruct 为基座,利用 DeepSeek-R1 框架进行“数据蒸馏”与“双轮质量筛选”,通过高质量思维链数据的监督微调+ 强化学习,有效解决了金融领域中数据碎片化、推理逻辑不可控和业务泛化能力不足等问题,为金融行业的智能化转型提供了有力支持。

Fin-R1:一款专为金融领域设计的推理型大语言模型.webp

模型架构

Fin-R1 采用两阶段架构进行训练:

  • 数据生成阶段:通过数据蒸馏和筛选方法,从多个权威数据源构建高质量的金融推理数据集 Fin-R1-Data。

  • 模型训练阶段:基于 Qwen2.5-7B-Instruct 模型,通过监督微调(SFT)和强化学习(RL)进行训练。

Fin-R1数据集特点

  • 规模与质量:Fin-R1-Data 包含约 60,091 条完整的思考链(CoT),涵盖中英文金融垂直领域的多维度专业知识。

  • 模块化设计:数据集分为金融代码、金融专业知识、金融非推理类业务知识和金融推理类业务知识四大模块。

Fin-R1核心特点

  • 专业领域:专注于金融推理,涵盖金融代码、专业知识、业务知识等多个维度。

  • 数据驱动:基于高质量的金融推理数据集 Fin-R1-Data 进行训练,包含约 60,091 条完整的思考链。

  • 训练方式:采用监督微调(SFT)和强化学习(RL)相结合的方式,确保模型在金融推理任务中的准确性和可靠性。

  • 轻量化设计:参数量仅为 7 亿,但性能表现出色。

Fin-R1:一款专为金融领域设计的推理型大语言模型.webp

性能表现

  • 权威评测:在金融领域权威评测中,平均得分 75.2 分,位居第二。

  • 任务表现:在 FinQA 和 ConvFinQA 任务中分别获得 76.0 分和 85.0 分,位居参评模型第一。

  • 泛化能力:在其他金融基准测试中也展现出强大的跨任务泛化能力。

Fin-R1应用

  • 金融代码:用于实现金融模型、算法和分析任务的编程代码。

  • 金融计算:进行定量分析和计算,为金融决策提供依据。

  • 金融安全合规:防范金融犯罪,确保业务操作符合法规要求。

  • 智能风控:利用 AI 和大数据技术识别和管理金融风险。

  • ESG 分析:评估企业在环境、社会和治理方面的表现。

Fin-R1使用步骤

  1. 下载模型:通过 Hugging Face 页面下载模型权重。

  2. 启动服务:使用 vllm 工具启动模型服务。

  3. 推理运行:通过 OpenAI API 格式调用模型进行推理。

Fin-R1相关链接

模型下载:https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1

论文:https://arxiv.org/pdf/2503.16252

收藏
最新工具
AiPyApp
AiPyApp

一款以Python为核心的开源新人工智能体助手,结合大模型和 P...

Adobe Express
Adobe Express

Adobe推出的一站式设计工具,整合了图像、视频、文档/PDF、...

Intangible AI
Intangible AI

创意行业空间智能AI平台,通过简洁的3D界面与空间智能技术解决A...

法大大iTerms
法大大iTerms

法大大推出的一站式法律AI工作台,基于自研法律大模型的AI智能体...

Relume
Relume

一个通过AI来优化网站设计与搭建流程的平台,可以快速生成网站地图...

Pomelli
Pomelli

Google开发的AI营销工具,主要服务中小商家。你只需要提供企...

Gartic.io
Gartic.io

一个很受欢迎的在线绘画猜词游戏。它把经典的“你画我猜”玩法和多人...

LandPPT
LandPPT

一个基于大语言模型的开源免费AIPPT生成平台,支持将文档内容自...

AppleWalls
AppleWalls

一个免费提供苹果官方内置壁纸下载的网站,包括iPhone、iPa...

Coddy.Tech
Coddy.Tech

一个免费、有趣且实用的编程学习平台。支持学习包括 Python、...