Ai应用
Ai资讯
AI生图
AI生视频
开源AI应用平台

首页 > Ai资讯 > Ai产品

Fin-R1：一款基于Qwen2.5的金融推理型大语言模型

映技派于2025-03-22发布在Ai产品

Fin-R1是什么？

Fin-R1 是一款由上海财经大学统计与数据科学学院张立文教授团队（SUFE-aiFLM-Lab）联合财跃星辰开发的金融领域推理型大语言模型，Fin-R1模型以 Qwen2.5-7B-Instruct 为基座，利用 DeepSeek-R1 框架进行“数据蒸馏”与“双轮质量筛选”，通过高质量思维链数据的监督微调+ 强化学习，有效解决了金融领域中数据碎片化、推理逻辑不可控和业务泛化能力不足等问题，为金融行业的智能化转型提供了有力支持。

Fin-R1：一款专为金融领域设计的推理型大语言模型.webp

模型架构

Fin-R1 采用两阶段架构进行训练：

数据生成阶段：通过数据蒸馏和筛选方法，从多个权威数据源构建高质量的金融推理数据集 Fin-R1-Data。
模型训练阶段：基于 Qwen2.5-7B-Instruct 模型，通过监督微调（SFT）和强化学习（RL）进行训练。

Fin-R1数据集特点

规模与质量：Fin-R1-Data 包含约 60,091 条完整的思考链（CoT），涵盖中英文金融垂直领域的多维度专业知识。
模块化设计：数据集分为金融代码、金融专业知识、金融非推理类业务知识和金融推理类业务知识四大模块。

Fin-R1核心特点

专业领域：专注于金融推理，涵盖金融代码、专业知识、业务知识等多个维度。
数据驱动：基于高质量的金融推理数据集 Fin-R1-Data 进行训练，包含约 60,091 条完整的思考链。
训练方式：采用监督微调（SFT）和强化学习（RL）相结合的方式，确保模型在金融推理任务中的准确性和可靠性。
轻量化设计：参数量仅为 7 亿，但性能表现出色。

Fin-R1：一款专为金融领域设计的推理型大语言模型.webp

性能表现

权威评测：在金融领域权威评测中，平均得分 75.2 分，位居第二。
任务表现：在 FinQA 和 ConvFinQA 任务中分别获得 76.0 分和 85.0 分，位居参评模型第一。
泛化能力：在其他金融基准测试中也展现出强大的跨任务泛化能力。

Fin-R1应用

金融代码：用于实现金融模型、算法和分析任务的编程代码。
金融计算：进行定量分析和计算，为金融决策提供依据。
金融安全合规：防范金融犯罪，确保业务操作符合法规要求。
智能风控：利用 AI 和大数据技术识别和管理金融风险。
ESG 分析：评估企业在环境、社会和治理方面的表现。

Fin-R1使用步骤

下载模型：通过 Hugging Face 页面下载模型权重。
启动服务：使用 vllm 工具启动模型服务。
推理运行：通过 OpenAI API 格式调用模型进行推理。

Fin-R1相关链接

模型下载：https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1

论文：https://arxiv.org/pdf/2503.16252

收藏

LHM：阿里推出的单张图像重建出可动画化的3D人体模型

上一篇

LHM：阿里推出的单张图像重建出可动画化的3D人体模型

StarVector：用于生成可缩放矢量图形的开源多模态视觉模型

下一篇

StarVector：用于生成可缩放矢量图形的开源多模态视觉模型

相关文章

Qwen-Image-Edit：通义千问推出的图像编

Qwen-Image-Edit：通义千问推出的图像编

2025-08-19

Qwen-Image：阿里云通义千问团队开源的图形海

Qwen-Image：阿里云通义千问团队开源的图形海

2025-08-06

ColQwen-Omni：一款开源的多模态RAG模型

ColQwen-Omni：一款开源的多模态RAG模型

2025-07-19

Qwen VLo：阿里巴巴推出的多模态统一理解与生成

Qwen VLo：阿里巴巴推出的多模态统一理解与生成

2025-06-28

阿里推出QwenLong-L1-32B：一款用于长上

阿里推出QwenLong-L1-32B：一款用于长上

2025-05-27

Qwen官网上线Web Dev功能，不会代码也能创建

Qwen官网上线Web Dev功能，不会代码也能创建

2025-05-11

最新文章

最新工具

AiPyApp

一款以Python为核心的开源新人工智能体助手，结合大模型和 P...

Adobe Express

Adobe推出的一站式设计工具，整合了图像、视频、文档/PDF、...

Intangible AI

创意行业空间智能AI平台，通过简洁的3D界面与空间智能技术解决A...

法大大iTerms

法大大推出的一站式法律AI工作台，基于自研法律大模型的AI智能体...

Relume

一个通过AI来优化网站设计与搭建流程的平台，可以快速生成网站地图...

Pomelli

Google开发的AI营销工具，主要服务中小商家。你只需要提供企...

Gartic.io

一个很受欢迎的在线绘画猜词游戏。它把经典的“你画我猜”玩法和多人...

LandPPT

一个基于大语言模型的开源免费AIPPT生成平台，支持将文档内容自...

AppleWalls

一个免费提供苹果官方内置壁纸下载的网站，包括iPhone、iPa...

Coddy.Tech

一个免费、有趣且实用的编程学习平台。支持学习包括 Python、...

人生若只如初见

用户登录