Mungert
/

Fin-R1-GGUF

Text Generation

Transformers

GGUF

imatrix

conversational

Model card Files Files and versions Community

Mungert commited on 15 days ago

Commit

63b7cb3

verified ·

1 Parent(s): 84ddf59

Update README.md

Browse files

Files changed (1) hide show

README.md +7 -7

README.md CHANGED Viewed

@@ -198,23 +198,23 @@ Code: https://github.com/SUFE-AIFLM-Lab/Fin-R1
 ## 💡 场景应用 <a name="summary"></a>&nbsp; &nbsp; &nbsp; &nbsp;
 Fin-R1 是一款专为金融推理领域设计的大语言模型，采用轻量化的 7B 参数量级架构。在显著降低部署成本的同时，该模型通过在针对金融推理场景的高质量思维链数据上采用 SFT（监督微调）和 RL（强化学习）两阶段训练，为模型在金融领域的应用提供了坚实的理论支撑、业务规则、决策逻辑以及技术实现能力，从而有效提升模型的金融复杂推理能力，为银行、证券、保险以及信托等金融核心业务场景提供有力支持。
-![数据-场景](Images/.frame_cn2.png)&nbsp; &nbsp; &nbsp; &nbsp;
 ## 金融代码
 金融代码是指在金融领域中用于实现各种金融模型、算法和分析任务的计算机编程代码，涵盖了从简单的财务计算到复杂的金融衍生品定价、风险评估和投资组合优化等多个方面，以方便金融专业人士进行数据处理、统计分析、数值计算和可视化等工作。
-![FinancialCode](Images/Financial_Code.gif)&nbsp;&nbsp; &nbsp; &nbsp;
 ## 金融计算
 金融计算是对金融领域的各种问题进行定量分析和计算的过程，其核心在于通过建立数学模型和运用数值方法来解决实际金融问题，可为金融决策提供科学依据，帮助金融机构和投资者更好地管理风险、优化资源配置和提高投资回报率。
-![FinancialCalculations](Images/Financial_Calculations.gif)&nbsp;&nbsp; &nbsp; &nbsp;
 ## 英语金融计算
 英语金融计算强调在跨语言环境下使用英语进行金融模型的构建和计算，并能够以英语撰写金融分析报告和与国际同行进行沟通交流。
-![EnglishFinancialCalculations](Images/English_Financial_Calculations.gif)&nbsp; &nbsp; &nbsp; &nbsp;
 ## 金融安全合规
 金融安全合规聚焦于防范金融犯罪与遵守监管要求，帮助企业建立健全的合规管理体系，定期进行合规检查和审计，确保业务操作符合相关法规要求。
-![FinancialSecurityandCompliance](Images/Financial_Security_and_Compliance.gif)&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;
 ## 智能风控
 智能风控利用AI与大数据技术识别和管理金融风险，与传统风控手段相比，智能风控具有更高的效率、准确性和实时性，它通过对海量金融数据的深度挖掘和分析，能够发现潜在的风险模式和异常交易行为，从而及时预警和采取相应的风险控制措施。
-![IntelligentRiskControl](Images/Intelligent_Risk_Control.gif)&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;
 ## ESG分析
 ESG分析通过评估企业在环境（Environmental）、社会（Social）、治理（Governance）的表现，衡量其可持续发展能力，确保投资活动不仅能够获得财务回报，还能促进可持续发展和社会责任的履行。金融机构和企业也通过提升自身的 ESG 绩效，来满足投资者和社会对企业更高的期望和要求。
 ![ESG](Images/ESG.gif)&nbsp; &nbsp; &nbsp;
@@ -294,7 +294,7 @@ Fin-R1-Data 涵盖中英文金融垂直领域的多维度专业知识，并根
 在模型掌握复杂推理技能后，我们采用 GRPO（Group Relative Policy Optimization）算法作为核心框架，以双重奖励机制优化模型输出的格式和准确度，并在此基础上引入了基于模型的验证器（Model-Based Verifier），采用 Qwen2.5-Max 进行答案评估来改进基于正则表达式的奖励可能存在的偏差，生成更加精确可靠的奖励信号，从而提升强化学习的效果和稳定性。
-![grpo](Images/trainning.png)
 ## 🚨 模型评测结果 <a name="results"></a>

 ## 💡 场景应用 <a name="summary"></a>&nbsp; &nbsp; &nbsp; &nbsp;
 Fin-R1 是一款专为金融推理领域设计的大语言模型，采用轻量化的 7B 参数量级架构。在显著降低部署成本的同时，该模型通过在针对金融推理场景的高质量思维链数据上采用 SFT（监督微调）和 RL（强化学习）两阶段训练，为模型在金融领域的应用提供了坚实的理论支撑、业务规则、决策逻辑以及技术实现能力，从而有效提升模型的金融复杂推理能力，为银行、证券、保险以及信托等金融核心业务场景提供有力支持。
+![数据-场景](https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1/blob/main/Images/.frame_cn2.png)&nbsp; &nbsp; &nbsp; &nbsp;
 ## 金融代码
 金融代码是指在金融领域中用于实现各种金融模型、算法和分析任务的计算机编程代码，涵盖了从简单的财务计算到复杂的金融衍生品定价、风险评估和投资组合优化等多个方面，以方便金融专业人士进行数据处理、统计分析、数值计算和可视化等工作。
+![FinancialCode](https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1/blob/main/Images/Financial_Code.gif)&nbsp;&nbsp; &nbsp; &nbsp;
 ## 金融计算
 金融计算是对金融领域的各种问题进行定量分析和计算的过程，其核心在于通过建立数学模型和运用数值方法来解决实际金融问题，可为金融决策提供科学依据，帮助金融机构和投资者更好地管理风险、优化资源配置和提高投资回报率。
+![FinancialCalculations](https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1/blob/main/Images/Financial_Calculations.gif)&nbsp;&nbsp; &nbsp; &nbsp;
 ## 英语金融计算
 英语金融计算强调在跨语言环境下使用英语进行金融模型的构建和计算，并能够以英语撰写金融分析报告和与国际同行进行沟通交流。
+![EnglishFinancialCalculations](https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1/blob/main/Images/English_Financial_Calculations.gif)&nbsp; &nbsp; &nbsp; &nbsp;
 ## 金融安全合规
 金融安全合规聚焦于防范金融犯罪与遵守监管要求，帮助企业建立健全的合规管理体系，定期进行合规检查和审计，确保业务操作符合相关法规要求。
+![FinancialSecurityandCompliance](https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1/blob/main/Images/Financial_Security_and_Compliance.gif)&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;
 ## 智能风控
 智能风控利用AI与大数据技术识别和管理金融风险，与传统风控手段相比，智能风控具有更高的效率、准确性和实时性，它通过对海量金融数据的深度挖掘和分析，能够发现潜在的风险模式和异常交易行为，从而及时预警和采取相应的风险控制措施。
+![IntelligentRiskControl](https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1/blob/main/Images/Intelligent_Risk_Control.gif)&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;
 ## ESG分析
 ESG分析通过评估企业在环境（Environmental）、社会（Social）、治理（Governance）的表现，衡量其可持续发展能力，确保投资活动不仅能够获得财务回报，还能促进可持续发展和社会责任的履行。金融机构和企业也通过提升自身的 ESG 绩效，来满足投资者和社会对企业更高的期望和要求。
 ![ESG](Images/ESG.gif)&nbsp; &nbsp; &nbsp;
 在模型掌握复杂推理技能后，我们采用 GRPO（Group Relative Policy Optimization）算法作为核心框架，以双重奖励机制优化模型输出的格式和准确度，并在此基础上引入了基于模型的验证器（Model-Based Verifier），采用 Qwen2.5-Max 进行答案评估来改进基于正则表达式的奖励可能存在的偏差，生成更加精确可靠的奖励信号，从而提升强化学习的效果和稳定性。
+![grpo](https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1/blob/main/Images/trainning.png)
 ## 🚨 模型评测结果 <a name="results"></a>