OpenPipe
/

Deductive-Reasoning-Qwen-32B

Text Generation

text-generation-inference

Model card Files Files and versions

bradhiltonendercorp commited on Mar 6

Commit

db5ecdf

·

verified ·

1 Parent(s): 7755dcc

Update README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -1,26 +1,26 @@
 ---
 license: mit
-license_link: https://huggingface.co/OpenPipe/Deductive-Reasoning-Qwen-14B/blob/main/LICENSE
 language:
 - en
 pipeline_tag: text-generation
 base_model:
-- Qwen/Qwen2.5-1.5B-Instruct
 tags:
 - chat
 library_name: transformers
 ---
-# Deductive-Reasoning-Qwen-14B
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/674a1d102c0f27a385772cfe/JauBmEQM0FpOdShBMSfst.png)
-Deductive Reasoning Qwen 14B is a reinforcement fine-tune of [Qwen 2.5 14B Instruct](https://huggingface.co/Qwen/Qwen2.5-14B-Instruct) to solve challenging deduction problems from the [Temporal Clue](https://github.com/bradhilton/temporal-clue) dataset, trained by [OpenPipe](https://openpipe.ai)!
 Here are some additional resources to check out:
 - Blog Post
 - [Training Recipe](https://github.com/openpipe/deductive-reasoning)
 - [RL Experiments](https://github.com/openpipe/rl-experiments)
-- [Deductive Reasoning Qwen 32B](https://huggingface.co/OpenPipe/Deductive-Reasoning-Qwen-32B)

 ---
 license: mit
+license_link: https://huggingface.co/OpenPipe/Deductive-Reasoning-Qwen-32B/blob/main/LICENSE
 language:
 - en
 pipeline_tag: text-generation
 base_model:
+- Qwen/Qwen2.5-32B-Instruct
 tags:
 - chat
 library_name: transformers
 ---
+# Deductive-Reasoning-Qwen-32B
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/674a1d102c0f27a385772cfe/JauBmEQM0FpOdShBMSfst.png)
+Deductive Reasoning Qwen 32B is a reinforcement fine-tune of [Qwen 2.5 32B Instruct](https://huggingface.co/Qwen/Qwen2.5-32B-Instruct) to solve challenging deduction problems from the [Temporal Clue](https://github.com/bradhilton/temporal-clue) dataset, trained by [OpenPipe](https://openpipe.ai)!
 Here are some additional resources to check out:
 - Blog Post
 - [Training Recipe](https://github.com/openpipe/deductive-reasoning)
 - [RL Experiments](https://github.com/openpipe/rl-experiments)
+- [Deductive Reasoning Qwen 14B](https://huggingface.co/OpenPipe/Deductive-Reasoning-Qwen-14B)