dahara1 commited on
Commit
fb2b002
·
verified ·
1 Parent(s): 314b907

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +32 -28
README.md CHANGED
@@ -6,45 +6,49 @@ language:
6
 
7
  # webbigdata/FanFic-Illustrator
8
 
9
- FanFic-Illustratorは二次創作したショートストーリー(日本語、英語、他)に挿絵用の画像生成AI用プロンプトを作成する3Bモデルです
10
- FanFic-Illustrator is a 3B model for creating prompts for image generation AI to create illustrations for fan-created short stories (Japanese, English, etc.)
11
 
12
  ## Model Details
13
 
14
- ### Model Description
15
 
16
- 入力として、コンテンツカテゴリ、シリーズ名、キャラクター名、テキスト(オリジナル/ファン小説)、利用可能なタグを与えると、思考の過程と画像生成AI用のプロンプト(Danbooruタグ)を出力する推論モデルです。
17
- 指定されたタグを使って適切な推測を行おうとします。そのため、出力カテゴリ/傾向を大まかに制御できます。
18
 
19
- This is an reasoning model that takes content category, series name, character name, text (original/fanfiction), and available tags as input and outputs thought process and prompts (Danbooru tags) for image generation AI.
20
- It tries to make a good guess using the tags you provide, so you can roughly control the output category/tendency.
 
21
 
22
- 画像生成モデルは[cagliostrolab/animagine-xl-4.0 opt](https://huggingface.co/cagliostrolab/animagine-xl-4.0)に最適化してあります
23
- The image generation model is optimized for [cagliostrolab/animagine-xl-4.0 opt](https://huggingface.co/cagliostrolab/animagine-xl-4.0).
 
24
 
25
- ### Supported languages
 
26
 
27
- 日本語、英語、中国語(繁体字)を入力としてトレーニングをしています
28
- おそらくqwen 2.5が対応している言語であれば他の言語でも動作するのではないかと思います。
 
 
29
 
30
- Training is done using Japanese, English, and Chinese (traditional characters) as input.
31
- The output language of the thought process is Japanese only.
32
- I think it will probably work with other languages that are supported by qwen 2.5.
33
 
34
  ### prompt template/プロンプトテンプレート
35
 
36
- #### Input prompt template/入力テンプレート
37
 
38
- 以下のように日本語で与える必要があります。入力可能なコンテキスト長はトータルで6K程度を目安としてください。
39
- It must be given in Japanese as follows. The total length of the context that can be entered is approximately 6K.
40
 
41
  ```
42
  ### 小説のコンテキストを補足する情報
43
  content category: {category}
44
  series name: {series_name}
45
- series description: {series_name} series
46
  character name: {character_name}
47
- character description: {character_name} from {series_name}
48
 
49
  ### 小説データ
50
  {novel_text}
@@ -54,8 +58,7 @@ character description: {character_name} from {series_name}
54
  concept: イラストのコンセプトを考えます。小説の内容から主題、設定、雰囲気を理解し、どのようなイラストが最も適切か、全体の構成を考えます
55
  - 人数: 挿絵の中に登場させる人数を考えます。作品に登場する人物の数や重要性を考慮し、メインで描くべき人物やサブキャラクターについても検討してください
56
  - キャラクター名/シリーズ名: 既存作品のキャラクター/シリーズか、オリジナル作品かを考えます。既存作品の場合は、原作の設定や特徴を尊重した表現方法も考慮してください
57
- - ポーズ/構図: ポーズ/構図指定に使うタグを考えます。物語の場面において、キャラクターがどのような体勢/状況にあるのか、どのアングルから描くと効果
58
- 的かを検討してください
59
  - 背景/環境: 背景/環境指定に使うタグを考えます。物語の舞台設定や時間帯、天候など、雰囲気を表現するために必要な背景要素を詳しく考えてください
60
  - 描画スタイル/テクニック: 描画スタイル/テクニックに使うタグを考えます。物語のジャンルや雰囲気に合わせて、どのような画風や技法が適しているかを検討してください
61
  - 身体的特徴/画面上の物体: 身体的特徴/画面上の物体に関連するタグを考えます。キャラクターの外見的特徴や、シーンに必要な小道具、アイテムなどを詳細に考えてください
@@ -86,7 +89,7 @@ masterpiece, best quality, highresなどの品質に関連するタグは後工
86
  - your tag list
87
  ```
88
 
89
- #### 出力テンプレート
90
 
91
  thinkとpromptで囲まれて出力されます
92
  think tag and prompt tag output.
@@ -99,22 +102,23 @@ think tag and prompt tag output.
99
  Please check Sample Script for details.
100
 
101
  ### Sample Script
 
 
102
 
103
- [Google Colabのサンプル](https://github.com/webbigdata-jp/python_sample/blob/main/FanFic_Illustrator_demo.ipynb)
104
  [Sample Colab Script](https://github.com/webbigdata-jp/python_sample/blob/main/FanFic_Illustrator_demo.ipynb)
105
 
106
 
107
  ### Acknowledgements/謝辞
108
  We would like to thank the following people for providing related models/methods/tools.
109
- 以下の関連モデル/手法/ツールを提供してくださった皆さんに感謝します。
110
  - Base Model: [Qwen/Qwen2.5-3B-Instruct](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct)
111
  - Image Generation model: [cagliostrolab/animagine-xl-4.0](https://huggingface.co/cagliostrolab/animagine-xl-4.0)
112
- - Training Methods: (Deepseek GRPO)[https://arxiv.org/abs/2402.03300]
113
  - Traing script: [Unsloth](https://huggingface.co/unsloth).
114
 
115
  ### Developer/開発
116
 
117
- - **Developed by:** webbigdata
118
  - **Model type:** text generation
119
  - **Language(s) (NLP):** Japanese, English
120
- - **Finetuned from model [optional]:** Qwen 2.5 3B Instruct
 
6
 
7
  # webbigdata/FanFic-Illustrator
8
 
9
+ FanFic-Illustrator is an AI agent that analyzes your creative stories and suggests the perfect illustration compositions.
10
+ FanFic-Illustratorはあなたの創作した物語を分析し、ぴったりの挿絵構図を提案するAIエージェントです
11
 
12
  ## Model Details
13
 
14
+ ### Model Description/モデル
15
 
16
+ FanFic-Illustrator is a 3B reasoning model that identifies optimal illustration scenes from provided text (original/fan fiction) and proposes prompt structures for image generation AI.
17
+ FanFic-Illustratorは与えられた文章(オリジナル/二次創作)から最適な挿絵シーンを考えて、画像生成AIのためのプロンプトの構成を提案する推論型3Bモデルです
18
 
19
+ Given the content category, series name, character name, creative writing (Japanese, English, Chinese, etc.), and available tags as input, it outputs the thought process and prompts (Danbooru tags) for the image generation AI.
20
+ Using the output tags, you can generate your favorite images with a general open-weight image generation AI.
21
+ It tries to come up with an appropriate composition using the specified content category, series, character, and tags, so you can roughly control the output category/tendency.
22
 
23
+ 入力として、コンテンツカテゴリ、シリーズ名、キャラクター名、テキスト(日本語、英語、中国語、他)、利用可能なタグを与えると、思考の過程と画像生成AI用のプロンプト(Danbooruタグ)を出力します
24
+ 出力されたタグを使うと一般的なオープンウェイトの画像生成AIで好みの画像を生成する事ができます
25
+ 指定されたコンテンツカテゴリ、シリーズ、キャラクター、タグを使って適切な構図を考えようとするので、出力カテゴリ/傾向を大まかに制御できます。
26
 
27
+ The generated prompts are optimized for the image generation model [cagliostrolab/animagine-xl-4.0 opt](https://huggingface.co/cagliostrolab/animagine-xl-4.0)
28
+ 生成されるプロンプトは画像生成モデル[cagliostrolab/animagine-xl-4.0 opt](https://huggingface.co/cagliostrolab/animagine-xl-4.0)に最適化してあります
29
 
30
+ ### Supported languages/サポート言語
31
+
32
+ I mainly train in Japanese, with English and Chinese (Traditional) as secondary languages.
33
+ I think it will probably work with other languages that are supported by qwen 2.5.
34
 
35
+ 日本語をメインにし、英語、中国語(繁体字)をサブでトレーニングをしています
36
+ おそらくqwen 2.5が対応している言語であれば他の言語でも動作するのではないかと思います。
 
37
 
38
  ### prompt template/プロンプトテンプレート
39
 
40
+ #### Input/入力
41
 
42
+ It is necessary to provide it in Japanese as follows. The total input context length, including the prompt, should be around 6000.
43
+ 以下のように日本語で与える必要があります。入力可能なコンテキスト長はプロンプトも含めてトータルで6000程度を目安としてください。
44
 
45
  ```
46
  ### 小説のコンテキストを補足する情報
47
  content category: {category}
48
  series name: {series_name}
49
+ series description: {series_description}
50
  character name: {character_name}
51
+ character description: {character_description}
52
 
53
  ### 小説データ
54
  {novel_text}
 
58
  concept: イラストのコンセプトを考えます。小説の内容から主題、設定、雰囲気を理解し、どのようなイラストが最も適切か、全体の構成を考えます
59
  - 人数: 挿絵の中に登場させる人数を考えます。作品に登場する人物の数や重要性を考慮し、メインで描くべき人物やサブキャラクターについても検討してください
60
  - キャラクター名/シリーズ名: 既存作品のキャラクター/シリーズか、オリジナル作品かを考えます。既存作品の場合は、原作の設定や特徴を尊重した表現方法も考慮してください
61
+ - ポーズ/構図: ポーズ/構図指定に使うタグを考えます。物語の場面において、キャラクターがどのような体勢/状況にあるのか、どのアングルから描くと効果的かを検討してください
 
62
  - 背景/環境: 背景/環境指定に使うタグを考えます。物語の舞台設定や時間帯、天候など、雰囲気を表現するために必要な背景要素を詳しく考えてください
63
  - 描画スタイル/テクニック: 描画スタイル/テクニックに使うタグを考えます。物語のジャンルや雰囲気に合わせて、どのような画風や技法が適しているかを検討してください
64
  - 身体的特徴/画面上の物体: 身体的特徴/画面上の物体に関連するタグを考えます。キャラクターの外見的特徴や、シーンに必要な小道具、アイテムなどを詳細に考えてください
 
89
  - your tag list
90
  ```
91
 
92
+ #### Output/出力
93
 
94
  thinkとpromptで囲まれて出力されます
95
  think tag and prompt tag output.
 
102
  Please check Sample Script for details.
103
 
104
  ### Sample Script
105
+ 以下のサンプルスクリプトを使うと、Googleが提供してくれているColabで無料で画像を生成する所まで確認する事ができます
106
+ Using the sample script below, you can check how to generate images for free using Colab provided by Google.
107
 
 
108
  [Sample Colab Script](https://github.com/webbigdata-jp/python_sample/blob/main/FanFic_Illustrator_demo.ipynb)
109
 
110
 
111
  ### Acknowledgements/謝辞
112
  We would like to thank the following people for providing related models/methods/tools.
113
+ 以下の関連モデル/手法/ツールを提供してくださった皆さんに感謝します。
114
  - Base Model: [Qwen/Qwen2.5-3B-Instruct](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct)
115
  - Image Generation model: [cagliostrolab/animagine-xl-4.0](https://huggingface.co/cagliostrolab/animagine-xl-4.0)
116
+ - Training Methods: (DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models)[https://arxiv.org/abs/2402.03300]
117
  - Traing script: [Unsloth](https://huggingface.co/unsloth).
118
 
119
  ### Developer/開発
120
 
121
+ - **Developed by:** dahara1@webbigdata
122
  - **Model type:** text generation
123
  - **Language(s) (NLP):** Japanese, English
124
+ - **Finetuned from model :** Qwen 2.5 3B Instruct