Spaces:

thomson99
/

Arabic_Article_Assistant

Runtime error

App Files Files Community

thomson99 commited on Jan 18

Commit

ed3c0cc

verified ·

1 Parent(s): 847231a

Upload app.py

Browse files

Files changed (1) hide show

app.py +59 -60

app.py CHANGED Viewed

@@ -12,7 +12,7 @@ from bs4 import BeautifulSoup
 # تهيئة النموذج
 try:
-    model_name = "aubmindlab/aragpt2-medium"
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForCausalLM.from_pretrained(model_name)
 except Exception as e:
@@ -23,11 +23,16 @@ except Exception as e:
 class ArticleGenerator:
     def __init__(self):
         # تهيئة النموذج والتوكنايزر
-        self.model_name = "meta-llama/Llama-2-7b-chat-hf"
-        self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
-        self.model = AutoModelForCausalLM.from_pretrained(self.model_name, torch_dtype=torch.float16)
-        self.device = "cuda" if torch.cuda.is_available() else "cpu"
-        self.model.to(self.device)
     def search_topic(self, topic, num_results=5):
         """البحث عن معلومات حول الموضوع"""
@@ -55,7 +60,8 @@ class ArticleGenerator:
                             'title': title_elem.text,
                             'content': snippet_elem.text
                         })
-        except:
             # في حالة فشل البحث، استخدم محتوى افتراضي
             results.append({
                 'source': 'default',
@@ -65,63 +71,56 @@ class ArticleGenerator:
         return results
-    def extract_keywords(self, topic):
-        """استخراج الكلمات المفتاحية من الموضوع"""
-        # قائمة من الكلمات المفتاحية المحتملة
-        potential_keywords = [
-            f"تعريف {topic}",
-            f"أهمية {topic}",
-            f"فوائد {topic}",
-            f"أنواع {topic}",
-            f"مميزات {topic}",
-            f"تطبيقات {topic}",
-            f"تاريخ {topic}",
-            f"مستقبل {topic}",
-            f"تحديات {topic}",
-            f"حلول {topic}"
-        ]
-        return potential_keywords
     def generate_content_with_research(self, topic, style):
         """توليد محتوى مبني على البحث"""
-        # استخراج الكلمات المفتاحية
-        keywords = self.extract_keywords(topic)
-        # البحث عن كل كلمة مفتاحية
-        all_research = []
-        for keyword in keywords[:3]:  # نأخذ أول 3 كلمات مفتاحية فقط
-            search_results = self.search_topic(f"{topic} {keyword}")
-            all_research.extend(search_results)
         # تجميع المعلومات
-        research_text = "\n".join([
-            f"المصدر: {r['source']}\nالعنوان: {r['title']}\nالمحتوى: {r['content']}\n"
-            for r in all_research
-        ])
-        # إنشاء محتوى باستخدام النموذج
-        prompt = f"""
-        استناداً إلى المعلومات التالية، قم بإنشاء محتوى {style} حول {topic}:
-        المعلومات البحثية:
-        {research_text}
-        يجب أن يكون المحتوى:
-        1. دقيقاً ومبنياً على المصادر
-        2. منظماً بشكل منطقي
-        3. مكتوباً بأسلوب {style}
-        4. يتضمن استشهادات من المصادر
-        """
-        inputs = self.tokenizer(prompt, return_tensors="pt").to(self.device)
-        outputs = self.model.generate(
-            inputs["input_ids"],
-            max_length=2000,
-            temperature=0.8,
-            num_return_sequences=1
-        )
-        return self.tokenizer.decode(outputs[0], skip_special_tokens=True)
 def count_words(text):
     """

 # تهيئة النموذج
 try:
+    model_name = "facebook/mbart-large-cc25"
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForCausalLM.from_pretrained(model_name)
 except Exception as e:
 class ArticleGenerator:
     def __init__(self):
         # تهيئة النموذج والتوكنايزر
+        self.model_name = "facebook/mbart-large-cc25"  # نموذج متعدد اللغات يدعم العربية
+        try:
+            self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
+            self.model = AutoModelForCausalLM.from_pretrained(self.model_name, torch_dtype=torch.float16)
+            self.device = "cuda" if torch.cuda.is_available() else "cpu"
+            self.model.to(self.device)
+            self.model_loaded = True
+        except Exception as e:
+            print(f"خطأ في تحميل النموذج: {e}")
+            self.model_loaded = False
     def search_topic(self, topic, num_results=5):
         """البحث عن معلومات حول الموضوع"""
                             'title': title_elem.text,
                             'content': snippet_elem.text
                         })
+        except Exception as e:
+            print(f"خطأ في البحث: {e}")
             # في حالة فشل البحث، استخدم محتوى افتراضي
             results.append({
                 'source': 'default',
         return results
     def generate_content_with_research(self, topic, style):
         """توليد محتوى مبني على البحث"""
+        # البحث عن المعلومات
+        search_results = self.search_topic(topic)
         # تجميع المعلومات
+        content_parts = []
+        # إضافة مقدمة
+        content_parts.append(f"""
+في هذا المقال سنتحدث عن {topic}، وهو موضوع يستحق الدراسة والبحث.
+""")
+        # إضافة المحتوى الرئيسي
+        for result in search_results:
+            content_parts.append(f"""
+{result['content']}
+وكما نرى في واقعنا المعاصر، فإن {topic} يلعب دوراً مهماً في حياتنا.
+""")
+        # إضافة خاتمة
+        content_parts.append(f"""
+وفي الختام، يمكننا القول أن {topic} يمثل أهمية كبيرة في عصرنا الحالي.
+""")
+        # دمج كل الأجزاء
+        final_content = "\n".join(content_parts)
+        # إضافة تحسينات أسلوبية
+        final_content = self.enhance_style(final_content, style)
+        return final_content
+    def enhance_style(self, content, style):
+        """تحسين أسلوب المحتوى"""
+        if style == "أكاديمي رسمي":
+            content = content.replace("نرى", "نلاحظ")
+            content = content.replace("يلعب دوراً", "يؤدي دوراً")
+            content = content.replace("مهم", "ذو أهمية")
+        elif style == "إخباري موضوعي":
+            content = content.replace("نرى", "يتضح")
+            content = content.replace("يلعب دوراً", "يساهم")
+            content = content.replace("مهم", "أساسي")
+        else:  # تعليمي تفاعلي
+            content = content.replace("نرى", "نجد")
+            content = content.replace("يلعب دوراً", "يشارك")
+            content = content.replace("مهم", "حيوي")
+        return content
 def count_words(text):
     """