Spaces:

nschenone
/

lyric-buddy

Build error

App Files Files Community

nschenone commited on Sep 7, 2022

Commit

04d336a

1 Parent(s): 044d15c

Changed censor to function instead of class

Browse files

Files changed (3) hide show

app.py +2 -2
src/generate.py +4 -4
src/profanity_filter.py +33 -34

app.py CHANGED Viewed

@@ -12,7 +12,7 @@ def fn(
     max_length: int = 100,
     temperature: float = 1.5,
     seed: int = 0,
-    censor: bool = True,
 ):
     return generate(
@@ -23,7 +23,7 @@ def fn(
             "temperature": temperature,
         },
         seed=seed,
-        censor=censor,
     )

     max_length: int = 100,
     temperature: float = 1.5,
     seed: int = 0,
+    censor_profanity: bool = True,
 ):
     return generate(
             "temperature": temperature,
         },
         seed=seed,
+        censor_profanity=censor_profanity,
     )

src/generate.py CHANGED Viewed

@@ -1,14 +1,14 @@
 import transformers
 from transformers import set_seed
-from src.profanity_filter import ProfanityFilter
 def generate(
     pipeline: transformers.Pipeline,
     pipeline_args: dict,
     seed: int = 0,
-    censor: bool = True,
 ):
     set_seed(seed)
@@ -27,7 +27,7 @@ def generate(
     args.update(pipeline_args)
     generated = pipeline(**args)[0]["generated_text"]
-    if censor:
-        generated = ProfanityFilter.censor(generated)
     return generated

 import transformers
 from transformers import set_seed
+from src.profanity_filter import censor
 def generate(
     pipeline: transformers.Pipeline,
     pipeline_args: dict,
     seed: int = 0,
+    censor_profanity: bool = True,
 ):
     set_seed(seed)
     args.update(pipeline_args)
     generated = pipeline(**args)[0]["generated_text"]
+    if censor_profanity:
+        generated = censor(generated)
     return generated

src/profanity_filter.py CHANGED Viewed

@@ -2,48 +2,47 @@ import string
 import requests
-class ProfanityFilter:
-    def __init__(self):
-        BANNED_LIST_URL = "https://raw.githubusercontent.com/snguyenthanh/better_profanity/master/better_profanity/profanity_wordlist.txt"
-        self.banned_list = requests.get(BANNED_LIST_URL).text.split("\n")
-    def censor(self, text="", censor_char="*", keep_first_letter=True):
-        # Split sentences by newline
-        sentence_list = text.split("\n")
-        for s, sentence in enumerate(sentence_list):
-            # Split words in sentence by space
-            word_list = sentence.split()
-            for w, word in enumerate(word_list):
-                # Process word to match banned list
-                processed_word = word.translate(
-                    str.maketrans("", "", string.punctuation)
-                ).lower()
-                # Replace if word is profane
-                if processed_word in self.banned_list:
-                    censored_word = censor_char * len(word)
-                    # Keep first letter of word for context if desired
-                    if keep_first_letter:
-                        censored_word = word[0] + censored_word[1:]
-                    # Replcate punctuation
-                    censored_word_punc = ""
-                    for c, char in enumerate(word):
-                        if char in string.punctuation:
-                            censored_word_punc += word[c]
-                        else:
-                            censored_word_punc += censored_word[c]
-                    # Update word list
-                    word_list[w] = censored_word_punc
-                # Update sentence list
-                sentence_list[s] = word_list
-        # Join everything back together
-        return "\n".join([" ".join(word_list) for word_list in sentence_list])

 import requests
+BANNED_LIST_URL = "https://raw.githubusercontent.com/snguyenthanh/better_profanity/master/better_profanity/profanity_wordlist.txt"
+def censor(text="", censor_char="*", keep_first_letter=True):
+    banned_list = requests.get(BANNED_LIST_URL).text.split("\n")
+    # Split sentences by newline
+    sentence_list = text.split("\n")
+    for s, sentence in enumerate(sentence_list):
+        # Split words in sentence by space
+        word_list = sentence.split()
+        for w, word in enumerate(word_list):
+            # Process word to match banned list
+            processed_word = word.translate(
+                str.maketrans("", "", string.punctuation)
+            ).lower()
+            # Replace if word is profane
+            if processed_word in banned_list:
+                censored_word = censor_char * len(word)
+                # Keep first letter of word for context if desired
+                if keep_first_letter:
+                    censored_word = word[0] + censored_word[1:]
+                # Replcate punctuation
+                censored_word_punc = ""
+                for c, char in enumerate(word):
+                    if char in string.punctuation:
+                        censored_word_punc += word[c]
+                    else:
+                        censored_word_punc += censored_word[c]
+                # Update word list
+                word_list[w] = censored_word_punc
+            # Update sentence list
+            sentence_list[s] = word_list
+    # Join everything back together
+    return "\n".join([" ".join(word_list) for word_list in sentence_list])