Kuautli commited on
Commit
66d1067
verified
1 Parent(s): a8ccaf1

Update clustering.py

Browse files
Files changed (1) hide show
  1. clustering.py +11 -14
clustering.py CHANGED
@@ -858,25 +858,22 @@ def map_sentiment(estrella):
858
  return "positivo"
859
 
860
 
861
- def classify_sentiment(texto):
862
- resultado = classifier(texto)[0]
863
- sentimiento = map_sentiment(resultado["label"])
864
- return (
865
- sentimiento,
866
- resultado["score"],
867
- )
868
-
869
-
870
- def classify_sentiment_df(data, comment_col="comment"):
871
-
872
  def classify_sentiment(texto):
873
  resultado = classifier(texto)[0]
874
  sentimiento = map_sentiment(resultado["label"])
875
  return sentimiento, resultado["score"]
876
 
877
- data["sentimiento"], data["confianza"] = zip(
878
- *data[comment_col].apply(classify_sentiment)
879
- )
 
 
 
 
 
 
 
880
 
881
  return data
882
 
 
858
  return "positivo"
859
 
860
 
861
+ def classify_sentiment_df(data, comment_col="comment", num_threads=4):
 
 
 
 
 
 
 
 
 
 
862
  def classify_sentiment(texto):
863
  resultado = classifier(texto)[0]
864
  sentimiento = map_sentiment(resultado["label"])
865
  return sentimiento, resultado["score"]
866
 
867
+ def process_row(texto):
868
+ # Esta funci贸n procesa una fila y retorna los valores necesarios
869
+ return classify_sentiment(texto)
870
+
871
+ # Crear un ThreadPoolExecutor con el n煤mero de hilos especificado
872
+ with ThreadPoolExecutor(max_workers=num_threads) as executor:
873
+ results = list(executor.map(process_row, data[comment_col]))
874
+
875
+ # Dividir los resultados en columnas para "sentimiento" y "confianza"
876
+ data["sentimiento"], data["confianza"] = zip(*results)
877
 
878
  return data
879