Spaces:

MasteredUltraInstinct
/

PolSOL

Runtime error

MasteredUltraInstinct commited on Jun 12

Commit

326ef6a

verified ·

1 Parent(s): 9c73391

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,12 +9,13 @@ processor = TrOCRProcessor.from_pretrained("microsoft/trocr-base-handwritten")
 def preprocess(ex):
     img = ex["image"].convert("RGB")
     inputs = processor(images=img, return_tensors="pt")
-    labels = processor.tokenizer(ex["text"], truncation=True, padding="max_length", max_length=128).input_ids
     ex["pixel_values"] = inputs.pixel_values[0]
     ex["labels"] = labels
     return ex
-ds = ds.map(preprocess, remove_columns=["image", "text"])
 model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-base-handwritten")
 model.config.decoder_start_token_id = processor.tokenizer.cls_token_id

 def preprocess(ex):
     img = ex["image"].convert("RGB")
     inputs = processor(images=img, return_tensors="pt")
+    labels = processor.tokenizer(ex["label"], truncation=True, padding="max_length", max_length=128).input_ids
     ex["pixel_values"] = inputs.pixel_values[0]
     ex["labels"] = labels
     return ex
+ds = ds.map(preprocess, remove_columns=["image", "label"])
 model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-base-handwritten")
 model.config.decoder_start_token_id = processor.tokenizer.cls_token_id