Spaces:

impresso-project
/

ocrqa-demo

Running

maslionok commited on 14 days ago

Commit

8d5fa5e

1 Parent(s): abc6868

fix

Files changed (1) hide show

app.py CHANGED Viewed

@@ -41,7 +41,7 @@ def process_ocr_qa(text, lang_choice):
             if 'score' in result:
                 score = result['score']
                 score_emoji = "🟢" if score >= 0.8 else "🟡" if score >= 0.5 else "🔴"
-                output_lines.append(f"{score_emoji} **Quality Score:** {score:.2f}")
             # Diagnostics section
             if 'diagnostics' in result and result['diagnostics']:
@@ -54,13 +54,16 @@ def process_ocr_qa(text, lang_choice):
                 # Known tokens
                 if 'known_tokens' in diagnostics and diagnostics['known_tokens']:
-                    output_lines.append(f"  ✅ Known tokens ({len(diagnostics['known_tokens'])}): {', '.join(diagnostics['known_tokens'][:10])}")
-                    if len(diagnostics['known_tokens']) > 10:
-                        output_lines.append(f"      ... and {len(diagnostics['known_tokens']) - 10} more")
                 # Unknown tokens (potential OCR errors)
                 if 'unknown_tokens' in diagnostics and diagnostics['unknown_tokens']:
-                    output_lines.append(f"  ❌ Potential OCR errors ({len(diagnostics['unknown_tokens'])}): {', '.join(diagnostics['unknown_tokens'])}")
                 elif 'unknown_tokens' in diagnostics:
                     output_lines.append("  ✨ No potential OCR errors detected!")

             if 'score' in result:
                 score = result['score']
                 score_emoji = "🟢" if score >= 0.8 else "🟡" if score >= 0.5 else "🔴"
+                output_lines.append(f"{score_emoji} **Quality Score:** {score:.1f}")
             # Diagnostics section
             if 'diagnostics' in result and result['diagnostics']:
                 # Known tokens
                 if 'known_tokens' in diagnostics and diagnostics['known_tokens']:
+                    known_tokens = diagnostics['known_tokens']
+                    displayed_tokens = ', '.join(known_tokens[:10])
+                    output_lines.append(f"  ✅ Known tokens ({len(known_tokens)}): {displayed_tokens}")
+                    if len(known_tokens) > 10:
+                        output_lines.append(f"      ... and {len(known_tokens) - 10} more")
                 # Unknown tokens (potential OCR errors)
                 if 'unknown_tokens' in diagnostics and diagnostics['unknown_tokens']:
+                    unknown_tokens = diagnostics['unknown_tokens']
+                    output_lines.append(f"  ❌ Potential OCR errors ({len(unknown_tokens)}): {', '.join(unknown_tokens)}")
                 elif 'unknown_tokens' in diagnostics:
                     output_lines.append("  ✨ No potential OCR errors detected!")