Spaces:

abdelhaqueidali
/

Amazigh-Dictionary

Running

App Files Files Community

Amazigh-Dictionary / app-main.py

abdelhaqueidali

Rename app.py to app-main.py

3fb0d18 verified 1 day ago

raw

history blame contribute delete

41.3 kB

	import gradio as gr
	import sqlite3
	from pathlib import Path
	import unicodedata

	def remove_diacritics(text):
	"""Removes diacritics from Arabic text (and any other text)."""
	if text is None: # Handle potential NULL values
	return None
	return ''.join(c for c in unicodedata.normalize('NFD', text)
	if unicodedata.category(c) != 'Mn')

	def get_db_connection(db_name): # Function now takes db_name as argument
	conn = sqlite3.connect(db_name)
	conn.row_factory = sqlite3.Row
	conn.create_function("REMOVE_DIACRITICS", 1, remove_diacritics)
	return conn

	def normalize_french_text(text):
	if not text:
	return text
	normalized_text = ''.join(c for c in unicodedata.normalize('NFD', text) if unicodedata.category(c) != 'Mn')
	return normalized_text.lower()

	def normalize_arabic_text(text):
	if not text:
	return text
	text = text.replace("أ", "ا").replace("إ", "ا").replace("آ", "ا") # unify alif forms
	return text.lower()

	def normalize_general_text(text):
	if not text:
	return text
	text = normalize_arabic_text(text)
	return remove_diacritics(text)

	def normalize_amazigh_text(text):
	"""
	Normalizes Amazigh text for consistent searching.
	This function:
	1. Treats ⵔ and ⵕ as the same character.
	2. Removes ⵯ (Tawalt) from the text (similar to diacritic removal).
	"""
	if not text:
	return text

	# Treat ⵔ and ⵕ as the same character
	text = text.replace("ⵕ", "ⵔ").replace("ⵚ", "ⵙ") # Replace all instances of ⵕ with ⵔ

	# Remove ⵯ (Tawalt)
	text = text.replace("ⵯ", "")

	return text.lower() # Return lowercase for consistence

	def search_dictionary(query):
	if not query or len(query.strip()) < 1:
	return "Please enter a search term"

	# Check if query contains wildcards (.)
	has_wildcards = '.' in query

	# Normalize for different search types
	normalized_query_general = normalize_general_text(query.replace('.', '_') if has_wildcards else query)
	normalized_query_french = normalize_french_text(query.replace('.', '_') if has_wildcards else query)
	normalized_query_amazigh = normalize_amazigh_text(query.replace('.', '_') if has_wildcards else query)

	# Standard search patterns
	start_search_term_general = f"{normalized_query_general}%"
	contain_search_term_general = f"%{normalized_query_general}%"
	end_search_term_general = f"%{normalized_query_general}"

	start_search_term_french = f"{normalized_query_french}%"
	contain_search_term_french = f"%{normalized_query_french}%"
	end_search_term_french = f"%{normalized_query_french}"

	start_search_term_amazigh = f"{normalized_query_amazigh}%"
	contain_search_term_amazigh = f"%{normalized_query_amazigh}%"
	end_search_term_amazigh = f"%{normalized_query_amazigh}"

	# Word boundary patterns - match whole words
	if not has_wildcards:
	word_boundary_general = f"% {normalized_query_general} %"
	word_boundary_start_general = f"{normalized_query_general} %"
	word_boundary_end_general = f"% {normalized_query_general}"

	word_boundary_french = f"% {normalized_query_french} %"
	word_boundary_start_french = f"{normalized_query_french} %"
	word_boundary_end_french = f"% {normalized_query_french}"

	word_boundary_amazigh = f"% {normalized_query_amazigh} %"
	word_boundary_start_amazigh = f"{normalized_query_amazigh} %"
	word_boundary_end_amazigh = f"% {normalized_query_amazigh}"
	else:
	# For wildcard searches, convert dots to SQL's underscore wildcard
	wildcard_pattern_general = normalized_query_general
	wildcard_pattern_french = normalized_query_french
	wildcard_pattern_amazigh = normalized_query_amazigh

	# --- Search dglai14.db (Prioritized) ---
	dglai14_results = search_dglai14(
	normalized_query_general, normalized_query_french, normalized_query_amazigh,
	start_search_term_general, contain_search_term_general, end_search_term_general,
	start_search_term_french, contain_search_term_french, end_search_term_french,
	start_search_term_amazigh, contain_search_term_amazigh, end_search_term_amazigh,
	has_wildcards
	)

	# --- Search tawalt_fr.db (Secondary) ---
	remaining_results = 50 - len(dglai14_results)
	if remaining_results > 0:
	tawalt_fr_results = search_tawalt_fr(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, remaining_results)
	remaining_results -= len(tawalt_fr_results)
	else:
	tawalt_fr_results = []

	# --- Search tawalt.db (Tertiary) ---
	if remaining_results > 0:
	tawalt_results = search_tawalt(start_search_term_general, contain_search_term_general,start_search_term_amazigh, contain_search_term_amazigh, remaining_results)
	remaining_results -= len(tawalt_results)
	else:
	tawalt_results = [] # No need to search tawalt

	# --- Search eng.db (Quaternary) ---
	if remaining_results > 0:
	eng_results = search_eng(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, remaining_results)
	remaining_results -= len(eng_results)
	else:
	eng_results = []

	# --- Search msmun_fr.db (Quinary) ---
	if remaining_results > 0:
	msmun_fr_m_results = search_msmun_fr_m(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, remaining_results)
	remaining_results -= len(msmun_fr_m_results)
	else:
	msmun_fr_m_results = []

	if remaining_results > 0:
	msmun_fr_r_results = search_msmun_fr_r(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, remaining_results)
	remaining_results -= len(msmun_fr_r_results)
	else:
	msmun_fr_r_results = []

	# --- Search msmun_ar.db (Senary) ---
	if remaining_results > 0:
	msmun_ar_m_r_results = search_msmun_ar_m_r(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, remaining_results)
	remaining_results -= len(msmun_ar_m_r_results)
	else:
	msmun_ar_m_r_results = []

	if remaining_results > 0:
	msmun_ar_r_m_results = search_msmun_ar_r_m(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, remaining_results)
	remaining_results -= len(msmun_ar_r_m_results)
	else:
	msmun_ar_r_m_results = []


	# --- Combine and Format Results ---
	html_output = format_dglai14_results(dglai14_results) # Format dglai14 results
	html_output += format_tawalt_fr_results(tawalt_fr_results) # Format tawalt_fr results
	html_output += format_tawalt_results(tawalt_results) # Format tawalt results (if any)
	html_output += format_eng_results(eng_results)
	html_output += format_msmun_fr_m_results(msmun_fr_m_results) # Format msmun_fr table_m results
	html_output += format_msmun_fr_r_results(msmun_fr_r_results) # Format msmun_fr table_r results
	html_output += format_msmun_ar_m_r_results(msmun_ar_m_r_results)
	html_output += format_msmun_ar_r_m_results(msmun_ar_r_m_results)


	if not html_output:
	return "No results found"

	return html_output


	def search_dglai14(normalized_query_general, normalized_query_french, normalized_query_amazigh,
	start_search_term_general, contain_search_term_general, end_search_term_general,
	start_search_term_french, contain_search_term_french, end_search_term_french,
	start_search_term_amazigh, contain_search_term_amazigh, end_search_term_amazigh,
	has_wildcards):
	conn = get_db_connection('dglai14.db')
	cursor = conn.cursor()

	# Add custom functions for normalization
	conn.create_function("NORMALIZE_AMAZIGH", 1, normalize_amazigh_text)
	conn.create_function("NORMALIZE_FRENCH", 1, normalize_french_text)

	# Build query conditions
	base_conditions = []

	# Amazigh field conditions
	amazigh_fields = ["lexie", "remarque", "variante", "eadata", "pldata"]

	for field in amazigh_fields:
	base_conditions.append(f"(NORMALIZE_AMAZIGH({field}) LIKE ?)")

	# French field conditions
	french_fields = ["sens_fr", "expression.exp_fr"]

	for field in french_fields:
	base_conditions.append(f"(NORMALIZE_FRENCH({field}) LIKE ?)")

	# General field conditions
	general_fields = ["cg", "acc", "acc_neg", "inacc", "fel", "fea", "fpel", "fpea", "sens_ar", "expression.exp_ar"]

	for field in general_fields:
	base_conditions.append(f"(REMOVE_DIACRITICS(LOWER({field})) LIKE ?)")

	# Add word boundary conditions if not using wildcards
	if not has_wildcards:
	# Word boundary conditions for Amazigh fields
	for field in amazigh_fields:
	base_conditions.append(f"(NORMALIZE_AMAZIGH({field}) LIKE ? OR NORMALIZE_AMAZIGH({field}) LIKE ? OR NORMALIZE_AMAZIGH({field}) LIKE ?)")

	# Word boundary conditions for French fields
	for field in french_fields:
	base_conditions.append(f"(NORMALIZE_FRENCH({field}) LIKE ? OR NORMALIZE_FRENCH({field}) LIKE ? OR NORMALIZE_FRENCH({field}) LIKE ?)")

	# Word boundary conditions for general fields
	for field in general_fields:
	base_conditions.append(f"(REMOVE_DIACRITICS(LOWER({field})) LIKE ? OR REMOVE_DIACRITICS(LOWER({field})) LIKE ? OR REMOVE_DIACRITICS(LOWER({field})) LIKE ?)")

	# Build the full query
	query = f"""
	SELECT lexie.*, sens.sens_fr, sens.sens_ar,
	expression.exp_amz, expression.exp_fr, expression.exp_ar
	FROM lexie
	LEFT JOIN sens ON lexie.id_lexie = sens.id_lexie
	LEFT JOIN expression ON lexie.id_lexie = expression.id_lexie
	WHERE {" OR ".join(base_conditions)}
	ORDER BY lexie.id_lexie
	LIMIT 50
	"""

	# Build parameters list
	params = []

	# Add parameters for basic conditions
	for _ in amazigh_fields:
	params.append(start_search_term_amazigh)

	for _ in french_fields:
	params.append(start_search_term_french)

	for _ in general_fields:
	params.append(start_search_term_general)

	# Add parameters for word boundary conditions if not using wildcards
	if not has_wildcards:
	for _ in amazigh_fields:
	params.extend([f"% {normalized_query_amazigh} %", f"{normalized_query_amazigh} %", f"% {normalized_query_amazigh}"])

	for _ in french_fields:
	params.extend([f"% {normalized_query_french} %", f"{normalized_query_french} %", f"% {normalized_query_french}"])

	for _ in general_fields:
	params.extend([f"% {normalized_query_general} %", f"{normalized_query_general} %", f"% {normalized_query_general}"])

	# Execute query
	cursor.execute(query, params)
	results = cursor.fetchall()

	# For contains search (not starting with the term)
	contains_query = f"""
	SELECT lexie.*, sens.sens_fr, sens.sens_ar,
	expression.exp_amz, expression.exp_fr, expression.exp_ar
	FROM lexie
	LEFT JOIN sens ON lexie.id_lexie = sens.id_lexie
	LEFT JOIN expression ON lexie.id_lexie = expression.id_lexie
	WHERE ({" OR ".join(base_conditions)})
	AND NOT (NORMALIZE_AMAZIGH(lexie) LIKE ?)
	ORDER BY lexie.id_lexie
	LIMIT 50
	"""

	# Update parameters for contains search
	contains_params = []

	for _ in amazigh_fields:
	contains_params.append(contain_search_term_amazigh)

	for _ in french_fields:
	contains_params.append(contain_search_term_french)

	for _ in general_fields:
	contains_params.append(contain_search_term_general)

	# Add parameters for word boundary conditions if not using wildcards
	if not has_wildcards:
	for _ in amazigh_fields:
	contains_params.extend([f"% {normalized_query_amazigh} %", f"{normalized_query_amazigh} %", f"% {normalized_query_amazigh}"])

	for _ in french_fields:
	contains_params.extend([f"% {normalized_query_french} %", f"{normalized_query_french} %", f"% {normalized_query_french}"])

	for _ in general_fields:
	contains_params.extend([f"% {normalized_query_general} %", f"{normalized_query_general} %", f"% {normalized_query_general}"])

	contains_params.append(start_search_term_amazigh) # For NOT LIKE condition

	cursor.execute(contains_query, contains_params)
	contains_results = cursor.fetchall()

	conn.close()
	return list(results) + list(contains_results)

	def search_tawalt_fr(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, limit):
	conn = get_db_connection('tawalt_fr.db')
	cursor = conn.cursor()

	# Add the custom SQLite function for Amazigh normalization
	conn.create_function("NORMALIZE_AMAZIGH", 1, normalize_amazigh_text)
	conn.create_function("NORMALIZE_FRENCH", 1, normalize_french_text)

	# Start Search (tawalt_fr)
	cursor.execute("""
	SELECT *
	FROM words
	WHERE
	(NORMALIZE_AMAZIGH(tifinagh) LIKE ?)
	OR (NORMALIZE_FRENCH(french) LIKE ?)
	ORDER BY _id
	LIMIT ?
	""", (start_search_term_amazigh, start_search_term_general, limit))
	start_results = cursor.fetchall()

	# Contain Search (tawalt_fr)
	cursor.execute("""
	SELECT *
	FROM words
	WHERE (
	(NORMALIZE_AMAZIGH(tifinagh) LIKE ?)
	OR (NORMALIZE_FRENCH(french) LIKE ?)
	)
	AND NOT (NORMALIZE_AMAZIGH(tifinagh) LIKE ?)
	ORDER BY _id
	LIMIT ?
	""", (contain_search_term_amazigh, contain_search_term_general, start_search_term_amazigh, limit))
	contain_results = cursor.fetchall()
	conn.close()
	return list(start_results) + list(contain_results)


	def search_tawalt(start_search_term_general, contain_search_term_general,start_search_term_amazigh, contain_search_term_amazigh, limit):
	conn = get_db_connection('tawalt.db')
	cursor = conn.cursor()

	# Add the custom SQLite function for Amazigh normalization
	conn.create_function("NORMALIZE_AMAZIGH", 1, normalize_amazigh_text) #To be removed if the database is selectable

	# Start Search (tawalt)
	cursor.execute("""
	SELECT *
	FROM words
	WHERE
	(NORMALIZE_AMAZIGH(tifinagh) LIKE ?) -- Use NORMALIZE_AMAZIGH for tifinagh
	OR (REMOVE_DIACRITICS(LOWER(arabic)) LIKE ?)
	OR (REMOVE_DIACRITICS(LOWER(arabic_meaning)) LIKE ?)
	OR (NORMALIZE_AMAZIGH(tifinagh_in_arabic) LIKE ?) -- Use NORMALIZE_AMAZIGH
	OR (REMOVE_DIACRITICS(LOWER(_arabic)) LIKE ?) -- Corrected: REMOVE_DIACRITICS for arabic columns
	OR (REMOVE_DIACRITICS(LOWER(_arabic_meaning)) LIKE ?) -- Corrected: REMOVE_DIACRITICS for arabic columns
	OR (NORMALIZE_AMAZIGH(_tifinagh_in_arabic) LIKE ?)
	ORDER BY _id
	LIMIT ?
	""", (start_search_term_amazigh, start_search_term_general, start_search_term_general, start_search_term_amazigh,
	start_search_term_general, start_search_term_general, start_search_term_amazigh, limit))
	start_results = cursor.fetchall()

	# Contain Search (tawalt)
	cursor.execute("""
	SELECT *
	FROM words
	WHERE (
	(NORMALIZE_AMAZIGH(tifinagh) LIKE ?) -- Use NORMALIZE_AMAZIGH for tifinagh
	OR (REMOVE_DIACRITICS(LOWER(arabic)) LIKE ?)
	OR (REMOVE_DIACRITICS(LOWER(arabic_meaning)) LIKE ?)
	OR (NORMALIZE_AMAZIGH(tifinagh_in_arabic) LIKE ?) -- Use NORMALIZE_AMAZIGH
	OR (REMOVE_DIACRITICS(LOWER(_arabic)) LIKE ?) -- Corrected: REMOVE_DIACRITICS for arabic columns
	OR (REMOVE_DIACRITICS(LOWER(_arabic_meaning)) LIKE ?) -- Corrected: REMOVE_DIACRITICS for arabic columns
	OR (NORMALIZE_AMAZIGH(_tifinagh_in_arabic) LIKE ?)
	)
	AND NOT (NORMALIZE_AMAZIGH(tifinagh) LIKE ?) -- Use NORMALIZE_AMAZIGH
	ORDER BY _id
	LIMIT ?
	""", (contain_search_term_amazigh, contain_search_term_general, contain_search_term_general, contain_search_term_amazigh,
	contain_search_term_general, contain_search_term_general, contain_search_term_amazigh,
	start_search_term_amazigh, limit)) # Use start_search_term_amazigh for NOT LIKE
	contain_results = cursor.fetchall()
	conn.close()
	return list(start_results) + list(contain_results)

	def search_eng(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, limit):
	conn = get_db_connection('eng.db')
	cursor = conn.cursor()
	conn.create_function("NORMALIZE_AMAZIGH", 1, normalize_amazigh_text)

	cursor.execute("""
	SELECT da.*, dea.sens_eng
	FROM Dictionary_Amazigh_full AS da
	LEFT JOIN Dictionary_English_Amazih_links AS dea ON da.id_lexie = dea.id_lexie
	WHERE (
	NORMALIZE_AMAZIGH(da.lexie) LIKE ?
	OR NORMALIZE_AMAZIGH(da.remarque) LIKE ?
	OR NORMALIZE_AMAZIGH(da.variante) LIKE ?
	OR LOWER(da.cg) LIKE ?
	OR NORMALIZE_AMAZIGH(da.eadata) LIKE ?
	OR NORMALIZE_AMAZIGH(da.pldata) LIKE ?
	OR LOWER(da.acc) LIKE ?
	OR LOWER(da.acc_neg) LIKE ?
	OR LOWER(da.inacc) LIKE ?
	OR LOWER(dea.sens_eng) LIKE ?
	)
	ORDER BY da.id_lexie
	LIMIT ?
	""", (start_search_term_amazigh, start_search_term_amazigh, start_search_term_amazigh, start_search_term_general,
	start_search_term_amazigh, start_search_term_amazigh, start_search_term_general, start_search_term_general,
	start_search_term_general, start_search_term_general, limit))

	start_results = cursor.fetchall()

	cursor.execute("""
	SELECT da.*, dea.sens_eng
	FROM Dictionary_Amazigh_full AS da
	LEFT JOIN Dictionary_English_Amazih_links AS dea ON da.id_lexie = dea.id_lexie
	WHERE (
	NORMALIZE_AMAZIGH(da.lexie) LIKE ?
	OR NORMALIZE_AMAZIGH(da.remarque) LIKE ?
	OR NORMALIZE_AMAZIGH(da.variante) LIKE ?
	OR LOWER(da.cg) LIKE ?
	OR NORMALIZE_AMAZIGH(da.eadata) LIKE ?
	OR NORMALIZE_AMAZIGH(da.pldata) LIKE ?
	OR LOWER(da.acc) LIKE ?
	OR LOWER(da.acc_neg) LIKE ?
	OR LOWER(da.inacc) LIKE ?
	OR LOWER(dea.sens_eng) LIKE ?
	)
	AND NOT NORMALIZE_AMAZIGH(da.lexie) LIKE ?
	ORDER BY da.id_lexie
	LIMIT ?
	""", (contain_search_term_amazigh, contain_search_term_amazigh, contain_search_term_amazigh, contain_search_term_general,
	contain_search_term_amazigh, contain_search_term_amazigh, contain_search_term_general, contain_search_term_general,
	contain_search_term_general, contain_search_term_general, start_search_term_amazigh, limit))
	contain_results = cursor.fetchall()
	conn.close()

	return list(start_results) + list(contain_results)

	def search_msmun_fr_m(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, limit):
	conn = get_db_connection('msmun_fr.db')
	cursor = conn.cursor()
	conn.create_function("NORMALIZE_AMAZIGH", 1, normalize_amazigh_text)
	conn.create_function("NORMALIZE_FRENCH", 1, normalize_french_text)

	cursor.execute("""
	SELECT *
	FROM table_m
	WHERE (
	NORMALIZE_AMAZIGH(word) LIKE ?
	OR NORMALIZE_FRENCH(result) LIKE ?
	)
	ORDER BY _id
	LIMIT ?
	""", (start_search_term_amazigh, start_search_term_general, limit))
	start_results = cursor.fetchall()

	cursor.execute("""
	SELECT *
	FROM table_m
	WHERE (
	NORMALIZE_AMAZIGH(word) LIKE ?
	OR NORMALIZE_FRENCH(result) LIKE ?
	)
	AND NOT NORMALIZE_AMAZIGH(word) LIKE ?
	ORDER BY _id
	LIMIT ?
	""", (contain_search_term_amazigh, contain_search_term_general, start_search_term_amazigh, limit))
	contain_results = cursor.fetchall()
	conn.close()
	return list(start_results) + list(contain_results)

	def search_msmun_fr_r(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, limit):
	conn = get_db_connection('msmun_fr.db')
	cursor = conn.cursor()
	conn.create_function("NORMALIZE_AMAZIGH", 1, normalize_amazigh_text)
	conn.create_function("NORMALIZE_FRENCH", 1, normalize_french_text)

	cursor.execute("""
	SELECT *
	FROM table_r
	WHERE (
	NORMALIZE_FRENCH(word) LIKE ?
	OR NORMALIZE_AMAZIGH(result) LIKE ?
	)
	ORDER BY _id
	LIMIT ?
	""", (start_search_term_general, start_search_term_amazigh, limit))
	start_results = cursor.fetchall()

	cursor.execute("""
	SELECT *
	FROM table_r
	WHERE (
	NORMALIZE_FRENCH(word) LIKE ?
	OR NORMALIZE_AMAZIGH(result) LIKE ?
	)
	AND NOT NORMALIZE_FRENCH(word) LIKE ?
	ORDER BY _id
	LIMIT ?
	""", (contain_search_term_general, contain_search_term_amazigh, start_search_term_general, limit))
	contain_results = cursor.fetchall()
	conn.close()
	return list(start_results) + list(contain_results)


	def search_msmun_ar_m_r(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, limit):
	conn = get_db_connection('msmun_ar.db')
	cursor = conn.cursor()
	conn.create_function("NORMALIZE_AMAZIGH", 1, normalize_amazigh_text)

	cursor.execute("""
	SELECT *
	FROM table_m_r
	WHERE (
	NORMALIZE_AMAZIGH(word) LIKE ?
	OR REMOVE_DIACRITICS(LOWER(result)) LIKE ?
	)
	ORDER BY _id
	LIMIT ?
	""", (start_search_term_amazigh, start_search_term_general, limit))
	start_results = cursor.fetchall()

	cursor.execute("""
	SELECT *
	FROM table_m_r
	WHERE (
	NORMALIZE_AMAZIGH(word) LIKE ?
	OR REMOVE_DIACRITICS(LOWER(result)) LIKE ?
	)
	AND NOT NORMALIZE_AMAZIGH(word) LIKE ?
	ORDER BY _id
	LIMIT ?
	""", (contain_search_term_amazigh, contain_search_term_general, start_search_term_amazigh, limit))
	contain_results = cursor.fetchall()
	conn.close()
	return list(start_results) + list(contain_results)

	def search_msmun_ar_r_m(start_search_term_general, contain_search_term_general, start_search_term_amazigh, contain_search_term_amazigh, limit):
	conn = get_db_connection('msmun_ar.db')
	cursor = conn.cursor()
	conn.create_function("NORMALIZE_AMAZIGH", 1, normalize_amazigh_text)

	cursor.execute("""
	SELECT *
	FROM table_r_m
	WHERE (
	REMOVE_DIACRITICS(LOWER(word)) LIKE ?
	OR NORMALIZE_AMAZIGH(result) LIKE ?
	)
	ORDER BY _id
	LIMIT ?
	""", (start_search_term_general, start_search_term_amazigh, limit))
	start_results = cursor.fetchall()

	cursor.execute("""
	SELECT *
	FROM table_r_m
	WHERE (
	REMOVE_DIACRITICS(LOWER(word)) LIKE ?
	OR NORMALIZE_AMAZIGH(result) LIKE ?
	)
	AND NOT REMOVE_DIACRITICS(LOWER(word)) LIKE ?
	ORDER BY _id
	LIMIT ?
	""", (contain_search_term_general, contain_search_term_amazigh, start_search_term_general, limit))
	contain_results = cursor.fetchall()
	conn.close()
	return list(start_results) + list(contain_results)


	def format_dglai14_results(results):
	"""Formats results from dglai14.db."""
	if not results:
	return ""

	aggregated_results = {}
	for row in results:
	lexie_id = row['id_lexie']
	if lexie_id not in aggregated_results:
	aggregated_results[lexie_id] = {
	'lexie': row['lexie'],
	'remarque': row['remarque'],
	'variante': row['variante'],
	'cg': row['cg'],
	'eadata': row['eadata'],
	'pldata': row['pldata'],
	'acc': row['acc'],
	'acc_neg': row['acc_neg'],
	'inacc': row['inacc'],
	'fel': row['fel'],
	'fea': row['fea'],
	'fpel': row['fpel'],
	'fpea': row['fpea'],
	'sens_frs': set(),
	'sens_ars': set(),
	'expressions': {}
	}
	aggregated_results[lexie_id]['sens_frs'].add(row['sens_fr'])
	aggregated_results[lexie_id]['sens_ars'].add(row['sens_ar'])
	if row['exp_amz']:
	exp_amz = row['exp_amz']
	if exp_amz not in aggregated_results[lexie_id]['expressions']:
	aggregated_results[lexie_id]['expressions'][exp_amz] = {
	'french_translations': set(),
	'arabic_translations': set()
	}
	if row['exp_fr']:
	aggregated_results[lexie_id]['expressions'][exp_amz]['french_translations'].add(row['exp_fr'])
	if row['exp_ar']:
	aggregated_results[lexie_id]['expressions'][exp_amz]['arabic_translations'].add(row['exp_ar'])

	html_output = ""
	for lexie_id, data in aggregated_results.items():
	html_output += f"""
	<div style="background: #f0f8ff; padding: 20px; margin: 10px 0; border-radius: 8px; box-shadow: 0 2px 4px rgba(0,0,0,0.1);">
	<div style="display: flex; justify-content: space-between; align-items: center; border-bottom: 2px solid #3498db; padding-bottom: 10px; margin-bottom: 10px;">
	<h3 style="color: #2c3e50; margin: 0;">{data['lexie'] or ''}</h3>
	<span style="background: #3498db; color: white; padding: 4px 8px; border-radius: 4px; margin-left: 5px;">IRCAM (DGLAi)</span>
	<span style="background: #3498db; color: white; padding: 4px 8px; border-radius: 4px;">{data['cg'] or ''}</span>
	</div>
	"""

	fields = {
	'Notes': 'remarque',
	'Construct State': 'eadata',
	'Plural': 'pldata',
	'acc.': 'acc',
	'acc. nég.': 'acc_neg',
	'inacc.': 'inacc',
	'Variants': 'variante',
	'Feminine': 'fel',
	'Feminine Construct': 'fea',
	'Feminine Plural': 'fpel',
	'Feminine Plural Construct': 'fpea',
	}

	for label, field in fields.items():
	if data[field]:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">{label}:</strong>
	<span style="color: black;">{data[field]}</span>
	</div>
	"""

	french_translations = ", ".join(filter(None, data['sens_frs']))
	arabic_translations = ", ".join(filter(None, data['sens_ars']))

	if french_translations:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">French Translation:</strong>
	<span style="color: black;">{french_translations}</span>
	</div>
	"""
	if arabic_translations:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Arabic Translation:</strong>
	<span style="color: black;">{arabic_translations}</span>
	</div>
	"""

	if data['expressions']:
	html_output += f"""
	<div style="margin-top: 10px; border-top: 1px solid #ddd; padding-top: 10px;">
	<strong style="color: #34495e;">Expressions:</strong>
	"""
	for exp_amz, translations in data['expressions'].items():
	french_exp_translations = ", ".join(filter(None, translations['french_translations']))
	arabic_exp_translations = ", ".join(filter(None, translations['arabic_translations']))

	html_output += f"""
	<div style="margin-top: 6px; padding-left: 15px; border-bottom: 1px solid #eee; padding-bottom: 8px; margin-bottom: 8px;">
	<div style="margin-bottom: 4px;">
	<strong style="color: #546e7a;">Amazigh:</strong>
	<span style="color: black;">{exp_amz or ''}</span>
	</div>
	"""
	if french_exp_translations:
	html_output += f"""
	<div style="margin-bottom: 4px;">
	<strong style="color: #546e7a;">French:</strong>
	<span style="color: black;">{french_exp_translations or ''}</span>
	</div>
	"""
	if arabic_exp_translations:
	html_output += f"""
	<div>
	<strong style="color: #546e7a;">Arabic:</strong>
	<span style="color: black;">{arabic_exp_translations or ''}</span>
	</div>
	"""
	html_output += "</div>"
	html_output += "</div>"

	html_output += "</div>"
	return html_output

	def format_tawalt_fr_results(results):
	"""Formats results from tawalt_fr.db."""
	if not results:
	return ""

	html_output = ""
	for row in results:
	html_output += f"""
	<div style="background: #ffe0b2; padding: 20px; margin: 10px 0; border-radius: 8px; box-shadow: 0 2px 4px rgba(0,0,0,0.1);">
	<div style="display: flex; justify-content: space-between; align-items: center; border-bottom: 2px solid #ff9800; padding-bottom: 10px; margin-bottom: 10px;">
	<h3 style="color: #2c3e50; margin: 0;">{row['tifinagh'] or ''}</h3>
	</div>
	"""
	if row['french']:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">French:</strong>
	<span style="color: black;">{row['french']}</span>
	</div>
	"""
	html_output += "</div>"

	return html_output


	def format_tawalt_results(results):
	"""Formats results from tawalt.db."""
	if not results:
	return ""

	html_output = ""
	for row in results:
	html_output += f"""
	<div style="background: #fffacd; padding: 20px; margin: 10px 0; border-radius: 8px; box-shadow: 0 2px 4px rgba(0,0,0,0.1);">
	<div style="display: flex; justify-content: space-between; align-items: center; border-bottom: 2px solid #3498db; padding-bottom: 10px; margin-bottom: 10px;">
	<h3 style="color: #2c3e50; margin: 0;">{row['tifinagh'] or ''}</h3>
	</div>
	"""
	if row['arabic']:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Arabic:</strong>
	<span style="color: black;">{row['arabic']}</span>
	</div>
	"""
	if row['arabic_meaning']:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Arabic Meaning:</strong>
	<span style="color: black;">{row['arabic_meaning']}</span>
	</div>
	"""
	html_output += "</div>"

	return html_output

	def format_eng_results(results):
	"""Formats results from eng.db."""
	if not results:
	return ""

	aggregated_results = {}
	for row in results:
	lexie_id = row['id_lexie']
	if lexie_id not in aggregated_results:
	aggregated_results[lexie_id] = {
	'lexie': row['lexie'],
	'remarque': row['remarque'],
	'variante': row['variante'],
	'cg': row['cg'],
	'eadata': row['eadata'],
	'pldata': row['pldata'],
	'acc': row['acc'],
	'acc_neg': row['acc_neg'],
	'inacc': row['inacc'],
	'sens_eng': set()
	}
	if row['sens_eng']: # Handle potential NULL values
	aggregated_results[lexie_id]['sens_eng'].add(row['sens_eng'])

	html_output = ""
	for lexie_id, data in aggregated_results.items():
	html_output += f"""
	<div style="background: #d3f8d3; padding: 20px; margin: 10px 0; border-radius: 8px; box-shadow: 0 2px 4px rgba(0,0,0,0.1);">
	<div style="display: flex; justify-content: space-between; align-items: center; border-bottom: 2px solid #2ecc71; padding-bottom: 10px; margin-bottom: 10px;">
	<h3 style="color: #2c3e50; margin: 0;">{data['lexie'] or ''}</h3>
	<span style="background: #2ecc71; color: white; padding: 4px 8px; border-radius: 4px;">{data['cg'] or ''}</span>
	</div>
	"""

	fields = {
	'Notes': 'remarque',
	'Construct State': 'eadata',
	'Plural': 'pldata',
	'Accomplished': 'acc',
	'Negative Accomplished': 'acc_neg',
	'Unaccomplished': 'inacc',
	'Variants': 'variante',
	}

	for label, field in fields.items():
	if data[field]:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">{label}:</strong>
	<span style="color: black;">{data[field]}</span>
	</div>
	"""
	english_translations = ", ".join(filter(None, data['sens_eng'])) # Handle null values

	if english_translations:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">English Translation:</strong>
	<span style="color: black;">{english_translations}</span>
	</div>
	"""
	html_output += "</div>"

	return html_output

	def format_msmun_fr_m_results(results):
	"""Formats results from msmun_fr.db table_m."""
	if not results:
	return ""

	html_output = ""
	for row in results:
	html_output += f"""
	<div style="background: #fce4ec; padding: 20px; margin: 10px 0; border-radius: 8px; box-shadow: 0 2px 4px rgba(0,0,0,0.1);">
	<div style="display: flex; justify-content: space-between; align-items: center; border-bottom: 2px solid #f06292; padding-bottom: 10px; margin-bottom: 10px;">
	<h3 style="color: #2c3e50; margin: 0;">{row['word'] or ''}</h3>
	</div>
	"""
	if row['result']:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">French Translation:</strong>
	<span style="color: black;">{row['result']}</span>
	</div>
	"""
	if row['edited'] and row['edited'].lower() == 'true':
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Edited:</strong>
	<span style="color: black;">Yes</span>
	</div>
	"""
	if row['favorites'] and row['favorites'].lower() == 'true':
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Favorites:</strong>
	<span style="color: black;">Yes</span>
	</div>
	"""
	html_output += "</div>"
	return html_output

	def format_msmun_fr_r_results(results):
	"""Formats results from msmun_fr.db table_r."""
	if not results:
	return ""

	html_output = ""
	for row in results:
	html_output += f"""
	<div style="background: #f3e5f5; padding: 20px; margin: 10px 0; border-radius: 8px; box-shadow: 0 2px 4px rgba(0,0,0,0.1);">
	<div style="display: flex; justify-content: space-between; align-items: center; border-bottom: 2px solid #ab47bc; padding-bottom: 10px; margin-bottom: 10px;">
	<h3 style="color: #2c3e50; margin: 0;">{row['result'] or ''}</h3>
	</div>
	"""
	if row['result']:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Arabic Translation:</strong>
	<span style="color: black;">{row['word']}</span>
	</div>
	"""
	if row['edited'] and row['edited'].lower() == 'true':
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Edited:</strong>
	<span style="color: black;">Yes</span>
	</div>
	"""
	if row['favorites'] and row['favorites'].lower() == 'true':
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Favorites:</strong>
	<span style="color: black;">Yes</span>
	</div>
	"""
	html_output += "</div>"
	return html_output


	def format_msmun_ar_m_r_results(results):
	"""Formats results from msmun_ar.db table_m_r."""
	if not results:
	return ""

	html_output = ""
	for row in results:
	html_output += f"""
	<div style="background: #e0f7fa; padding: 20px; margin: 10px 0; border-radius: 8px; box-shadow: 0 2px 4px rgba(0,0,0,0.1);">
	<div style="display: flex; justify-content: space-between; align-items: center; border-bottom: 2px solid #00bcd4; padding-bottom: 10px; margin-bottom: 10px;">
	<h3 style="color: #2c3e50; margin: 0;">{row['word'] or ''}</h3>
	</div>
	"""
	if row['result']:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Arabic Translation:</strong>
	<span style="color: black;">{row['result']}</span>
	</div>
	"""
	if row['edited'] and row['edited'].lower() == 'true':
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Edited:</strong>
	<span style="color: black;">Yes</span>
	</div>
	"""
	if row['favorites'] and row['favorites'].lower() == 'true':
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Favorites:</strong>
	<span style="color: black;">Yes</span>
	</div>
	"""
	html_output += "</div>"
	return html_output

	def format_msmun_ar_r_m_results(results):
	"""Formats results from msmun_ar.db table_r_m."""
	if not results:
	return ""

	html_output = ""
	for row in results:
	html_output += f"""
	<div style="background: #e8f5e9; padding: 20px; margin: 10px 0; border-radius: 8px; box-shadow: 0 2px 4px rgba(0,0,0,0.1);">
	<div style="display: flex; justify-content: space-between; align-items: center; border-bottom: 2px solid #4caf50; padding-bottom: 10px; margin-bottom: 10px;">
	<h3 style="color: #2c3e50; margin: 0;">{row['result'] or ''}</h3>
	</div>
	"""
	if row['result']:
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Arabic Translation:</strong>
	<span style="color: black;">{row['word']}</span>
	</div>
	"""
	if row['edited'] and row['edited'].lower() == 'true':
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Edited:</strong>
	<span style="color: black;">Yes</span>
	</div>
	"""
	if row['favorites'] and row['favorites'].lower() == 'true':
	html_output += f"""
	<div style="margin-bottom: 8px;">
	<strong style="color: #34495e;">Favorites:</strong>
	<span style="color: black;">Yes</span>
	</div>
	"""
	html_output += "</div>"
	return html_output


	# Create Gradio interface (Remains the same)
	with gr.Blocks(css="footer {display: none !important}") as iface:
	gr.HTML("""
	<div style="text-align: center; margin-bottom: 2rem;">
	<h1 style="color: #2c3e50; margin-bottom: 1rem;">Amazigh Dictionary</h1>
	</div>
	""")

	with gr.Row():
	input_text = gr.Textbox(
	label="Search",
	placeholder="Enter a word to search... Use these languages ⵜⴰⵎⴰⵣⵉⵖⵜ - عربية - English - Français",
	lines=1
	)

	output_html = gr.HTML()

	input_text.change(
	fn=search_dictionary,
	inputs=input_text,
	outputs=output_html,
	api_name="search"
	)

	if __name__ == "__main__":
	iface.launch()