Spaces:

ChandimaPrabath
/

eve

Running

eve / polLLM.py

Chandima Prabhath

Enhance logging and error handling across modules; refactor image generation and upload processes; update configuration for image generation parameters.

5f26e9c 5 months ago

raw

history blame

2.8 kB

	import os
	import time
	import random
	import logging
	from openai import OpenAI
	from dotenv import load_dotenv
	from utils import read_config

	# --- Load environment & config ---
	load_dotenv()
	_config = read_config()["llm"]

	# --- Logging setup ---
	LOG_LEVEL = os.getenv("LOG_LEVEL", "INFO").upper()
	logger = logging.getLogger("polLLM")
	logger.setLevel(LOG_LEVEL)
	handler = logging.StreamHandler()
	handler.setFormatter(logging.Formatter("%(asctime)s [%(levelname)s] %(message)s"))
	logger.addHandler(handler)

	# --- LLM settings from config.yaml ---
	_DEFAULT_MODEL = _config.get("model", "openai-large")
	_SYSTEM_TEMPLATE = _config.get("system_prompt", "")
	_CHAR = _config.get("char", "Eve")
	_DEFAULT_MAX_TOKENS = _config.get("max_tokens", 8000)

	# --- OpenAI client init ---
	client = OpenAI(
	base_url = os.getenv("OPENAI_BASE_URL", "https://text.pollinations.ai/openai"),
	api_key = os.getenv("OPENAI_API_KEY", "")
	)

	def _build_system_prompt() -> str:
	"""
	Substitute {char} into the system prompt template.
	"""
	return _SYSTEM_TEMPLATE.replace("{char}", _CHAR)

	def generate_llm(
	prompt: str,
	model: str = None,
	max_tokens: int = None,
	temperature: float = None,
	) -> str:
	"""
	Send a chat-completion request to the LLM, with retries and backoff.
	Reads defaults from config.yaml, but can be overridden per-call.
	"""
	model = model or _DEFAULT_MODEL
	max_tokens = max_tokens or _DEFAULT_MAX_TOKENS
	temperature = temperature if temperature is not None else _DEFAULT_TEMPERATURE

	system_prompt = _build_system_prompt()
	messages = [
	{"role": "system", "content": system_prompt},
	{"role": "user", "content": prompt},
	]

	backoff = 1
	for attempt in range(1, 6):
	try:
	seed = random.randint(0, 2**31 - 1)
	logger.debug(f"LLM call attempt={attempt}, model={model}, seed={seed}")
	resp = client.chat.completions.create(
	model = model,
	messages = messages,
	max_tokens = max_tokens,
	temperature = temperature,
	seed = seed,
	)
	text = resp.choices[0].message.content.strip()
	logger.debug("LLM response received")
	return text
	except Exception as e:
	logger.error(f"LLM error on attempt {attempt}: {e}")
	if attempt < 5:
	time.sleep(backoff)
	backoff *= 2
	else:
	logger.critical("LLM failed after 5 attempts, raising")
	raise

	# Example local test
	if __name__ == "__main__":
	logger.info("Testing generate_llm() with a sample prompt")
	print(generate_llm("Say hello in a poetic style."))