hf inference endpoints: parameters를 포함하여 특정 내용으로 prompt 를 할 경우 generated_text 가 ""(empty)로 반환되는 이슈

#1
by dev-jonghoonpark - opened

이슈 내용

hf inference endpoints 에 kanana-1.5-8b-base 모델을 배포하여
"한국의 21대 선거와 관련된 정보를 제공해줘." 라고 prompt 하였을 때
항상 다음과 같이 generated_text 가 empty 인 response가 반환됩니다.

image.png

테스트 환경

  • model: kanana-1.5-8b-base
  • hf inference endpoints
    • GCP us-east4 GPU · Nvidia L4 · 1x GPU · 24 GB

request body

url: https://{{deploy_endpoint_id}}.us-east4.gcp.endpoints.huggingface.cloud/generate

{
    "inputs": "한국의 21대 선거와 관련된 정보를 제공해줘.",
    "parameters": {
        "decoder_input_details": true,
        "details": true,
        "do_sample": false,
        "max_new_tokens": 1000
    }
}

response body

{
    "generated_text": "",
    "details": {
        "finish_reason": "eos_token",
        "generated_tokens": 1,
        "seed": null,
        "prefill": [],
        "tokens": [
            {
                "id": 128001,
                "text": "<|end_of_text|>",
                "logprob": -2.6992188,
                "special": true
            }
        ]
    }
}

추가 정보

  • kanana 외에 다른 모델들로도 테스트 해보았을 때, 다른 모델에서는 발생되지 않았습니다.
  • parameters 가 포함되었을 때에 발생되는 이슈인 것으로 보입니다. parameters 가 없을 경우에는 문제없이 생성됩니다.
  • API 문서: https://huggingface.co/docs/inference-providers/en/tasks/text-generation
  • 혹시나 싶어서 재배포도 진행 후 다시 테스트 해보았으나, 동일하게 결과가 나왔습니다.

추가적으로 테스트 해본 내용들

아래 내용으로 prompt 하였을 때는 문제가 없습니다.

  • 한국의 21대 선거
  • 선거와 관련된 정보를 제공해줘
  • 한국의 20대 선거와 관련된 정보를 제공해줘.
  • 한국의 23대 선거와 관련된 정보를 제공해줘.

아래 내용으로 prompt 하였을 때는 generated_text 가 empty 입니다.

  • 한국의 21대 선거와 관련된 정보를 제공해줘.
  • 한국의 22대 선거와 관련된 정보를 제공해줘.
Kakao Corp. org

@dev-jonghoonpark

base 모델은 instruction following 능력을 학습시키기 전이기 때문에 아래 instruct 모델을 사용하시는게 맞을 것 같습니다.

https://huggingface.co/kakaocorp/kanana-1.5-8b-instruct-2505

또한 instruct 모델이라도 knowledge cutoff 시점이 있어서 부정확한 답변이 나올수도 있습니다.
현재 시점의 어떤 정보가 필요한 경우는 web search 결과를 연동시켜서 RAG 방식으로 prompt에 정보를 injection하는 것을 추천드립니다.

dev-jonghoonpark changed discussion status to closed

말씀해주신대로 instruct 모델에서 테스트 하였을 때 문제 없이 동작되는것 확인하였습니다.
결과가 아예 빈 문자열로만 나왔다 보니 이슈라고 생각하여 등록하였었습니다.

이 이슈는 close 처리하겠습니다.
감사합니다.

Sign up or log in to comment