hf inference endpoints: parameters를 포함하여 특정 내용으로 prompt 를 할 경우 generated_text 가 ""(empty)로 반환되는 이슈
#1
by
dev-jonghoonpark
- opened
이슈 내용
hf inference endpoints 에 kanana-1.5-8b-base
모델을 배포하여
"한국의 21대 선거와 관련된 정보를 제공해줘." 라고 prompt 하였을 때
항상 다음과 같이 generated_text 가 empty 인 response가 반환됩니다.
테스트 환경
- model: kanana-1.5-8b-base
- hf inference endpoints
- GCP us-east4 GPU · Nvidia L4 · 1x GPU · 24 GB
request body
url: https://{{deploy_endpoint_id}}.us-east4.gcp.endpoints.huggingface.cloud/generate
{
"inputs": "한국의 21대 선거와 관련된 정보를 제공해줘.",
"parameters": {
"decoder_input_details": true,
"details": true,
"do_sample": false,
"max_new_tokens": 1000
}
}
response body
{
"generated_text": "",
"details": {
"finish_reason": "eos_token",
"generated_tokens": 1,
"seed": null,
"prefill": [],
"tokens": [
{
"id": 128001,
"text": "<|end_of_text|>",
"logprob": -2.6992188,
"special": true
}
]
}
}
추가 정보
kanana
외에 다른 모델들로도 테스트 해보았을 때, 다른 모델에서는 발생되지 않았습니다.parameters
가 포함되었을 때에 발생되는 이슈인 것으로 보입니다.parameters
가 없을 경우에는 문제없이 생성됩니다.- API 문서: https://huggingface.co/docs/inference-providers/en/tasks/text-generation
- 혹시나 싶어서 재배포도 진행 후 다시 테스트 해보았으나, 동일하게 결과가 나왔습니다.
추가적으로 테스트 해본 내용들
아래 내용으로 prompt 하였을 때는 문제가 없습니다.
- 한국의 21대 선거
- 선거와 관련된 정보를 제공해줘
- 한국의 20대 선거와 관련된 정보를 제공해줘.
- 한국의 23대 선거와 관련된 정보를 제공해줘.
아래 내용으로 prompt 하였을 때는 generated_text 가 empty 입니다.
- 한국의 21대 선거와 관련된 정보를 제공해줘.
- 한국의 22대 선거와 관련된 정보를 제공해줘.
base 모델은 instruction following 능력을 학습시키기 전이기 때문에 아래 instruct 모델을 사용하시는게 맞을 것 같습니다.
https://huggingface.co/kakaocorp/kanana-1.5-8b-instruct-2505
또한 instruct 모델이라도 knowledge cutoff 시점이 있어서 부정확한 답변이 나올수도 있습니다.
현재 시점의 어떤 정보가 필요한 경우는 web search 결과를 연동시켜서 RAG 방식으로 prompt에 정보를 injection하는 것을 추천드립니다.
dev-jonghoonpark
changed discussion status to
closed
말씀해주신대로 instruct 모델에서 테스트 하였을 때 문제 없이 동작되는것 확인하였습니다.
결과가 아예 빈 문자열로만 나왔다 보니 이슈라고 생각하여 등록하였었습니다.
이 이슈는 close 처리하겠습니다.
감사합니다.