metadata
datasets:
- OdiaGenAI/odia_domain_context_train_v1
- OdiaGenAI/odia_context_qa_98k
- OdiaGenAI/OdiEnCorp_translation_instructions_25k
language:
- or
- hi
- en
metrics:
- bleu
- rouge
tags:
- india language
widget:
- text: >-
translate into odia: And thy seed shall be as the dust of the earth, and
thou shalt spread abroad to the west, and to the east, and to the north,
and to the south: and in thee and in thy seed shall all the families of
the earth be blessed.</s>
example_title: English to odia translation
- text: >-
translate into odia: पाकिस्तानी जासूस को मिली अहम खुफिया जानकारी, जम्मू
कश्मीर के पुलिस अधिकारी से हुई लापरवाही</s>
example_title: Hindi to odia translation
- text: 'answer: ଓଡ଼ିଶାରେ ଅଟ୍ଟାଳିକା ପାଇଁ ସର୍ବାଧିକ ଆସନ ସୀମା କ’ଣ?</s>'
example_title: Question answer
- text: >-
summarize: ନନ୍ଦିଗ୍ରାମରେ ଶୁଭେନ୍ଦୁ ଅଧିକାରୀଙ୍କ ସହ ହେବାକୁ ଯାଉଥିବା ନିର୍ବାଚନୀ
ଯୁଦ୍ଧ ଅବସରରେ ଭାଜପାର ବିରୋଧୀ ଦଳର ନେତାଙ୍କୁ ଚିଠି ଲେଖିଛନ୍ତି ପଶ୍ଚିମବଙ୍ଗ
ମୁଖ୍ୟମନ୍ତ୍ରୀ ମମତା ବାର୍ନାଜୀ। ଏହି ଚିଠି କଂଗ୍ରେସର ସୋନିଆ ଗାନ୍ଧୀଙ୍କ ସମେତ ପ୍ରମୁଖ
୧୦ ବିରୋଧୀ ଦଳର ନେତାଙ୍କୁ ବୁଧବାର ପଠା ଯାଇଛି। ଚଳିତ ବିଧାନସଭା ନିର୍ବାଚନ ପରେ
ଭାଜପାକୁ ହଟାଇବା ପାଇଁ ଏକତ୍ରିତ ହୋଇ କେଉଁ ରଣନୀତି ଆପଣେଇବାକୁ ପଡ଼ିବ ସେ ସମ୍ପର୍କରେ
ଉଲ୍ଲେଖ କରିଛନ୍ତି ତୃଣମୂଳ କଂଗ୍ରେସ (ଟିଏମ୍ସି) ସୁପ୍ରିମୋ। ଗଣତନ୍ତ୍ର ଉପରେ ଭାଜପାର
ଆକ୍ରମଣ ବିରୋଧରେ ଏକତ୍ରିତ ହେବାର ସମୟ ଆସିଯାଇଛି। ଦେଶର ନାଗରିକଙ୍କ ପାଇଁ ଏକ
ବିଶ୍ୱସନୀୟ ବିକଳ୍ପ ଉପସ୍ଥାପନ କରିବାକୁ ଚିଠିରେ ମମତା ଉଲ୍ଲେଖ କରିଛନ୍ତି। ଦିଲ୍ଲୀ
ଗଭର୍ନରଙ୍କୁ ନିର୍ବାଚିତ ସରକାରଙ୍କଠାରୁ ଅଧିକ ଶକ୍ତି ପ୍ରଦାନ କରୁଥିବା ନୂଆ ବିବାଦୀୟ
ଆଇନ ଭଳି ୭ଟି ବିବାଦୀୟ ଘଟଣା ତଥା ଆଇନ ସମ୍ପର୍କରେ ଚିଠିରେ ଉଲ୍ଲେଖ କରିଛନ୍ତି ମମତା।
ସୋନିଆଙ୍କ ବ୍ୟତୀତ ନ୍ୟାଶନାଲିଷ୍ଟ କଂଗ୍ରେସ ପାର୍ଟି ମୁଖ୍ୟ ଶରଦ ପାଓ୍ବାର, ଡିଏମ୍କେର
ଷ୍ଟାଲିନ, ଶିବ ସେନାର ଉଦ୍ଧବ ଠାକରେ, ଓ୍ବାଇଆରଏସ୍ର ଜଗନ ମୋହନ ରେଡ୍ଡୀ, ବିଜେଡି
ସୁପ୍ରିମୋ ନବୀନ ପଟ୍ଟନାୟକ, ଟିଆରଏସ୍ର କେ. ଚନ୍ଦ୍ରଶେଖର ରାଓ, ସମାଜବାଦୀ ପାର୍ଟିର
ଅଖିଳେଶ ଯାଦବ, ରାଷ୍ଟ୍ରୀୟ ଜନତା ଦଳର ତେଜସ୍ବୀ ଯାଦବ, ଆମ ଆଦମି ପାର୍ଟିର ଅରବିନ୍ଦ
କେଜରିଓ୍ବାଲ ଓ ସିପିଆଇଏମ୍ଏଲର ଦୀପାଙ୍କର ଭଟ୍ଟଚାର୍ଯ୍ୟଙ୍କୁ ଏହି ଚିଠି ପଠାଯାଇଛି</s>
example_title: summarize
- text: >-
context: ଯେଉଁମାନେ ଏଭଳି ଉପଲବ୍ଧତାର ପୂର୍ବାନୁମାନ କରିପାରିବେ ନାହିଁ ସେମାନଙ୍କ
ତୁଳନାରେ ସେମାନେ ପରିବେଶଗତ ସମ୍ବଳକୁ (ଯେପରିକି ଆଲୋକ ଏବଂ ଖାଦ୍ୟ) ସର୍ବୋତ୍ତମ ଭାବେ
ଉପଯୋଗ କରିପାରିବେ। question: କେଉଁ ଜୀବ ସର୍କାଡିଆନ ରିଦମ ବ୍ୟବହାର କରି ଏହାର ଲାଭ
ଉଠାଇପାରିବ ଯାହା ଅନ୍ୟମାନେ କରିପାରିବେ ନାହିଁ? </s>
example_title: Context-Based qa
license: cc-by-sa-4.0
Model Card for odia-t5-base
Model Details
Model Description
odia-t5-base is a multilingual Text-To-Text Transfer Transformer fine-tuned to perform downstream tasks in the Odia language.
- Developed by: Mohammed Ashraf
- Model type: Language model
- Language(s) (NLP): Odia, English, Hindi
- License: CC BY-NC-SA 4.0
- Related Models: All MT5 Checkpoints
Uses
Direct Use and Downstream Use
- Translate English to Odia.
- Translate Hind to Odia.
- Odia Sentence Summarization.
- Question Answering in Odia.
- Context-Based Question answering in Odia.
How to use
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
tokenizer = AutoTokenizer.from_pretrained("mrSoul7766/odia-t5-base")
model = AutoModelForSeq2SeqLM.from_pretrained("mrSoul7766/odia-t5-base")
# Set maximum generation length
max_length = 512
# Generate response with question as input
input_ids = tokenizer.encode("answer: ଓଡ଼ିଶାରେ ଅଟ୍ଟାଳିକା ପାଇଁ ସର୍ବାଧିକ ଆସନ ସୀମା କ’ଣ?</s>", return_tensors="pt")
output_ids = model.generate(input_ids, max_length=max_length)
# Decode response
response = tokenizer.decode(output_ids[0], skip_special_tokens=True)
print(response)
Licensing Information
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Citation Information
Dataset
@misc{OdiaGenAI,
author = {Shantipriya Parida and Sambit Sekhar and Subhadarshi Panda and Soumendra Kumar Sahoo and Swateek Jena and Abhijeet Parida and Arghyadeep Sen and Satya Ranjan Dash and Deepak Kumar Pradhan},
title = {OdiaGenAI: Generative AI and LLM Initiative for the Odia Language},
year = {2023},
publisher = {Hugging Face},
journal = {Hugging Face repository},
howpublished = {\url{https://huggingface.co/OdiaGenAI}},
}
Model
@misc{mrSoul7766,
author = {Mohammed Ashraf},
title = {odia-t5-base},
year = {2024},
note = {Licensed under Attribution-NonCommercial-ShareAlike 4.0 International},
}