toutiao / README.md
myml's picture
Update README.md
fe49cfc
metadata
license: mit
widget:
  - text: 从北京到莫斯科
    example_title: 从北京到莫斯科
  - text: 色卡里的春天
    example_title: 色卡里的春天
  - text: 中俄联合声明 释放了几个信号
    example_title: 中俄联合声明 释放了几个信号
  - text: 鸡鸣寺游客爆满设反悔门引导离寺
    example_title: 鸡鸣寺游客爆满设反悔门引导离寺
datasets:
  - fourteenBDr/toutiao
language:
  - zh
pipeline_tag: text-classification

中文新闻分类模型

介绍

基于 pytorch 使用今日头条数据集训练的中文新闻分类模型,用于学习中文文本分类使用,python 源码见 main.py

使用

from transformers import pipeline
classifier = pipeline("text-classification",  model="myml/toutiao")
classifier("只要关羽不捣乱,峡谷4V5也不怕?")
# echo [{'label': 'LABEL_16', 'score': 0.9958072900772095}]

结果映射

LABEL_0 民生 故事 
LABEL_1 文化 文化 
LABEL_2 娱乐 娱乐 
LABEL_3 体育 体育 
LABEL_4 财经 财经 
LABEL_6 房产 房产 
LABEL_7 汽车 汽车 
LABEL_8 教育 教育 
LABEL_9 科技 科技 
LABEL_10 军事 军事 
LABEL_12 旅游 旅游 
LABEL_13 国际 国际 
LABEL_14 证券 股票 
LABEL_15 农业 三农 
LABEL_16 电竞 游戏