SakuraLLM

community
Activity Feed

AI & ML interests

None defined yet.

Recent Activity

sakuraumi  updated a model about 1 month ago
SakuraLLM/Sakura-7B-Qwen2.5-v1.0-GGUF
sakuraumi  updated a Space about 1 month ago
SakuraLLM/README
View all activity

SakuraLLM

🦉 GitHub | 🤖 ModelScope

目前Sakura发布的所有模型均采用CC BY-NC-SA 4.0协议,Sakura所有模型与其衍生模型均禁止任何形式的商用!Sakura系列所有模型皆仅供学习交流使用,开发者对使用Sakura模型造成的问题不负任何责任。

介绍

  • 基于一系列开源大模型构建,在通用日文语料与轻小说/Galgame等领域的中日语料上进行继续预训练与微调,旨在提供开源可控可离线自部署的、ACGN风格的日中翻译模型。

  • 新建了TG交流群,欢迎交流讨论。

对于其他适配本模型的项目如使用非本项目提供的prompt格式进行翻译,不保证会获得与README中的说明一致的质量!

如果使用模型翻译并发布,请在最显眼的位置标注机翻!!!!!开发者对于滥用本模型造成的一切后果不负任何责任。

由于模型一直在更新,请同时注明使用的模型版本等信息,方便进行质量评估和更新翻译。

对于模型翻译的人称代词问题(错用,乱加,主宾混淆,男女不分等)和上下文理解问题,如果有好的想法或建议,欢迎提issue!

TODO:见https://github.com/SakuraLLM/Sakura-13B-Galgame/issues/42

快速开始

教程:

详见本仓库Wiki.

部分使用方法:usage.md

请注意,如果给轻小说机翻站使用,请参见机翻站站内教程,本 repo 不适用。

模型下载:

参数量 发布时间-底模-版本 模型
32B 20240508-Qwen1.5-32B-v0.9 🤗 Sakura-32B-Qwen2beta-v0.9-GGUF
20240508-Qwen1.5-32B-v0.10pre1 🤗 Sakura-32B-Qwen2beta-v0.10pre1-GGUF
14B 20240111-Qwen-14B-v0.9 🤗 Sakura-13B-LNovel-v0.9b-GGUF
20240213-Qwen1.5-14B-v0.9 🤗 Sakura-14B-Qwen2beta-v0.9-GGUF
20240516-Qwen1.5-14B-v0.9.2 🤗 Sakura-14B-Qwen2beta-v0.9.2-GGUF
(最新) 20241008-Qwen2.5-14B-v1.0 🤗 Sakura-14B-Qwen2.5-v1.0-GGUF
7B 20240116-Qwen-7B-v0.9 🤗 Sakura-7B-LNovel-v0.9-GGUF
20240531-Qwen1.5-7B-Galtransl-v2.6 🤗 Galtransl-v2.6
~2B 20240214-Qwen1.5-1.8B-v0.9.1 🤗 Sakura-1B8-Qwen2beta-v0.9.1-GGUF
(最新) 20241012-Qwen2.5-1.5B-v1.0 🤗 Sakura-1.5B-Qwen2.5-v1.0-GGUF

p.s. 如果无法连接到HuggingFace服务器,可将链接中的huggingface.co改成hf-mirror.com,使用hf镜像站下载。

News

  1. 更新了基于Qwen2.5-14B的v1.0正式版模型Sakura-14B-Qwen2.5-v1.0和基于Qwen2.5-1.5B的v1.0正式版模型Qwen2.5-1.5B-v1.0,prompt格式参见下方说明。主要改进:
    • 改善翻译质量,提高翻译准确率,尤其是人称的准确率。
    • 支持术语表(GPT字典),以保持专有名词和人称的一致性。
    • 提高部分简单控制符的保留能力,尤其是单行内存在\n的情况下保留\n的能力。降低行数与原文不一致的概率。
    • 由于底模使用GQA,推理速度和显存占用显著改善,可实现更快的多线程推理。关于多线程推理,可参考Sakura启动器GUI使用教程SakuraLLMServer

更多信息

详情请查看此页面

datasets

None public yet