OpenBuddy/openbuddy-llama3-8b-v21.1-8k

Apr 23, 2024

ms刚刚发布了phi-3模型，mit许可证但是只具备基本英文能力。（测试集上分数非常高）openbuddy有没有可能继续训练和微调？期待和llama3的水平对比。

ff670

OpenBuddy org Apr 23, 2024

我们之前试过phi，完全学不进语言，这个系列感觉怪怪的

Apr 24, 2024

我们之前试过phi，完全学不进语言，这个系列感觉怪怪的

测试了一下 Phi3，发现现在 Phi3 是会中文的，只不过语言能力比较弱，和 Phi2 只支持英文不一样（微软在 technical report 里也有提到 Phi3 的多语言能力较弱）。是否考虑尝试一下对 Phi3 的微调？

Apr 24, 2024

另外，能考虑给一下你们的 GGUF 文件吗？这样方便在笔记本上用 Ollama 运行。

ff670

OpenBuddy org Apr 24, 2024

如果是这样的话确实可以。
我们的ollama版本可以在这里找到：ollama run terrence/openbuddy:8b

Apr 24, 2024

我们之前试过phi，完全学不进语言，这个系列感觉怪怪的

认为可能是模型尺寸过小，语料库类型单一且没有任何其他语言数据导致的（微软似乎特地全部洗过了）

这个人在很多模型上使用的UNA方法是否有助于恢复多语言能力？（猜测）https://huggingface.co/fblgit

phi此次放出的模型似乎做了全英文的dpo，可能也会影响对其他语言的学习能力？（存疑）

wizardlm2或许也是llama3的有力竞争品，且许可证为apache2

OpenBuddy
/

openbuddy-llama3-8b-v21.1-8k