rope_scaling for GLM-4.5

#23
by Zenonnn - opened

哈喽,想请问下我是否可以通过修改config.json中的rope_scaling来实现外推呢?想测试GLM-4.5在一些benchmark上的表现,预期最长的token会到200k左右,所以如果能这样直接修改后外推的话评测结果会置信一些。

可以修改,但是我们训练的长度只有128K。

Sign up or log in to comment