如鱼饮水

冷暖自知

在RTX4060上部署Gemma4-26B-A4B模型(4bit QAT量化,MTP加速),输出速度达到30~40 tokens/s。

阅读全文 »

最近在处理文本的时候多次遇到不间断空格,开始没有注意,后来造成了不小的麻烦。这里记录一下它的处理方法。

阅读全文 »
0%