纯蒸馏模型 SOTA 呈现!直接 SFT 本钱直降 50 倍,数据已悉数开源
2025-07-04 11:04 时尚
a-m-team 又发新论文了。这个团队上星期刚刚在 Hugging Face 低沉开源了32B稠密模型 ,但在多项要害推理评测中打败了 DeepSeek-R1,并与超大规模的 MoE 模型Qwen3- [全文阅读]
2025-07-04 11:04 时尚
a-m-team 又发新论文了。这个团队上星期刚刚在 Hugging Face 低沉开源了32B稠密模型 ,但在多项要害推理评测中打败了 DeepSeek-R1,并与超大规模的 MoE 模型Qwen3- [全文阅读]