有没有证据说明DEEKSEEK除了蒸馏技术外,DEEKSEEK的开源模型的LLM算法还是以TRANSFORMER 为主体的预训练模