7月2日,据报道,SemiAnalysis创始人DylanPatel在访谈中爆料:Meta试图借鉴DeepSeek的MoE架构开发大模型,却因训练失误导致专家模块失效,模型性能远逊预期;Llama 4及后续…