标签:"Zhu"相关文章

科研君 | 我校最新SCI论文收录(第193周)(科研ta)

FGF10 Protects the Corneal Epithelium From Dry Eye-Induced Oxidativeand ER Stress Via Upregulation of …

科研君 | 我校最新SCI论文收录(第193周)(科研ta)

MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能

极低内存消耗首次实现了在 12GB 内存的消费级 GPU 上成功预训练 LLaMA 7B模型,为大模型训练在低资源环境下提供了新的可能性。APOLLO 不仅在理论上打破了优化器内存瓶颈,更在实践中展现出预…

MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能