标签:"Evals"相关文章

吴恩达提出反直觉观点:关于Agent如何进步(吴恩达知乎)

生成式AI的挑战:虽然监督学习中评估和错误分析的许多经验仍然适用,但生成式AI带来了一个新的挑战:输出空间要丰富得多,导致算法出错的方式也更多。 他发现,在 agentic workflow 中,调整评…

吴恩达提出反直觉观点:关于Agent如何进步(吴恩达知乎)