基于代码的智能体可以编写和调试代码,但终端工具通常是将软件从编写的代码转换为实际可用产品所必需的。像Cursor这样的集成产品已经构建了更复杂的问题解决方法,但GitHubSWE-Bench模型仍然是这些工…