苹果研究团队突破AI编程瓶颈:让开源模型自学SwiftUI界面开发(苹果科研)

AIbase报道 - 苹果研究团队在最新发布的论文《UICoder:通过自动反馈微调大型语言模型生成用户界面代码》中,展示了一项令人瞩目的技术突破:成功训练开源模型自主学习SwiftUI用户界面开发。

尽管大型语言模型在创意写作和编程领域表现出色,但在生成"语法正确、设计良好的UI代码"方面仍存在明显短板。研究团队指出,即使在精心策划的数据集中,UI代码示例极为稀缺,在某些代码数据集中占比不足1%。

研究团队以开源编程模型StarChat-Beta为基础,采用独特的自动反馈循环方法:数据生成:向模型提供UI描述列表,指示其生成大量SwiftUI程序合成数据集质量筛选:通过Swift编译器验证代码可执行性,利用GPT-4V视觉模型对比界面与原始描述迭代优化:剔除编译失败、无关或重复的输出,保留高质量训练数据进行模型微调。

经过五轮迭代,团队获得了包含996,000个SwiftUI程序的庞大数据集,并成功训练出UICoder模型。

测试结果显示,UICoder在自动化指标和人工评估方面均显著超越基础StarChat-Beta模型,在整体质量上接近GPT-4水平,编译成功率甚至超越GPT-4。

研究中的一个重要发现源于数据分析:StarChat-Beta的原始训练数据几乎不包含SwiftUI内容。在创建TheStack数据集时,Swift代码库被意外排除,OpenAssistant-Guanaco数据集中仅有万分之一的Swift代码示例。

这一发现证明UICoder的性能提升并非来自重新整理已有数据,而是通过自动反馈循环构建的自生成精选数据集实现的真正学习突破。

研究团队表示,这种方法的成功验证了其在其他编程语言和UI工具包中的应用潜力,为AI辅助软件开发开辟了新的可能性。

论文地址:https://arxiv.org/html/2406.07739v1

特别声明:[苹果研究团队突破AI编程瓶颈:让开源模型自学SwiftUI界面开发(苹果科研)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

2012-2025年电视剧网播年冠统计,今年的年冠竟不是《藏海传》(2021 电视)

2012年《甄嬛传》,距这部剧播出已经过去13年(截至2025年),可是很多网友依旧在看这部剧,这部剧也成为观众心中的下饭剧;2013年《咱们结婚吧》,我们都知道,现代都市剧是很难爆的,这绝对是经典中的经典…

2012-2025年电视剧网播年冠统计,今年的年冠竟不是《<strong>藏海传</strong>》(2021 电视)

韩国男星反应迟钝,自曝曾坠楼昏迷3天,还被家人拉去做男科手术(韩国男『明星』️真实状态)

然而,最近他在节目中透露的童年往事,让大家第一次意识到,金钟旼那种看似天然呆的性格背后,并非仅仅是个性使然,而是源于一次真实的生死经历。 这些话在综艺节目中听起来既荒诞又好笑,但金钟旼的好友文世润却…

韩国男星反应迟钝,自曝曾坠楼昏迷3天,还被家人拉去做男科手术(韩国男『明星』️真实状态)

『机器人』️离我们有多近 人机共生已成现实(『机器人』️步入我们生活)

2025年,『机器人』️已经从实验室走向现实生活。在商场、街道和工厂中,我们用镜头记录了『机器人』️从概念到实际应用的全过程。在不断变化的工作与生活场景中,镜头时而贴近人类的操作,时而又落在另一双“眼睛”上

『机器人』️离我们有多近 人机共生已成现实(『机器人』️步入我们生活)

无视多方反对 以政府宣布人道援助禁令生效 国际社会呼吁撤销禁令(无视对手)

2026年1月1日,以色列政府宣布禁止数十家国际援助组织在加沙地带和约旦河西岸开展活动的禁令正式生效。以色列侨民事务部表示,未在2025年12月31日午夜前按照要求提交相关信息的国际援助组织已被吊销执照

无视多方反对 以政府宣布人道援助禁令生效 国际社会呼吁撤销禁令(无视对手)

当炮灰丧失生的意志后》魏燃魏析瑞出车祸时,姐姐毫不犹豫地先救养弟魏析瑞。   我被压在安全气囊下面,左腿剧痛,应(当炮灰死后)

为了提升我成功的概率,系统封闭了我原本的记忆,让我认为自己就是魏清妍的亲弟弟。魏析瑞忙把手表递给我:“对不起哥,我不知道这块手表对你这么重要,你别生姐姐的气,要怪就怪我吧......” 魏清妍看我的眼神失…

《<strong>当炮灰丧失生的意志后</strong>》魏燃魏析瑞出车祸时,姐姐毫不犹豫地先救养弟魏析瑞。   我被压在安全气囊下面,左腿剧痛,应(当炮灰死后)