大型数据集可纠正AI在视觉任务中的偏见(数据集过大)

据最新一期《自然》发表的研究,科学家建立了超过一万张人类图像的数据库,以评估并纠正人工智能(AI)模型在视觉领域存在的偏见。这一“公平的以人类为中心的图像基准”(FHIBE)由索尼AI开发,采用符合伦理手段获取、基于用户同意的数据集,可精确评估以人为中心的计算机视觉任务,从而识别、纠正偏见和刻板印象。团队认为,这是迈向更可信AI的重要一步。

计算机视觉广泛应用于自动驾驶车辆、面部识别等技术领域。许多计算机视觉使用的AI模型,其训练数据存在缺陷,可能未经同意收集,经常来自网络大规模图像抓取。人们也发现,AI模型可能会反映出延续性别歧视、种族歧视或其他刻板印象的偏见。

此次,研究团队构建了一个图像数据集,在同意机制、多样性和隐私等多方面采取了最佳实践。FHIBE包含81个国家和地区中1981名个体的10318张图像。该数据库包括了人口统计和生理特征的全面标注,包括年龄、代词类别、祖先血统、发色与肤色等。参与者获得了关于项目和潜在风险的详细信息,帮助他们做出知情同意,过程符合全面数据保护法规。这些特征使该数据库成为评估AI偏见的可靠资源。

团队将FHIBE和27个现有以人类为中心的计算机视觉应用数据集做了比较,发现FHIBE数据集在多样性与AI评估的可靠同意方面标准更高。它还有效减少了偏见,包含的参与者自我申报标注信息超过其他数据集,还包括了相当比例通常代表性不足的人群。该数据集可用于评估现有的AI模型在计算机视觉任务中的表现,能揭示更多此前无法了解的偏见。

不过,团队也承认,目前创建数据集的过程充满挑战且成本十分高昂。

【总编辑圈点】

本报近期推出了多篇关于AI易出现偏差与其尚不可靠的相关报道。本文的这项研究,则是一次对AI伦理建设具有标杆意义的实践。它最核心的价值在于,将“公平”这一抽象原则,转化为一套可操作、可验证的技术标准与工作流程。AI的偏见已经是行业顽疾,但现在可能有了一把标准量尺,使得量化评估与比较不同模型的公平性成为可能,这将直接推动算法的研发与优化。尽管其高昂成本提示了推广的难度,但这一探索本身,正是推动AI从单纯追求性能强大,转向值得人类托付之伙伴的关键点。(记者张梦然)

特别声明:[大型数据集可纠正AI在视觉任务中的偏见(数据集过大)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

奚梦瑶胖了一圈!珠圆玉润太惊艳,北京活动美出新高度(奚梦瑶怀孕胖了多少斤)

尤其是『梁朝伟』,他依旧对镜头保持一份腼腆的态度,而刘嘉玲则走在前方,似乎总是那个冲在前头的人,戴着墨镜🕶️的她无疑流露出一种霸气十足的气场。刘嘉玲摘下墨镜🕶️的一瞬间,她白皙紧致的肌肤和自信的笑容让她看起来仍然年轻,仿…

奚梦瑶胖了一圈!珠圆玉润太惊艳,北京活动美出新高度(奚梦瑶怀孕胖了多少斤)

国旺盛源申请具有音视频本地存储管理功能的管理平台专利,能够提高视频的压缩存储管理效果(国旺源公司)

专利摘要显示,本发明涉及音视频管理技术领域,具体涉及一种具有音视频本地存储管理功能的管理平台,该具有音视频本地存储管理功能的管理平台包括视频映射模块,用于获取三维空间中的数据点;扫描遍历方向获取模块,用于根…

国旺盛源申请具有音视频本地存储管理功能的管理平台专利,能够提高视频的压缩存储管理效果(国旺源公司)

芭莎婚庆公司实锤!『赵今麦』宋威龙等CP封面封神,氛围感拉满(芭莎婚纱怎么样)

与『周也』合作的《很想很想你》是甜宠声恋剧,芭莎为他们打造的大片满是温柔与治愈,『檀健次』的儒雅温柔与『周也』的灵动甜美相得益彰,两人同框时的低眉浅笑、并肩相依,把剧中莫青成和声声慢的理想爱情展现得淋漓尽致,网友纷纷称:…

芭莎婚庆公司实锤!『赵今麦』宋威龙等CP封面封神,氛围感拉满(芭莎婚纱怎么样)

郭麒麟即兴一句惊艳全场,陈道明忘词露破绽,范思辙算盘掌控国运(郭麒麟表演)

第三季里,范思辙从北齐归来,这可不是简单的“海归”,他在北齐那几年,硬是把现代营销那一套玩得风生水起。可范思辙聪明就聪明在,他把自己变成了庆国这台战争机器里不可或缺的润滑油。 郭麒麟在绿幕前那段表演,其实…

郭麒麟即兴一句惊艳全场,陈道明忘词露破绽,范思辙算盘掌控国运(郭麒麟表演)

芭蕾舞剧《灰姑娘》:诙谐轻盈中透出坚韧力量(芭蕾舞剧灰姑娘的创作背景)

相较于原故事,舞剧淡化了灰姑娘遭受的苦难,继母与姐姐更多表现为一种略带愚蠢的张扬,身上的“坏人感”被弱化,与灰姑娘的善良形成对照,反讽效果拉满。这一笔触极大地丰富了她的形象,她并非只是等待王子救赎的女性♀️,而是…

芭蕾舞剧《<strong>灰姑娘</strong>》:诙谐轻盈中透出坚韧力量(芭蕾舞剧灰姑娘的创作背景)