国际最新研究构建超万张人类图像数据库 评估人工智能视觉偏见

11

北京11月6日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇人工智能(AI)研究论文,提出并构建了一个超过1万张人类图像的数据库,旨在评估AI模型在以人为本的计算机视觉领域中的偏见。

这一“公平的以人类为中心的图像基准”(FHIBE)由索尼AI团队开发,其采用符合伦理手段获取、基于用户同意的数据集,可用于评估以人为中心的计算机视觉任务,从而识别、纠正偏见和刻板印象。

国际最新研究构建超万张人类图像数据库 评估人工智能视觉偏见

该论文介绍,计算机视觉广泛应用于自动驾驶车辆到面部识别技术等领域。许多计算机视觉使用的AI模型,其训练数据存在缺陷,可能未经同意收集,经常来自网络大规模图像抓取。人们也已发现,AI模型可能会反映出延续性别歧视、种族歧视或其他刻板印象的偏见。

在本项研究中,索尼AI团队构建了一个图像数据集,在同意机制、多样性和隐私等多方面努力采取最佳实践:FHIBE包含81个国家或地区中1981个个体的10318张图像,该数据库涵盖人口统计和生理特征的全面标注,包括年龄、代词类别、祖先血统、发色与肤色等;参与者获得关于项目和潜在风险的详细信息,帮助他们做出知情同意,过程符合全面数据保护法规。这些特征使该数据库成为评估AI偏见的可靠资源。

研究团队将FHIBE和27个现有以人类为中心的计算机视觉应用数据集进行比较,发现FHIBE数据集在多样性与AI评估的可靠同意方面标准更高,同时还有效减少了偏见,它包含的参与者自我申报标注信息超过其他数据集,还包括了相当比例通常代表性不足的人群。

论文作者总结表示,FHIBE数据集可用于评估现有的AI模型在计算机视觉任务中的表现,能揭示更多此前无法了解的偏见。他们也提醒指出,创建数据集的过程充满挑战且成本高昂,但FHIBE可能代表了迈向更可信AI的一步。(完)

柬埔寨西哈努克省省长:高度重视并期待中方驻西港领事机构早日建成

报告:中国剧本娱乐行业充满活力与韧性

京台学者共研“新一轮改革开放与两岸关系发展”

宁夏打造百万只滩羊生态智慧园区 惠及1.2万多户养殖户

国家医保局:开展医保经办全流程智能审核试点工作

耶鲁华裔研究生遭枪杀 警方悬赏追缉疑似涉案人员

明朝万达喻波受邀参加2020年中国网络安全高峰论坛

热卖的“姜黄饮”并非人人适用

评论:台湾深陷“疫苗荒”,根源在哪?

四川泸州纳溪区发生一起食物中毒事件 造成4人死亡

外交部驻港公署:个别政客欺世盗名的政治作秀可耻

新疆维吾尔自治区政协阿克苏地区工委党组书记、副主任梁峰源接受审查调查

美国重症监护室护士上班途中遭枪杀 枪击动机尚未确定

途易拟全球裁员8000人应对疫情

北京冬奥会将至,今年的颁奖花束永不凋谢

文章版权声明:除非注明,否则均为佛山市莱菲特智能电器有限公司原创文章,转载或复制请以超链接形式并注明出处。