0°

OpenAI有偏见吗?为什么用不同语言生成一个女人图片,结果不同。

  我们探索了OpenAI如何用不同语言生成一个女人。

  OpenAI项目的两项热门新技术ChatGPT和DALL-E2都引起了媒体和社交媒体用户的广泛关注。在数字版权、技术和新闻领域,关于这些技术可以实现什么、哪些工作可能被取代、如何处理版权问题以及这些技术如何放大现有偏见的讨论正在进行。

  全球之声尝试了AI图片生成器dal – e2,看看它是如何从不同语言生成图片的。我们用九种语言输入了同样的短语:“窗户边一个悲伤女人的影子的油画。”

  以下是我们收到的结果:

  英语 Oil painting of a shadow of a grieving woman at the window

  西班牙语 Pintura al óleo de la sombra de una mujer en duelo ante la ventana

  捷克 Olejomalba stínu truchlící ženy u okna

  俄罗斯 Картина маслом силуэт скорбящей женщины у окна

  印尼 Lukisan cat minyak bayangan seorang janda perempuan yang sedang berduka di samping jendela

  简体中文 窗边悲痛女人的影子油画

  哈萨克斯坦 Терезедегі қайғылы әйелдің көлеңкесінің майлы бояу суретi

  乌兹别克 Deraza oldida qayg’u chekayotgan ayol soyasining moyli rasmi

  马拉雅拉姆语

  显然,这些照片中的一些与原来的提示有很大不同。这可能是因为原始语言的数据不足。DALL-E的发明者在接受Tech Crunch采访时解释说,它使用的模型被称为CLIP(对比语言-图像预训练)。CLIP使用从互联网上抓取的4亿对带有文字说明的图像进行训练。正如OpenAI在其网站上所说:

  GPT-3表明,语言可以用来指导大型神经网络执行各种文本生成任务。图像GPT表明,同一类型的神经网络也可以用于生成高保真的图像。我们扩展了这些发现,表明通过语言操纵视觉概念现在是触手可及的。

  “我们生活在一个视觉世界里,”OpenAI的首席科学家伊利亚·苏茨克弗在接受《麻省理工科技评论》采访时表示:

  从长远来看,您将拥有既能理解文本又能理解图像的模型。人工智能将能够更好地理解语言,因为它可以看到单词和句子的意思。

  由于不同的语言产生了如此不同的输出,该模型工作的网络搜索的重点似乎是使用更广泛使用的语言,如英语或西班牙语,而不是不太明显的语言。

  因此,许多来自互联网的带有乌兹别克语或马拉雅拉姆语描述的图片并没有出现在人工智能训练的原始数据中。如果模型打算使用更多的语言,它需要更多地专注于训练带有英语以外描述的图像。否则,来自哈萨克斯坦的用户将继续收到美食而不是女性的照片,而说马拉雅拉姆语的用户将收到自然的照片。在某种程度上,俄罗斯的形象明显被性化了。印度尼西亚的这幅画描绘了几个女孩坐着,捷克的这幅画以一罐油抢了风头,获得了独创性奖。这些简体中文的图片简直太吓人了。

  当然,基于这一点,我们不能说OpenAI是种族主义者。我们在这里可以看到,它没有收到足够的非英语语言数据。现在,它是否会保持这种状态,我们不知道,但我们强烈建议它不会。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论