文摘
进化艺术研究的目的之一是建立一个计算机系统能够创建有趣的,美丽的,或创造性的结果,包括图片,视频,动画,文字,和表演。在这种背景下,了解健身的关键是构思和实施探索“有趣”,美,或创造力系统的能力。在本文中,我们调查最近的适应性进化研究艺术与美学。我们也讨论研究心理学的美学,包括关系复杂性和美学,措施的复杂性,预测复杂性。我们试图建立人类感知与理解之间的联系与当前进化美学技巧。
1。介绍
古代人类的梦想是创建的模型本身。Ada Lovelace,通常认为是第一个计算机程序员,提出了艺术的任务使用电脑。这样的任务构成“大挑战”,因为他们目前的一系列主观的,社会和情感特征,通常被认为是人类独有的文化。
应对这一挑战的一个主要困难是人类审美偏好的发展中正式的模型。这样的模型将允许计算机系统来预测一个人的审美情趣或适应一个人的审美倾向组:简单来说,能够使审美评价和选择。
“审美”一词源于希腊aisthesis,表示感觉或知觉,其本义指感官印象。在18世纪,它获得了新的意义当-鲍姆加滕”冥想Philosophicae de Nonnullis广告Poema Pertinentibus”发表在德国。这个确定感官经验和知识之间的关系,并研究美的知识这个名字美学。从这一刻,这个词并不局限于美学艺术,但许多在日常生活中遇到的事情和经验。因此,审美决定人类选择和行动的影响很多方面,除了那些传统上与艺术有关,例如。
计算美学(CA)可以定义为“研究的计算方法可以适用的审美决定人类可以以类似的方式。“(1]。有几个论文调查方法计算美学,例如,(2- - - - - -4]。“计算美学”一词有时被用于描述一个特定类的文物由计算机,例如,电脑设计和生殖系统。然而,在这篇文章中,我们将参考计算美学只是人类美学的计算模型。
CA和美学(PA)的心理学研究人类审美使用各种不同的方法。在本文中,我们尝试建立这些不同的方法之间的联系。
在第一节中,我们分析几个审美模式包括在最近的进化计算系统。第二部分探讨了从审美心理学研究成果,将人工智能研究人员感兴趣的。最后,我们提出一些人类心理学和人工智能之间的联系和概述两组这种合作的好处。
2。在进化的艺术审美健身
从古典时期,如果不是之前,哲学家们从事的研究美学:试图理解艺术的本质和它的升值,以及为什么人们从事一组特定的审美行为在艺术品,使特定的语句,可以调用审美判断。在近代,这些哲学研究已经加入了实验和观测方法从心理学、神经科学、认知科学、以及研究采取建设性态度产生的美学价值,通过构建机器或机器本身可以展示审美行为,使审美判断。
一批重大链存在于美学理论(5,6]。早期古典工作集中在试图理解beauty-not只是指出具体的例子的本质的美但识别这些方面产生审美的对象。最早的理论关注技能的升值模仿现实世界,但后来的理论家发现这个缺乏。特别是,一旦机械手段以创造摄影和录音等有高质量的仿制品,新的理论来解释简单的复制品之间的差异和审美价值成为需要的对象。
一个主要的美学理论是基于这个想法,审美是一个经过深思熟虑的的行为表现art-maker。在这些理论中,art-maker关注传播经验和情感,他们经历了观众为他们的工作,不能轻易使用,纯粹的描述性文字或图表等更直接的手段。这产生了一个紧迫的问题对于计算机艺术系统,没有理由表达情感感受性形式。尽管如此,即使是千篇一律的艺术,我们有时可以恢复一些价值expression-focused理论。一种计算机艺术可以说是表达就是利用电脑这一事实现在几乎普遍网络化系统,和时代精神的表达式是一个表达式在特定区域发现在线。例如,一个版本的绘画傻瓜系统(7使用报纸文章作为材料,它在视觉艺术形式“表达”;源的重要性和突出材料来自这一事实足以形成一个报纸标题是很重要的。的另一种方式我们可以看到表达式解释计算机艺术系统的影响在这些系统作为一个塑造者和用户的交互的强化物:不是作为一个表达装置计算机(缺席)的感受,但允许用户探索和加强他们的表情,没有机器是不可能的。
另一个主要的美学理论关注的思想形式。这些理论认为,是什么让一个审美参与对象不同于世俗的一个正式的方面如在图像物体的位置,使用对称,平衡秩序和复杂性。内容少relevant-aesthetic对象还有内容,当然,类似的内容安排不考虑形式没有什么审美兴趣。这种理论是吸引解释计算机艺术系统如何创建审美参与对象,因为可以编码算法方面的形式,措施的形式可以作为健身司机在学习与进化系统,和形式的不同方面可以使用多准则优化了。
另一个链主张社会互动的重要性和审美价值的社会建构,是否在一个特定的社会话语艺术(例如,Danto的8的想法,Artworld)或被影响,影响更广泛的社会和政治问题。这是偶尔探索计算机艺术系统(9,10),系统,创造艺术的造型更广泛的网络和系统,批判并放到艺术;然而,有很多的机会在这方面更多的工作。
最近,焦点已经从更广阔的世界的内心世界,大脑和神经系统,研究大脑在审美经验(11]。再一次,有机会为这个健身驱动程序的上下文中使用进化艺术造型艺术的潜在受众反应系统,就像用户建模[12)模型更平淡无奇的系统的用户响应。
与理论相反,认为美学是一种社会现象,其他哲学家的美学立场此时至少有非常高的级别就某些共同的特征,审美对象和审美的行为,随着时间的推移保持不变。达顿(13),例如,列出了七个“审美共性”,他声称大多数社会实践形成的特点,被视为艺术。这些都是,(我)艺术品的生产需要的技能和专业知识(2)对象给自己完全快乐,无论他们是否满足实际需要(3)艺术风格对社会生产的发展和主要形式和组成(iv)艺术存在于一个关键和分析话语的上下文(v)艺术品模仿或象征方面的更广阔的世界(vi)艺术品的主题是一种特殊的关注,唤起对他们特定的行为(七)观众参与艺术想象力的使用他们的能力,而艺术家利用想象力在创建和发展艺术观念和对象。
不一定有一个共性的理念之间的冲突和社会美学建设的思想。它可以辩称,尽管大类的概念,认为艺术和审美行为是广泛普遍的,细节随时间在社会建构的方式。的确,审美和审美判断的主要模型由皮革和他的同事使用一种信息处理组件集成到一个审美情节之间的关系(14,15]。模型包括低级的“万能”的审美属性,如对称性、复杂性,对比,和分组,而且社会、认知和情感组件所有的贡献形成审美判断。
2.1。进化艺术系统
进化艺术系统是计算机系统,采用进化计算(EC)方法来生成艺术品(16]。进化艺术系统已经设计制造图纸,设计,建筑,诗歌,声音,音乐,3 d形式,图片,甚至编排。通常情况下,这些系统的方式从其他应用EC的适应度函数;EC的其他方面(选择方法、交叉和变异算子等)在很大程度上是更传统的优化应用程序一样。这样的健身功能可以在两个主要方面产生审美价值。第一个是显式地,适应度函数驱动的进化搜索对项目更大的审美价值。第二个是从内部,健身创建一个过程本身的审美价值。后者的一个例子是在人工生命的身体艺术和艺术作品基于模拟生态(17]。这些可能反映了回转向模仿的美学新途,即模拟过程发生在时间或空间范围内不可访问肉眼观看,他们模仿/代表自然过程扩展或抽象的方式使他们可以直接感性的理解。这允许unspecialised观众反思这些流程,否则只有科学家理解。
进化系统,旨在产生审美参与材料明确应该有一个适应度函数驱动的进化领域的搜索空间的审美价值。所以,适应度函数应该建立在一些美学理论;可能建立的一个理论,或者一种新的理论,独特的计算机艺术或进化的艺术。约翰逊(18)评论的一些可能的想法可以建立这样的健身功能。
最直接的方法就是通过某种形式的审美测量。即适应度函数直接制定的一些计算方法得分或排名具体工作的美学价值。这很好地符合美学理论基于整体最典型的措施使用正式的对称性和复杂性等方面措施。在我们讨论下面的心理学美学,我们将看到这是占主导地位的理论;大部分的实验工作在这一领域探索形式方面的视觉图像之间的相关性和观众的审美或情感反应。
最有影响力的一个审美尺度EC-art论文最近使用的窝Heijer和Eiben [19),比较四种不同的审美措施作为一个电子商务系统健身功能。摘要显示不同的功能在使用它们的结果作为欧共体健身措施,并通过计算每个函数的cross-evaluation他人。然而,这种方法的问题,同时提出的功能是有用的工具来探索电子商务的能力,它们的连接人类审美判断没有明确解释之前他们被雇佣为健身功能。在某些情况下,函数(称为“措施”在报纸上)被作为学习系统指标,所以他们可以用于审美的目的,但不是必需的。事实上,其中一个指标分析了一分之一Machado和卡多佐(提出的20.)是专为单色图像但色彩的应用在这个研究。
创建这个适应度函数的另一种方法是通过一个语料库的例子,通常的形式鼓舞人心的设置(21计算机系统应该使用的例子激励新工作,但在一个类似的风格。学习系统提供的功能的例子将决定什么是美学的理论支撑这个语料库的使用。例如,一个系统,使用语料库的几何分析的例子,或提取特性基于颜色直方图的图像,正在推动对美学基于表单或颜色分布。相比之下,如果系统使用情绪分析从语料库中提取的情感线索,这可以被视为工作接近情感表达和感知理论。
系统分配健身的另一种方法是使用与人交互的一个固定的函数(22]。的审美理论,这使得用户的理论计算适应度函数被使用,决定健身是指一个人,可以应用自己的审美判断没有一定正式建立理论。一个有待进一步研究的领域未来工作将为人类做出的判断提供一个更详细的批判工作,而不是选择或得分,在一些计算机可读形式。这符合一个最近的趋势在进化计算使用更丰富健身的司机包含更多的信息比一个简单的分数或等级(23)选择和突变。我们可以看到这是符合社会,批评人士的美学理论,人类的批评家参与话语与现有的传统或新兴的艺术作品。
3所示。从审美心理学的一些发现
当前研究之间存在一些重叠在PA和CA。作为一个例子,有一些研究者在PA寻找美学价值的措施或视觉的复杂性。但与此同时,看着cross-citation的这两个方面,它们之间几乎没有交流。本节将分析中的一些发现PA的人工智能研究人员的观点。我们希望这可以帮助创建工作的计算机系统等概念我们视觉复杂性、美学和对称。
首先,考评的一组相关的实验只完成了人类探索审美判断作品的复杂性。接下来,我们简要探索一些作品使用算法复杂性,措施和其他作品试图模型视觉复杂性。然后,我们回顾研究,涉及可测量的图像视觉感知的特性的分形分析。最后,我们专注于美学从PA测试,可能是有用的在人工智能的研究。
之前研究人员提出了实际实验心理学的美学、艺术、美学等问题回答了通过理论和经验的理论家。大多数情况下是建立专门的观察一些观众的反应考虑艺术作品。这种非正式的流程,同时有助于澄清思想,不提供一个强大的可实现的理论基础。
1876年,Fechner出版“美学”的元素(24),在那里他观察的基础上的一项研究描述不同的答案代表主题的不同的人群提供不同的视觉材料。这些调查奠定了基础和实验方法假设制定美学及其在控制条件下验证。
一旦这个实验的基础上成立(25),下一步是确定一种方法能够量化的审美对象。艺术作品的复杂的维度,例如(形式和位置的线,有节奏的序列,语调的变化,等等),从这一刻测量的对象是:首先数学家比尔科夫随后艾森克将提出第一个公式审美测量。他们作为一个衡量的审美“价值”在不同的实验中,正如我们下面将要分析的那样,矛盾的结果。
3.1。实验的视觉复杂性和审美
在1930年代,比尔科夫出发设计的第一个数学公式来衡量审美价值。这个公式断言,对于视觉对象,对象的审美尺度( )有关它的顺序( )和复杂性( ),中指定以下关系:
方程(1)提出的审美尺度图像与秩序和简单或复杂的视觉刺激。一起的那个公式,比尔科夫26复杂性定义为一种多重性的表达,比如元素组成一个图像的数量,而订单描述这些元素的规律(重复和冗余)。
虽然比尔科夫提供许多不同的视觉的例子,他没有进行实验来验证他的假设。即便如此,有几个研究论文在他的理论,其中一些提供广泛的不同的结果。一方面,Brighouse [27和迈耶28)认为比尔科夫是经验建立的理论,同时,另一方面,韦伯(29日),Beebe-Center和普拉特30.戴维斯],[31日),艾森克(32不符合这一假设。最完整的相关研究比尔科夫假说是由艾森克(32- - - - - -34]。以前,艾森克亲自进行实验相关理论,揭露他的分歧。为了能够提供一个替代措施,执行自己的实验在一个被控制的环境中。共有11000名参与者,包括那些与艺术研究和没有他们(艺术家、学生、教师、和心理学家),显示不同的一系列多边形,并要求他们根据他们的审美偏好。这些多边形的一部分比尔科夫(提供的材料26]。从实验中,艾森克礼物比尔科夫公式不同,虽然也基于秩序和复杂的思想。在这种情况下,与复杂性之间的关系是正的,因为两个订单和复杂性是发现美的欣赏能做出积极贡献。
应该注意的是,比尔科夫和艾森克都使用的图像图像的多边形,创建实验(不是真实的图片),研究人员没有准确,更少的计算措施允许量化阶或复杂性。在图中1它可以看到一些图片采用艾森克实验。
Berlyne [35)提出,判断图像的兴趣和喜欢靠,从根本上说,刺激的判断的复杂性(36]。反过来,这等相关因素的规律模型,构成的元素数量,其非均质性,或不规则的形式(37]。最佳审美享受的潜伏,直到遇到刺激的平均复杂度,主题的潜力,拥有一个非常温和的刺激或刺激,意味着一个非常高的潜力,但可约的适当修改。这种优化根据不同学习(38]。
美的审美喜好和判断一直以来众多的主题研究实验配方Berlyne的秩序和复杂性。他们的假设被研究的主题下面的两种不同的方法:一个基于通用视觉刺激和另一个在艺术的刺激。在视觉刺激的情况下,艾特肯39],Katz [40],Vitz [41使用几何对象而希思et al。42[],Ichikawa43),和邮票III (44人工生成的图像做实验。重点基于艺术的刺激,我们强调工作由Krupinski和打孔机45],尼基和苔藓[46),奥斯本和法利(47通过抽象绘画,尼基et al。48)与立体派的艺术作品,梅辛杰卖力地(49]使用比喻形象,和Saklofske [50通过肖像。
整个实验获得的结论是互相矛盾的,即使是在同样的方式。找到一些偏好的分布形式的倒U,给中级水平的复杂性与偏好,而别人观察的线性增加审美与日益复杂的接触。更详细的分解和分析可以发现在报纸上纳达尔(51]。
Berlyne自己(37)范本,视觉表达了问题的复杂性。Attneave [52]和Berlyne [53)调查了视觉的主观方面的复杂性。然而,一些实验,利用分类尺度和其他技术确认校勘的变量和变量往往主观信息,正如预期的那样,改变与相应的客观测量的经典理论的信息(54]。Hogeboom解释说,复杂性被每个取决于场景的方式组织(55,56]。这可能是其中一个原因,以前的结论是矛盾的。
活力四射et al。57]证明了主观复杂性度量可以通过熟悉的形象。在纳达尔et al。58),一群人额定的美丽和复杂性的一组图像。作者找不到任何评级之间的相关性。研究人员提出了三种不同类型的复杂性,可以影响视觉感知的复杂性(不对称,和各种各样的对象,对象是有组织的方式)。
也使用的启动和调节,马龙et al。59]研究的变化评估认为美在抽象艺术作品和维护,感知美增加展览的画作被描述为后少了绘画的展览之后,美丽而被描述为最美丽,这强化了审美主体性的概念。
Gucluturk et al。60)呼吁关注个体差异的审美喜好,和采用的分析方法,考虑这些差异,以及重新评价人类的审美偏好的既定规则。审美情趣和刺激复杂性之间的关系通常被定义为倒u型曲线;图片太简单提供吸引美学意义上的太少,而过度复杂的图像存在太多不同的刺激,使审美参与模式。然而,频繁的参与者的偏好之间的个体差异的复杂性研究以来,已观察到的第一个话题。通常使用的线性分析方法,忽略这些伟大的个体差异的审美喜好给出了一个高水平的个人之间的巧合的印象。在他们的研究中,他们收集的品质品味和感知的复杂性参与者对一组144数字生成的灰度图像。此外,一个客观的测量计算每个图像的复杂性。作者声称,结果表明,味道和u型关系的复杂性刺激产生的组合不同的个人品味的功能。具体来说,自动分组后参与者与品味的资格,他们确定一组样本参与者分配越来越低质量越来越复杂刺激的味道,而第二组参与者得分的品味越来越高越来越复杂的刺激。两组不同是否他们喜欢复杂或简单的模式,而不是他们认为的复杂性。 The group of participants who prefer the simplest patterns were faster in their taste assessments compared to the group that preferred complex patterns. These differences in the assessment time were not found in the evaluation of complexity. A partial explanation of the results is provided by the theory of fluidity of Reber et al. [61年),根据经验流体处理有积极影响的刺激,因此减少对复杂的刺激味道可以预期(因此加工流动性较低)相比,简单的刺激(和加工更流畅)。这将验证的结果,而不是其他。
最近的一项框架伯爵和后备军人62年)称为PIA (pleasure-interest模型的审美喜好)旨在提供一个更好的解释的矛盾的模式倾向于审美刺激容易或困难的过程。根据作者的审美对象可以处理两个阶段。在第一阶段,进行自动处理,然后,如果观众足够动力去继续刺激的处理,有处理控制。类似于流动性理论,PIA模型预测,纯粹的自动处理的刺激导致减少的味道随着复杂性的增加。预后模型状态而且控制处理可以产生一个倒U曲线,如果刺激足够高的水平的复杂性导致厌恶和混乱。
3.2。测量图像的复杂性
探索后几个PA的想法,试着分析视觉复杂性和美学之间的关系用一个临时确定的复杂性,我们将继续在这一节中调查一些作品,采用算法复杂性的措施。
如前所述,感知形象的复杂性是主观的。第一种方法计算一组图像的复杂性与复杂性与另一个图像的客观因素。作为一个例子,复杂性可能与图像中对象的数量。因此,两个三角形的构造图像的复杂性,而构造图像9三角形有一个9的复杂性。类似的方法使用的数量不同的对象和其他客观构造图像的质量。第一个工作分析在前一节中使用这种方法通过构造中使用的图像数据集(通常与多边形和其他简单的组合形式)。
一种不同的方法来确定图像的复杂性要求一群人自我报告的复杂性和计算平均响应。这给创建的复杂性度量图像并没有专门为实验(我们绘画或真实照片等)63年- - - - - -65年]。这法在前一节中给出的论文。尽管这种方法并不局限于任何特定的形象,可能存在大量的时间或资源成本如果图像语料库很大。
计算机生成的复杂性可以被应用到图像以相对较少的成本,因此它可以用来喂养生成图像的计算机系统或其他新颖的图像(66年]。此外,它可以让我们决定性的因素(情感、语义等)影响人类感知图像的复杂性,通过适当的客观测量。因此,它可以用来分析客观和主观的价值观之间的差异在不同类型的图像。我们将看到一个清晰的例子在Jakesch和皮革的工作67年]。此外,正如我们将看到,一些PA人员如活力四射et al。68年)表明,客观衡量(基于计算指标)可以更有用的预测人类审美偏好比主观(基于人类的分数)。
业务和布鲁克斯66年)创建了一个半自动的衡量图像的复杂性,基于数量的内角的组合,不同的角度,和线条。加西亚et al。69年)开发了一个算法来测量图像的复杂性图标使用的行数(水平、垂直、对角线),形式(开启和关闭),在每个图标和信件。麦克杜格尔et al。70年)采用相同的测量一组的复杂性与人类的判断形式和实现相关文摘图标的Rs = 0.73。
活力四射et al。71年)创建了一个自动系统来测量图标基于边缘信息的复杂性和结构的变化。他们发现所提供的高成绩之间的相关性和加西亚et al。(Rs = 0.66为边缘信息和Rs = 0.65结构变化),和麦克杜格尔的研究et al。(Rs = 0.64为边缘信息和Rs = 0.65结构可变性)。据我们所知,这系统是第一个例子发表在心理学,雇佣了一个计算度量来衡量的复杂性。
在人工智能研究中,马查多,卡多佐(20.]提出视觉复杂性度量基于JPEG的压缩率和错误和分形压缩。这是基于从Arnheim思想72年- - - - - -74年和摩尔75年]。他们衡量图像的复杂性根据信息理论的发现。其他提出类似的理论(76年- - - - - -78年),图像的复杂性与不可预测性(像素的图像)79年]。作为一个高度不可预测的图像压缩并不容易,他们用压缩文件的长度和错误的程度,估计图像的可预测性。以下方程显示测量的配方:
在宾夕法尼亚州,Donderi和他的同事们80年,81年也启发算法信息理论。他们使用JPEG和ZIP压缩作为一个近似的最小代码来描述图像,因此估计图像的可预测性。图像所有像素的黑色是(原则上)容易压缩,是很容易预测的。另一方面,一个随机生成的图像每个像素之间没有关系是不可预测的,也不是可压缩。在[Donderi和麦克法登82年),作者得到Rs = 0.77之间的相关性JPEG和ZIP压缩文件的长度和主观形象的复杂性。
活力四射et al。57)提出了基于周边四个指标,精明的,JPEG和GIF压缩。他们测试了这些指标与一些以前的数据,显示高相关性与主观复杂性。2011年,活力四射et al。83年]分析了感性形象的复杂性之间的相关性使用几个算法的措施:(i) JPEG压缩的长度,(ii) GIF压缩的长度,和(3)周边检测措施。作者使用一个数据集的800张图片5个不同的类别:抽象艺术,抽象Nonartistic,代表艺术,代表Nonartistic,和照片。结果显示相关的Rs = 0.74的GIF文件的长度具象装饰类别。其他类别的相关性较低(抽象装饰:Rs = 0.6,自然图片:Rs = 0.55,具象艺术:Rs = 0.47,和抽象艺术:Rs = 0.42)。
Chikhman et al。84年)测试不同措施的复杂性。15的数据集中国象形文字,他们发现最好的措施是“产品的平方局部中值和图像区域。”一组24轮廓的图像对象,他们发现最好的措施是匝数的形象。他们的结论是,不同复杂性估计需要不同类型的图像。
马林和皮革85年]分析生成的措施之间的关系和感知形象的复杂性。他们使用国际情绪图片系统的一个子集(iap) [86年),它包含一组图片标签与程度的通过这些图片表达的情感状态。TIFF的长度之间的相关性(r = 0, 53)和JPEG (Rs = 0, 52)高于一个通过使用周边检测(Rs = 0, 44)。相关发现在这个实验中是最高的RMS之下,相关的Rs = 0.59。在第二个实验中,完成了一套绘画、相关性较低。
之间的差异发现活力四射et al。83年)和马林和皮革85年)可以解释的数据集。活力四射的数据集等。83年]包含图像高度不同的复杂性在五个不同的类别。另一方面,马林的两个数据集和分类账85年]现在少变化的复杂性:IASP数据集包含非专业照片为探索不同情绪和绘画的数据集提供了一个非常类似的复杂程度。
使用相同的数据集作为马林和皮革85年),马林et al。87年]分析演讲时间知觉的影响图像的复杂性。七十名女性分类iap数据集的96张照片,每个1,5、25秒。客观测量和主观的之间的相关性获得更高的博览会时间更长。和之前一样,尝试绘画不确凿。
Cavalcante et al。88年]提出的使用统计数据的结合局部对比度和空间频率作为衡量的复杂性。他们的数据集包含74个来自四个城市街景画图像,40白天,34夜间场景。他们比较的结果指标的一些最先进的国家,包括周边和JPEG复杂性,发现他们的提出的指标是关于不同的时间更健壮的场景。
Jakesch和皮革67年)测试了歧义的作用在人类认知复杂性。要做到这一点,他们聘请高程度的模糊性,艺术品和修改艺术品的低水平的歧义。虽然两组呈现类似的结果关于计算机的措施(Jpeg、GIF和周界探测),两组之间的感知复杂度不同。人类认为这些图像与高歧义是更复杂的比低模糊图像。
Ciocca et al。89年]分析色彩的角色的复杂性。他们发现主观分数彩色图像呈现出高度相关的灰度图像,显示颜色与知觉的复杂性。他们使用一系列图像的特性,但没有发现任何一个能够预测图像的复杂性。
马林et al。87年]分析三种交替的方式之间的差别驴的“享乐色调”形象:美丽,和蔼可亲,或喜欢。他们使用两个数据集,一个与96年与96年具象绘画和其他有吸引力的环境场景转化成漫画。三个享乐色调措施之间的联系是在漫画(Rs = 0.85)高于绘画(Rs = 0.73)。的数据集绘画、相关的复杂性和美丽是Rs = 0.26,“和蔼可亲”的Rs = -0.16为爱好而不是礼物。漫画中的数据集,复杂性和相关性三个享乐语气措施不存在。
Friedenberg和立白90年分析了美丽和压缩指标之间的相关性。不同密度的数据集包含图像模式创建的实验。他们报道高美之间的相关性和GIF复杂性(0.56)和伸直长度(0.47)。他们发现美和数字部分之间没有相关性。建筑在这工作和使用相同的数据集,Gauvrit et al。91年]分析了主观美之间的相关性和几种不同的复杂性措施:密度、数量的块,GIF压缩率、边缘长度,熵和算法复杂度。他们发现,参与者往往偏爱某些类型的复杂性,但蒙骗不了所有的人。这可以解释部分相关报道结果之间的差异图像的复杂性。作者提出,研究人员应该指定哪个复杂性的概念是在每一个工作。
活力四射et al。68年)评估人力分数美丽,复杂性,熟悉,遇到。作者计算两个自动根据GIF和JPEG压缩措施的复杂性。结果显示高相关性自动措施和人类感知的复杂性(Rs =。78年为GIF压缩)。更好的预示人类美丽GIF的复杂性。作者说“这里的数据报告显示GIF复杂性造成在小美的观念,但这美丽与人类的判断没有显著关系的视觉复杂性或熟悉图像”。作者考虑计算机措施更加可靠和有效收集的比人类的认知复杂性。
这条线的研究后,马丹et al。92年]发现情绪激发和价影响图像复杂度的评级。他们找到了一个觉醒之间的相关性和视觉的复杂性Rs =。50,减毒与Rs = .40 bias-aware指令。此外,活力四射et al。57)发现,熟悉和学习也影响图像复杂度的评级。
3.3。视觉的复杂性预测
在本节中,我们分析几个作品采用一组指标和机器学习系统来预测视觉图像的复杂性。大多数的系统是由人工智能研究人员但有些是由PA和CA的研究人员一起,与一个在心理学杂志上发表。
Machado et al。93年)是第一个试图创建一个图像的自动预测复杂性度量的基于组合。中使用的数据集使用是一个活力四射et al。83年),800年5个不同的图像组成的类别。在第一个实验中,个人之间的相关性计算大量的计算机生成的措施和平均感知形象的复杂性。使用一个精明的边缘滤波器,获得了更高的相关性与Rs = 0.77。JPEG压缩实现了Rs = 0.74的相关性。在第二个实验中,大量的措施送入机器学习系统是基于人工神经网络(ann),形成一个预测的复杂性。最佳预测值之间的相关性和主观形象的复杂性是Rs = 0.83。边缘密度和JPEG压缩错误是人类最重要的预测因子的复杂性。预测误差是0.09(0.4规模在1 - 5)。错误是更高的“具象艺术”和“自然和人为的照片场景”图片,可能是因为比抽象的语义(艺术和Nonartistic)和表征Nonartistic图像类别。
Ciocca et al。94年)用遗传规划建立一个图像复杂性预测,使用四个措施:粗糙度,许多地区,浓度差异,难忘的人。他们报道相关训练集上的Rs = 0.890, 0.728验证集,测试集和0.724,优于单独每个措施的结果。
Gartus和皮革95年)计算广泛的计算复杂性和措施结合使用一个随机森林(一个标准的机器学习技术)来预测图像的复杂性。图片是一组抽象范式从Gartus所使用的设置和分类账95年与不同数量的三角形,白色背景。数据集包含152不对称和76对称模式五种对称。他们发现一些电脑指标正相关与复杂性。一个度量基于GIF压缩与Rs = 0.634相关性最高,镜面对称有负相关的Rs = -0.578。结合基于GIF和镜面对称的度量在一起,他们报道相关的Rs = 0.903。
3.4。测量视觉概念
在本节中,我们专注于不同的视觉与视觉美学的概念以及他们如何可以使用度量模型。我们开始与分形维数,然后在对称原则,色彩渐变,和低级处理。
第一个工作我们意识到与分形维数和美学是部和Sprott96年),分析之间的关系的审美喜好,(i)分形维数和(2)李雅普诺夫指数的抽象模式。他们找到了一个偏好值的分形维数和李雅普诺夫指数是典型的自然对象。
泰勒et al。97年]分析了分形维数的绘画艺术家杰克逊·波洛克。后来,泰勒et al。98年]证明了分形维数的线性波洛克的作品增加了近十年。从那一刻起,相关的分形维数是衡量图像的复杂性和采用心理美学的研究和人工智能应用于美学。
Spehar et al。99年)发现了一个一致的审美倾向于分形图像。他们强迫选择成对比较的方法和使用图像具有不同的分形维数。他们使用三个不同的数据集:(i)自然图像,(ii)模拟海岸线,和(3)波洛克的图像。结果显示“审美偏好一致的趋势在分形维数范围内达到峰值1.3 - -1.5分形图像的三种不同的起源。”作者认为这个范围是典型的自然对象。
泰勒et al。One hundred.]分析了不同反应分形模式(视觉偏好的生理反应)的画家杰克逊·波洛克的作品。琼斯和Mathur101年),然而,问题使用分形维数在波洛克的作品。
街等。102年]目前大规模分析涉及分形的审美喜好和复杂性度量。使用的数据集是由81年文摘单色分形图像。计算一系列复杂的措施之后,他们发现了一个强烈的负面关联分形维数(FD)和GIF比复杂性度量, 。他们还使用了两个可选被迫选择分析(TAFC)和获得人口统计信息(年龄,性别,和大陆居留)从每个参与者。结果显示强大的大陆和性别差异相关:在这些实验中,女性在男性一贯喜欢复杂的图像。
在Spehar et al。103年),作者使用一组27分形图像合成:9 过滤后的灰度图像与光谱斜坡从0.5到2.5的增量0.25,阈值黑白图像和边缘只有同行。在第二个实验中,他们使用两个过滤后的灰度图像的进一步变化,称为“山”(模拟一个二进制的一座山)和“地形”(模拟卫星视图的字段与高度灰度图所示)。他们发现大多数的参与者表现出偏爱中间fractal-scaling峰值特征而其他参与者表现出一个线性增加(大约20%)与增加振幅谱斜率或偏好线性减少偏好随着振幅谱斜率(大约20%)。不同的倾向高度稳定的所有图像类型。
在他的博士论文,Patuano [104年应用分形维数的风景。为了做到这一点,他雇佣了几个预处理阶段创建一个图像的二进制版本(使用边缘、轮廓大纲等),然后应用计盒方法。最高的测量相关人类偏好是图像的分形维数提取边缘。
在Viengkham Spehar [105年),一组树层次的分形维数的图像(低、中、高)提出了一群人,他们被要求速度,和蔼可亲,复杂性,和有趣的。这项研究包括三种类型的分形图像和合成七个类型的绘画。在大部分类别,大多数参与者更喜欢与中间图像分形维数,分形维数40.13%与33.05%的低和高FD的26.82%。
Zipf [106年)提出,许多现象都遵循一个分布,发生的频率成反比频率表中的排名。所以,一个国家的最大的城市有第二个人口的两倍,三倍第三个,等等。Zipf分布是平常的语言,但它也可以描述在一个国家,城市人口规模的人数看电视频道,等等。Manaris和他的同事们雇佣该分布在几个指标对音乐作品,例如,(107年,108年]。Machado et al。93年与视觉感知)获得相关的复杂性Rs = 0.64。
面向梯度直方图(猪)计数出现局部的梯度方向的部分图像。方向梯度直方图金字塔(PHOG)包含图像的猪与猪的部分图像。Redies et al。109年提出基于PHOG两个指标:自相似性和复杂性。他们计算指标对不同的数据集,发现其中一个数据集(包含图片的艺术绘画)可以通过特定组合的特征值的指标。
Lyssenko et al。110年)发现了主观视觉复杂性和之间的关系(i) PHOG自相似性( )和猪的复杂性( )。79年的数据集由抽象艺术作品。他们还发现这些指标之间的相关性和参与者的主观的术语用来描述的艺术品。
有一些研究试图建立审美价值和色域之间的关系。Nascimento et al。111年]分析改变绘画的色域的影响,提高他们的审美价值。他们要求一组用户改变十的色域绘画。最大值分布的和原来的一样,暗示,不出所料,绘画采用的彩色作品与观众的喜好。
其他作品美学和对称的关系调查。Weichselbaum et al。112年)检测对称偏好的参与者在不同层次的个人艺术专业知识。他们发现,“更高的艺术专长,评级为不对称的美模式显著增加,但是,同样,参与者更喜欢对称/非对称模式”。Thommes和大113年]分析了Instagram的关系“喜欢”和三种计算方法:两个措施的视觉平衡和偏爱曲率生硬。他们利用700建筑照片从Instagram账户。他们找到了一个3 d视觉平衡之间的正相关关系,喜欢照片,和2 d负相关的。我们所知,这是第一次工作,员工“喜欢”的美感。
3.5。心理测试相关的美学
有很多心理测试相关的审美判断。这些测试是相对客观、易于复制和提供量化的结果(51,52,55,56,114年- - - - - -117年]。然而,这些测试的主要问题是缺乏共识。每个测试背后的概念的有效性是有争议的,通常是基于作者提出的审美原则的测试,而不是普遍接受。个人测试的结果也不同研究之间的差异,可能由于选择的参与者和其他外生因素。作为一个例子,Weichselbaum et al。112年]表明,艺术经验影响对称偏好。
格雷夫斯(118年)开发设计判断测试。这个测试是基于理论的艺术创作和欣赏(119年]。作者声称,这个测试可以预测某些功能与艺术和审美评价。要做到这一点,测试估计反应到特定的美学原则的程度(根据作者)这样我们团结,开车,优势,品种、平衡、连续性、对称、比例、节奏。这样的校长可能不是普遍接受或适用的120年- - - - - -122年]。试验包括九十页。每个页面包含两个或三个类似的设计。设计遵循所有的评论原则之一,其余的至少其中之一。个人做测试的任务是选择那些不失任何的设计原则。
平均结果由不同研究参与者在这个测试(121年,122年]。虽然这可以,至少部分,选择的解释的参与者和其他外生因素,它很难理解什么是一个好的分数在这个测试。在测试通过坟墓,艺术的学生得到更高的平均得分比那些没有学习艺术的学生118年]。坟墓的结论是,测试可以用来区分这两个组。艾森克和城堡121年)获得不同的结果,只显示小艺术,没有艺术学生之间的差异(64年,4%比60%),男性和女性之间的差异。Eysench解释说,关于艺术学生不同的结果可以与艺术教育的变化,在1971年比1948年促进规律性和简单性。Gotz和Gotz123年)报告说,“22个不同的艺术专家(设计师、画家、雕塑家)0.92协议优先设计的选择,尽管批评他们”(124年]。
马查多,卡多佐(20.]提出一种审美测量基于处理复杂度和图像的复杂性:“图像同时视觉复杂和容易处理的图像,有较高的审美价值。“分形是一个简单的例子,但是容易过程非常复杂的图像由于自相似性。使用基于压缩下面描述指标,美学和固定方程,他们获得分数高达66(对应于73.3%的成功率),这是比同美术毕业生。Machado和卡多佐(125年),作者采用类似的方程作为遗传规划健身引擎创建图像。罗梅罗et al。126年有关JPEG)雇用一些指标,分形压缩和Zipf定律,和一个ANN-based机器学习系统来预测答案的测试,导致74.49%的准确性,类似于以前的研究。
Hayn-Leichsenring et al。127年]研究客观形象措施和主观评价之间的关系JenAesthetics数据集。这个数据集包括1628个高质量的图像画(http://www.inf-cv.uni-jena.de/en/jenaesthetics)。客观措施低级图像统计相关美学在先前的研究,比如从布劳恩et al。128年),与自私、各向异性和复杂性。主观评价是审美(定义为艺术价值)和美丽(定义为单独的附件)。结果显示,每个时期的绘画呈现特定图像的统计特性。此外,他们之间的相关性表明美和美学,美学之间的相关性和一些客观的措施在不同的子集。最高的相关性被发现之间的自相似性和绘画的一个子集的美丽建筑 。他们发现审美差异和美丽的分数。
4所示。结论
爸和CA的研究有几个主要的差异。首先,我们分析一些有关数据和结果的差异。巴勒斯坦权力机构的实验中使用的数据集通常包含少量的图像,由于需要评估每个人由一群人类参与者。CA的理想是有一个大数据集的图像,可以允许机器学习有更完整的和多样化的信息。
一些数据集用于CA工作是基于网站摄影收藏有大量的贡献(图片129年- - - - - -131年]。然而,这些数据集的图像是评估网络在一个不受控制的环境中,可能有潜在的偏见根据图像的与作者的关系,受欢迎程度强化,显示环境,等等。最后,随着信息(图像和评估),摄影网站,目前尚不清楚什么是用户评价(照片质量、创意、视觉审美,喜欢)。一个有趣的方法是使用一个游戏获得图像的评估。允许研究人员提供明确的评估和选择可能会鼓励参与者花更多的时间研究做出贡献。在黑客和von Ahn [132年),作者采用双人游戏,每个参与者应该评估图像后其他参与者的味道。他们招募了成千上万的玩家和收集了数以百万计的判断。
从巴勒斯坦权力机构的研究,我们发现,即使在PA实验在控制条件下,用户提供完全不同的评价取决于这个词和上下文的问题87年,127年]。因此,我们建议,当使用这种网站数据集有必要做这样的实验用户评估。,如果可能的话,最好的方法是创建数据集进行与PA人员合作,评估在受控环境和大量的图片,支持使用机器学习技术。
许多艺术策划数据集的图像是局限于西方或欧洲艺术、提高文化偏见的问题。同样,许多研究报道在欧洲或北美,这可能影响研究参与者的多样性。随着审查关于人工智能数据集获得了机器学习应用,研究人员需要注意的隐式或显式的偏见在他们选择的训练数据。这是一个持续的问题的研究在这个领域。
最后,一些最近的PA研究评价个体之间的主要差异在欣赏视觉美学和复杂性(60]。更详细的分析,这个问题可能是非常有趣的。此外,它可以很有趣来创建大量的图像与个别评估人类,允许计算机系统的培训发展以一个人类个体的审美偏好。
关于结果,研究典型报告结果使用成功率或均方根误差,而心理学家则更可能使用相关性。这不是一个大问题:一些论文在相关用人毫升系统取得好结果,尽量减少均方根误差(93年),但未来的系统训练相关性最大化可以实现更好的结果。
爸和CA之间更紧密合作可以产生结果,推进学科。给定数据集(PA)的总体质量,巨大的集计算机指标(CA)和ML技术(CA),和后验分析(两个),视觉复杂性可以构建更强大的预测。人工智能研究人员甚至可以使用人工智能方法建立新的指标,没有人在思考(使用GP编程如Ciocca et al。94年),人工神经网络(133年),或深度学习134年])。预测可以实现,允许远程访问(例如,通过一个web页面),允许任何研究员的视觉复杂性值一个图像或一组在线图像。这将有助于使美学和复杂性的分析客观指标更准确比个人特性分析,对每个人来说都和可访问。在这种背景下,值得注意的是,活力四射的et al。68年)发现更美学与客观复杂性之间的相关性的措施(GIF压缩指标)与主观复杂性。可能是有趣的与复杂性进行类似的分析预测由指标的结合。此外,详细分析预测然后让我们知道更多的信息相关的度量标准相关的复杂性。显然,一些标准的定义,一个数据集,一个复杂性预测,等等,在这个模式中,对每个人来说都是可以接受的将帮助共同研究。
一些CA研究者开始研究的概念创建一个计算机系统能够创建原始和审美价值的艺术品135年]。生殖技术我们遗传编程非常有趣的研究,因为他们可以用来说明一个度量的结果或组合(19,136年]。然而,更好的研究结果在复杂性和审美需要预测为了促进图像生成系统。这里,需要一个PA和CA之间的合作以达到所需的新的研究成果。此外,即使没有被用于与生殖系统,计算机美学系统可以有巨大的实际应用。
进化美学艺术和计算相对年轻的研究领域。然而,一些作者可能认为没有什么可以做。我们与这篇文章的目的是帮助这两个领域的发展通过强调一些可能的开发途径和说明之前的激动人心的和有价值的研究心理学的美学。
我们希望未来几个视觉复杂性和审美预测可在线进化艺术工具广泛受雇于人的方式探索他们的创作能力,以及计算机系统可以令人信服地创建绘画风格的任何人类艺术家和超越。
数据可用性
没有数据被用来支持本研究。
的利益冲突
作者宣称没有利益冲突有关的出版。
作者的贡献
科林·g·约翰逊,乔恩•麦科马克Iria桑托斯和胡安罗梅罗的贡献同样这项工作。
确认
这项工作是由Xunta de加利西亚(Ref XUGA-PGIDIT-10TIC105008-PR),格兰特的整合和构建竞争力研究单位的加利西亚的大学体系:竞争参照群体(ED431C 2018/49),授予教育部,文化和体育教授和研究人员的流动性保持外国高等教育中心和调查(PRX18/00117),和一个澳大利亚研究理事会未来FF170100033相交。