logo

爱游戏全站app登录入口项目案例

LAF AI“图生图”能否代替景观设计师?

  ,不可直接引用。原中英文全文刊发于《景观设计学》(Landscape Architecture Frontiers)2024年第12卷第2期“面向关键挑战的智慧化景观设计”。

  人工智能(AI)图像生成技术正在改变景观设计中的传统工作模式,其中,“图生图”式生成对抗网络(GAN)技术具备辅助方案设计的潜能,因此面向用户端对其展开技术适用性评价研究对于优化工具选择、提升设计效率特别的重要。本研究旨在借助图像分析和用户调查方法,评估GAN生成方法生成结果的质量、与设计工作对接的有效性,以及景观设计师对图像生成结果的接受度。研究以Pix2PixBicycleGAN工作流中布局生成与平面渲染两项任务为评价对象,建立了基于地块数量的绝对/欧式距离、直方图距离、结构相似性指数等图像分析指标;针对GAN生成结果的视觉真实性和色彩肌理偏好开展了两项在线用户问卷调查。结果显示,GAN生成布局与真实布局相似性高,GAN渲染平面能够很好的满足概念方案呈现要求、用户接受度好。最后,本文探讨了GAN生成方法的内在合理性及其在行业伦理及数据偏见方面的局限性,反思现阶段连接AI辅助设计与循证设计之间的技术空缺。

  景观设计学;图像生成;生成对抗网络;人工智能辅助设计;适用性评价;景观平面

  在近年来兴起的生成式人工智能(AI)热潮中,快速地发展、升级的图像生成技术和制图工具不断冲击着传统景观设计行业的工作模式。目前可以对接景观设计工作流的图像生成技术主要被应用于平面生成及效果图渲染两方面。

  平面生成的相关研究主要是基于“图生图”式生成对抗网络(GAN)开展。这类工具以建筑户型平面生成为起点,目前已发展至建筑排列方式与体块关系的生成。近年来,景观设计领域也开启了平面生成的研究,但仍存在以下问题缺乏公开可获取的景观平面数据集,训练数据丰富性较低;可生成平面的尺度有限,一般适用于中小型绿地;针对GAN所生成平面的系统化定量评价较少,缺乏便于操作的评价指标;针对用户端开展的调查较少,难以获取使用评价。

  效果图生成的相关研究与应用主要围绕Midjourney和Stable Diffusion两大“文字生图”(text to image)工具开展。相比之下,开源的Stable Diffusion模型除了能通过关键词生成图片外,还具备“图生图”(image to image)和“模型生图”(model to image)的自由训练功能,目前,基于Stable Diffusion的建筑形体构思和建模工作流已经初步形成。

  本研究关注基于GAN的景观平面生成方法,从景观设计师的视角综合评估其技术适用性,以期为设计师在选择工具时提供决策依据;旨在借助图像分析和用户调查方法,评估GAN生成方法生成结果的质量、与设计工作对接的有效性,以及景观设计师对图像生成结果的接受度。

  本研究着眼于Pix2PixBicycleGAN景观平面生成工作流中两项关键任务布局生成与平面渲染的适应性评价。GAN生成的布局类似设计教学中的功能泡泡和平面草图,是设计迭代和调整的基础;GAN渲染图则为布局中抽象的形态添加了色彩和肌理细节而使其更具可读性。任务实现工具Pix2Pix是GAN领域应用比较广泛的模型,而BicycleGAN是CycleGAN的改进模型。由于数据集中获取与标注的平面类型有限,这一工作流目前一般适用于中小尺度的景观场地。

  通过向Pix2Pix模型输入场地范围,可以生成多种风格且包含不同用地类型的场地布局。评价围绕生成的用地地块布局与真实布局的相似性和视觉真实性开展。

  在本研究收集2725张真实景观平面图,其中混合、曲线、折线、有机混合训练集分别为2670、916、770、954张,预留用于评估生成效果的验证集85张。基于4种样式风格,共得到340个GAN生成布局用于后续评价。设计师在比较多个GAN生成布局后,依据项目需求并结合个人经验形成更为精准的地块布局,并将其作为平面渲染任务的输入。

  设计师将调整后的布局输入BicycleGAN中,可获取不同色彩肌理的渲染平面,方便与业主快速沟通设计思路。该任务的评价主要围绕GAN渲染平面与人工渲染平面的相似性及用户色彩肌理偏好开展。数据集共包含景观平面325张,其中训练集300张,验证集25张。每张布局挑选暖色调、冷色结果各一张,评价总量为50张。

  所生成五类用地的地块数量(BN)能够最直观地反映GAN生成布局的形态多样性,相应的地块数量距离(BND)可用于评估340张由Pix2Pix生成的验证集布局和真实布局的差异。其中,BND评价包含绝对BND和欧氏BND两项指标的计算。本研究通过绝对距离比较单一样式风格下生成布局中各类用地BN与真实布局之间的差值。同时,本研究通过绝对BND与欧式BND的聚合分析比较了四类样式风格之间地块划分聚集程度的差异,并以聚合图呈现两组数据的中点聚集区。

  图像直方图可显示图像中不同RGB像素的频率分布,直方图距离(HistD)则是衡量两幅图像之间像素分布差异的关键指标,可以有明显效果地评估GAN生成布局与真实布局在用地地块划分与面积比例上的差异。其中,HistD的取值范围为[0,1],取值小于0.5代表二者总体呈现相似趋势。

  结构相似性指数(SSIM)是一种普遍的使用的图像相似性度量工具,可以评估两幅经过不同处理加工的同源图像(x, y)之间的感知差异。本研究通过计算SSIM来评估渲染平面与景观设计师人工渲染平面的差别。SSIM的取值范围为[0,1],其中,1表示两幅图像具有相同的结构,0则表示完全不同。此外,上述HistD指标也被并纳入平面渲染评价指标。

  为了评价GAN生成布局在视觉上能否以假乱真,同时了解从业人员的色彩肌理偏好,研究团队于2023年9月1日至10月31日,面向景观设计及相关领域的教师、学生和职业设计师发布了两项问卷星在线调查问卷。问卷主要被投放到湖南大学建筑与规划学院、清华大学建筑学院及北京市市政工程设计研究总院,同时要求受访的人选择其求学或从业年限以确保结果的代表性与可靠性。

  问卷1旨在对GAN生成布局进行图灵测试,并评估从业人员对GAN生成布局的接受度。问卷涉及16张随机抽取自验证集的Pix2Pix自动生成布局,14张由知名事务所或大师创作方案的布局改绘,受访者需要从中选出他们所认为的由AI生成的图片,问卷并未设置最多可选数量限制。

  问卷2旨在判断从业人员对几类主流GAN模型渲染图接受度的差异。问卷提供了30张渲染平面图(10组、每组3张,分别来自Pix2pix、CycleGAN和BicycleGAN),要求受访者判断渲染图是不是达到在概念设计阶段用于方案交流的标准,并依据色彩和肌理选择每组中效果最佳的平面。

  总体对比GAN生成布局与真实布局发现,两者在图形统计意义上的BN多样性水平接近,地块面积比例相似性突出。

  1)由绝对BND平均值计算结果(表1)可知,单张布局中,GAN生成的五类用地BN与线个,主要差别体现在小品构筑物的数量上,这表明GAN与设计师在用地划分时表现出的多样性较为相似。

  2)为了确定4类样式训练集的布局数量差异是否会导致BND结果的显著不同,进一步对四类风格、五类用地地块的绝对BND与欧氏BND进行聚合分析。结果显示,4种样式风格在用地划分上也具有较强的相似性,进而可知训练集数量的不同并没有显著影响训练结果。

  GAN生成布局与真实布局的绝对BND与欧氏BND聚合图 © 周怀宇,向双斌

  3)混合、曲线、直线、有机四类样式风格的平均HistD值分别为0.41、0.45、0.41、0.43,均小于0.5,意味着GAN生成布局对不同用地类型划分的面积比例总体与真实布局呈现接近趋势。

  计算50张渲染图的平均SSIM和HistD值,结果如表2所示。总体来说,分析根据结果得出GAN渲染平面在像素分布、结构、对比度和亮度方面与职业设计师绘制的渲染图高度相似。

  问卷1共收到192份有效回复,55%的受访者有5年以上的从业经历,保证了结果的可靠性。结果显示,16张GAN生成布局被识别为AI生成的平均概率为54.7%,略高于随机猜测的概率。而GAN生成布局有约45%的几率被从业人员错认为是设计师创作的布局。同时,设计师创作的线%的概率被判定为GAN生成。总体而言,GAN生成布局可以使一些受访者感到迷惑,同时,约70%的受访者认为GAN技术有助力方案设计的潜力。

  研究进一步通过电话、微信、邮件等形式与受访者交流怎么样分辨布局是由AI生成还是设计师绘制,发现功能设计中不合理的细节会严重破坏GAN方案的视觉真实性。研究将GAN布局缺陷分为三类:1)入口不完整;2)道路不连贯;3)节点不可达。其中,道路不连贯的问题最为明显。

  问卷2共收到422份有效问卷,受访者中55%具有景观设计专业背景, 37%位具有5年以上的从业经历。结果显示,91%的受访者认为GAN平面渲染的质量能够完全满足概念设计阶段的方案推敲与沟通,47%的受访者认为BicycleGAN在色彩和肌理效果上表现最佳。

  本文通过引入图像分析及用户调查指标来评估GAN生成方法的技术适用性,旨在填补现有研究主要关注训练方法而缺少后期评估的空白,为“图生图”生成式设计研究提供易于操作的评价框架。图像分析结果为,GAN生成布局与真实布局的用地分布多样性、渲染平面图与设计师渲染平面图的相似性均达到了较高的水平;用户调查的最终结果显示,GAN生成布局具有较强的迷惑性、真假难辨,且渲染色彩和肌理得到了景观设计师的认可。即使GAN生成方法模型内部存在较多的黑箱过程,但本研究为其内在逻辑的合理性提供了定量化支撑。

  本研究的局限性大多数表现在以下几个方面。首先,研究未涉及对GAN生成方法的伦理评价。通常而言,设计需要基于特定的地域环境背景来实现功能需求,而GAN生成方法往往对复杂历史、文化因素影响下的形式符号缺乏理解。本研究的问卷调查缺少对GAN生成方法原创性的关注,需在未来的研究中补充收集用户对伦理问题的看法。其次,在本研究建立的评价框架中,未纳入对GAN生成布局多样性和训练数据偏见问题的考量。AI工具输出的内容受其训练数据影响显著,而目前景观平面数据集多样性严重不足,盲目应用会导致设计成果的同质化,未来亟需探索如何避免潜在的设计多样性缺失。再者,本研究评价的Pix2Pix-BicycleGAN工作流虽然具有一定的典型性,但尚不能代表最前沿的技术迭代。在未来的研究中,可探索针对特定区域或类型景观设计(如中国古典园林与西方现代景观)的定制化GAN模型,在模型训练过程中融入具有更多地域特征的数据,以及开发能够辨识并强调这些特征的算法。

  此外,GAN生成方法较低的可解释性使其面临着来自循证设计的挑战。形态只是设计的一方面,而“设计结合自然”的科学思维要求综合叠加各项因子(如竖向、土壤、径流和植被等)以论证设计决策的合理性。因而,如何连接GAN模型代表的形态表达与物理模型代表的定量分析是AI深度融入设计学科必然要克服的问题。随着GAN生成布局多样性的提升,未来利用多目标优化算法对其进行筛选、优化将有利于提升设计决策的科学性。而随着生成算法的更新,物理模型及优化算法将有可能逐步与AI模型融合,明显提升GAN生成方法的可解释性和应用深度。

  由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。

  特别声明:本文转载只是出于传递信息的需要,并不代表代表本网站观点或证实其内容的真实性;如别的媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者若不希望被转载或者可以联系转载稿费等事宜,请与我们接洽。

  FIE Research Article:高性能PdAu合金纳米颗粒催化甲酸制氢研究

  FoAR 喷雾系统对中国西安市半户外空间下席坐人们热环境和热舒适性的影响