繁體簡(jiǎn)體

中鐵房地產(chǎn)集團(tuán)設(shè)計(jì)咨詢公司進(jìn)行簡(jiǎn)說分享探究建筑AI繪圖

近幾年來以GPT為首的AI技術(shù)大爆發(fā),對(duì)一系列行業(yè)造成了巨大的沖擊。在建筑設(shè)計(jì)行業(yè),也開始有設(shè)計(jì)師嘗試?yán)萌斯ぶ悄芄ぞ哌M(jìn)行創(chuàng)作。5月23日,中鐵房地產(chǎn)集團(tuán)設(shè)計(jì)咨詢公司創(chuàng)作二室鄭有池在第198期“簡(jiǎn)·說”分享會(huì)上,向公司員工分享了近期熱度暴漲的人工智能繪畫軟件的發(fā)展情況,并介紹了利用AI繪畫工具進(jìn)行輔助設(shè)計(jì)工作的一些方法。

與GPT之類更側(cè)重于邏輯分析能力的大語言模型不同,AI繪畫屬于人工智能生成內(nèi)容領(lǐng)域,其更擅長對(duì)于形式和風(fēng)格的模仿,可以依據(jù)簡(jiǎn)單的提示和限制,快速生成大量具有表現(xiàn)力的方案圖像。在建筑設(shè)計(jì)的過程中,這種能力可以幫助建筑師在建筑設(shè)計(jì)前期工作尤其是概念設(shè)計(jì)階段擴(kuò)展設(shè)計(jì)思路,也可以幫助提高與合作方之間的溝通效率。

目前市場(chǎng)上主要的AI繪圖產(chǎn)品很多,其中最有代表性的是Midjourney和Stable Diffusion兩款應(yīng)用。

使用Midjourney需要通過Discord聊天平臺(tái)或QQ頻道進(jìn)行付費(fèi)訂閱,該款軟件主要特點(diǎn)是操作簡(jiǎn)單,生成圖像品質(zhì)較高,可以根據(jù)文本提示或參考圖片每次隨機(jī)生成4張全新的圖像。Midjourney的產(chǎn)品設(shè)計(jì)針對(duì)設(shè)計(jì)思考過程進(jìn)行了優(yōu)化,例如Variation功能可以根據(jù)指定圖像進(jìn)行聯(lián)想擴(kuò)展,并結(jié)合提示詞重新生成4張不同的圖像;Blend功能可以融合兩張參考圖的元素生成新圖像,Seed功能可以記錄圖像風(fēng)格基因,便于復(fù)制使用。這些功能在大部分美術(shù)創(chuàng)作工作中都能提供良好的使用體驗(yàn),生成富有啟發(fā)性的內(nèi)容。而在建筑設(shè)計(jì)過程中,建筑師往往需要對(duì)形體和內(nèi)容進(jìn)行更精確的控制,Midjourney在這方面的功能目前還相對(duì)較弱。

Stable Diffusion是由StabilityAI公司推出的開源模型,可以通過其官網(wǎng)付費(fèi)訂閱,也可以在本地部署使用。需要注意的是AI算法需要進(jìn)行大量并行計(jì)算,在本地部署時(shí)需要顯卡支持CUDA算法,顯存至少達(dá)到4G,才能保證較好的出圖質(zhì)量。由于Stable Diffusion的開源屬性,網(wǎng)絡(luò)中聚集了大量的二次開發(fā)者和內(nèi)容分享者,他們創(chuàng)作了大量的功能擴(kuò)展插件和微調(diào)模型,為精確控制AI進(jìn)行繪圖提供了可能。

以使用Stable Diffusion進(jìn)行文生圖功能為例,用戶先要選擇合適的主模型作為工作基礎(chǔ)。主模型是負(fù)責(zé)控制文本、編碼、圖片的映射關(guān)系的核心組成部分,用戶可以通過DreamBooth的方式對(duì)官方發(fā)布的主模型進(jìn)行微調(diào),強(qiáng)化其在特定領(lǐng)域生成圖像的能力。

確定合適的主模型后用戶需要將正面和負(fù)面提示詞分別填入對(duì)應(yīng)的輸入框。然后選擇采樣方法和相應(yīng)的迭代步數(shù)。默認(rèn)的歐拉采樣器最佳迭代步數(shù)在20~50之間,一般情況下迭代步數(shù)越高,生成圖像的質(zhì)量越高,對(duì)顯卡的計(jì)算能力要求也越高。在主界面設(shè)置圖像的高度和寬度時(shí)可以先將其設(shè)置在512像素之內(nèi),再通過Tiled Diffusion 和Tiled Vae插件提高最終生成圖片的分辨率,以提高顯卡工作效率,獲得更高質(zhì)量的圖像。

完成設(shè)置后,點(diǎn)擊生成按鍵,程序即可開始隨機(jī)生成圖像。以上過程與Midjourney的生成過程類似。對(duì)于建筑設(shè)計(jì)輔助工作來說,可能會(huì)有更進(jìn)一步的需求,例如對(duì)某種特定建筑風(fēng)格的強(qiáng)化或?qū)ㄖ误w進(jìn)行精確控制,這些需求可以通過附加網(wǎng)絡(luò)模型和Controlnet等插件功能來滿足。

1.png

AI生成圖像效果 1

附加網(wǎng)絡(luò)模型是另一種微調(diào)模型,能夠在不改變主模型的前提下,強(qiáng)化AI對(duì)特定風(fēng)格或形象的模仿能力。目前使用最廣的是Lora模型,其工作原理可簡(jiǎn)單理解為在主模型計(jì)算過程的每次迭代間隙插入計(jì)算,以實(shí)現(xiàn)對(duì)結(jié)果的引導(dǎo)。與微調(diào)大模型的方式相比,Lora模型具有諸多優(yōu)勢(shì),其體量更小,一般在70~150MB之間;而且訓(xùn)練相對(duì)便捷,用戶可以根據(jù)需求訓(xùn)練自己的lora模型;并且多個(gè)lora模型還可以疊加使用,各模型可以分別設(shè)置權(quán)重參數(shù),調(diào)整各自對(duì)生成過程的影響能力。

ControlNet插件可以對(duì)模型實(shí)現(xiàn)比較精準(zhǔn)的控制,其集成了多種控制算法,包括線稿控制、深度信息控制、法線信息控制、seg語義分割控制、人體姿勢(shì)控制、shuffle色調(diào)控制、reference參考圖控制等。使用時(shí)先導(dǎo)入作為控制條件的圖像,根據(jù)需要選擇相應(yīng)的預(yù)處理器和模型,并設(shè)置控制條件對(duì)生成圖像影響的權(quán)重參數(shù)即可。

2.png

AI生成圖像效果 2

在配備高質(zhì)量模型的情況下,合理利用AI繪圖工具,可以快速生成大量具有一定表現(xiàn)力的圖像,可用于頭腦風(fēng)暴啟發(fā)設(shè)計(jì)思路;或者作為填色底圖,豐富成果表現(xiàn)內(nèi)容;也可以作為前期意向圖片,提高與甲方或相關(guān)單位的溝通效果。

除了以上兩款軟件,還有很多值得一提的產(chǎn)品。OpenAI推出的DALL·E模型已經(jīng)集成在微軟的NewBing搜索引擎,配合其獨(dú)到的ChatGPT語言模型,可以通過聊天的方式,生成高質(zhì)量圖片。另外百度推出的文心一格可以通過中文提示詞生成圖像,并且也推出了參考圖功能,目前在快速發(fā)展迭代過程中。

在人工智能生成內(nèi)容領(lǐng)域,與建筑設(shè)計(jì)高度相關(guān)的除了AI繪畫方向之外,還有AI建模,AI矢量?jī)?nèi)容生成等方向的研發(fā),現(xiàn)在已經(jīng)出現(xiàn)了ShapE、Finch3D等產(chǎn)品。

雖然AI繪畫工具在使用中還存在一些問題,相關(guān)的應(yīng)用方式也還在探索過程中。然而改變已經(jīng)開始;也許在不久的將來,隨著AIGC產(chǎn)品的逐漸成熟,建筑行業(yè)會(huì)迎來一場(chǎng)深刻的的技術(shù)變革。作為本次技術(shù)變革的擁抱者與參與者,設(shè)計(jì)公司全體員工將在技術(shù)上精益求精、在創(chuàng)新上奮勇爭(zhēng)先,順勢(shì)而謀、因勢(shì)而為,為豐富人工智能在具體工作中的應(yīng)用不懈努力。(撰稿:鄭有池)

來源:號(hào)外網(wǎng)


責(zé)任編輯:侯哲
熱門評(píng)論
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120170072
京公網(wǎng)安備 11010502045281號(hào)
違法和不良信息舉報(bào)電話:010-65669841
舉報(bào)郵箱:xxjb@huaxia.com

網(wǎng)站簡(jiǎn)介 / 廣告服務(wù) / 聯(lián)系我們

主辦:華夏經(jīng)緯信息科技有限公司   版權(quán)所有 華夏經(jīng)緯網(wǎng)

Copyright 2001-2024 By skhuanbao.cn