馬薛騎
裘鴻菲*
景觀意象是旅游意象的重要組成部分,指的是游客主體和景觀客體之間的映射,即主體對客體的想象與感知[1]。強烈的景觀意象對游客的吸引力更強,是景觀建設的基礎與理論依據,也是提高旅游競爭力的重要途徑。湖泊公園作為城市典型的藍綠空間,提供著重要的生態(tài)調節(jié)服務與景觀游憩服務,具有多種環(huán)境及社會效益[2],對于提高人類福祉和公共健康大有裨益,已經成為公眾休閑放松、活動娛樂的重要城市開放空間。因此研究湖泊公園的景觀意象有助于從公眾角度完善湖泊公園的景觀建設,但目前缺乏對景觀意象的理論研究與系統(tǒng)化的感知挖掘分析。
隨著互聯網與人工智能的革新發(fā)展,使用社交媒體的人數以及來自大眾網絡公開數據的類型和數量呈指數級增長[3],網絡平臺端口的打通也為獲取公開數據提供了支持[4]?;诖蟊娋W絡媒介的數據源樣本量大、公眾參與程度高,能夠更全面多維度地表達公眾的感知偏好。目前來自Flicker、Panoramio、Twitter、微博、豆瓣等社交平臺以及大眾點評、攜程等旅游網站的多源數據已被廣泛應用于景觀研究[5-8],在線旅游網站逐漸成為游客表達景區(qū)感知偏好和情感評價的重要途徑[9]。人們在各類網絡平臺分享的評論與照片,為相關研究貢獻了海量的樣本數據,目前基于網絡文本的內容分析已經可以通過自然語言處理等方法實現自動化處理,然而基于照片數據的研究仍多依賴于手動編碼和定性分析[10],這不僅使得分析結果易受到研究人員個體偏見和主觀性的影響,還難以將其擴展到大型數據集和大尺度研究領域[11-13];而利用包含深度學習標簽的大型圖片數據集的研究則存在數據難以進行再處理,研究內容受限的問題[14]。因此,通過計算機視覺算法處理大量圖片數據來彌補手動編碼的缺陷,目前已成為景觀視覺和景觀偏好研究的重要手段。在圖像大數據集和云計算的推動下,計算機視覺應用程序的能力也迅速提升[15],目前可通過在線機器學習算法實現圖像識別的平臺包括Google Cloud Vision①、Microsoft Azure、Clarifai及百度智能云,其中Google Cloud Vision提供的圖像識別API可以通過預訓練的機器學習算法識別圖像中的特定對象,包括人、動物、物體、標志等,提取圖片顏色以及識別文本;除此之外,還提供了基于研究人員分類標簽的自定義模型程序,為實現特定研究提供了條件。目前Google Cloud Vision在國外已被應用于國家、城市、自然保護區(qū)、國家公園等對象的生態(tài)系統(tǒng)文化服務、景觀美學等研究[16-19],已成為實現大規(guī)模圖像內容分析的前言技術方法。
鑒于此,本研究開發(fā)了一個新框架來綜合分析大規(guī)模圖像數據,通過Google Cloud Vision提供的在線機器學習算法,自定義景觀標簽,構建Auto ML模型對武漢市7個湖泊公園的16 883張網絡景觀照片進行圖像挖掘與內容識別,歸納景觀意象的具體維度,分析研究地的景觀意象特征及感知偏好,為提升研究地的景觀吸引力提供建議。
武漢位于中國中部地區(qū),是湖北省省會,地處古云夢澤地帶,市內湖泊眾多,素有“百湖之市”之稱,現有大小湖泊166個。湖泊不僅是武漢市重要的生態(tài)系統(tǒng),也是城市歷史文化的源流,是城市形象的重要標志。本研究以武漢市為例,根據公園面積、公園類型、地理位置等公園屬性選取了7個具有代表性的湖泊公園作為研究對象(圖1,表1)。
圖1 湖泊公園地理位置
本研究的照片數據來源于在線旅游網站上游客的評論圖片,考慮到社交媒體平臺(微博、小紅書等)用戶數據的私密性以及平臺本身的隱私政策,在此不予考慮。本研究選取大眾點評網、攜程網、馬蜂窩旅游網3個受眾性高、評價數據量大的國內主流旅游網站,通過網絡爬蟲進行照片檢索與爬取,時間跨度為2018年4月26日—2021年4月26日,爬取7個公園所有的游客評論圖片,共21 674張。隨后對照片數據進行預處理,剔除模糊照片、同一評論者上傳的相同照片以及以人像、食物、地圖、門票、廣告等為主的非景觀照片,最后保留16 883張景觀照片(表1)。
表1 湖泊公園名錄
本研究應用Google Cloud Vision提供的在線機器學習算法分析網絡照片,運用圖像識別應用程序編程接口(Vision API)和Vertex AI平臺來識別圖像內容、自定義景觀標簽以及創(chuàng)建、訓練、評估Auto ML(Automated Machine Learning,自動機器學習)模型,最后利用Auto ML模型批量預測景觀照片得到圖像識別結果,通過統(tǒng)計分析、分類總結等方法探討研究地景觀意象的特征及公眾偏好,分析其感知共性與特性。具體研究思路如圖2所示。
圖2 研究思路
將景觀照片數據集按不同公園分為7層,在各層中通過分層定比,即按2.96%的樣本比例,在各層中進行簡單隨機抽樣,共抽樣出500張照片,用于圖像標簽分析。根據景觀特征和相關研究,通過人工識別對500張樣本照片進行景觀分類和空間尺度分類,通過Vision API對樣本照片進行圖像內容識別。
1)單標簽-景觀要素:景觀要素可歸納總結為兩大類型、8項要素。其中自然景觀包括水體景觀、林木景觀、花卉景觀、水生植物景觀;人文景觀包括歷史文化(以傳統(tǒng)的亭臺樓閣、歷史雕像等為主的文史景觀)、景觀設施(以廣場、景觀小品等為主的硬質景觀)、游樂設施、道路環(huán)境。
2)單標簽-空間尺度:空間尺度可分為宏觀、中觀、微觀和微距4類,宏觀指110m見方以上的空間,中觀指25~110m見方的空間,微觀指25m見方以下的空間[20],微距在此指的是特寫照片。
3)多標簽-圖像內容:Vision API基于預訓練的機器學習模型,為每張照片返回帶有置信度得分(0~1)的關鍵詞標簽[12]。通過設定為每張照片添加最多10個關鍵詞標簽,得到初始多標簽數據庫。提取所有置信度>0.5分的標簽,并對標簽數據進行檢查,刪除極低頻率出現的標簽(flowerpot,coquelicot等)和與研究需求無關的標簽(botany,symmetry等),歸并相似意義的標簽(grass和meadow,building和architecture等),整合具有相同屬性的標簽(monument,arts等),最后整理得到38個圖像內容識別多標簽(表2)。考慮景觀意象的復雜性和多元性,部分標簽之間存在一定的交叉關系。
表2 圖像內容識別多標簽
在景觀照片數據集中按6.33%的樣本比例,在各層中進行簡單隨機抽樣,共抽樣出1 068張照片,用于Auto ML模型的訓練與評估。首先人工為每張照片添加單標簽與多標簽,并保證每項標簽至少有50張以上照片。其次將標記后的數據集按照80%、10%和10%的比率拆分為訓練集、驗證集和測試集。最后Vertex AI通過監(jiān)督學習,訓練Auto ML模型。
2.3.1 景觀分類模型評估
景觀分類模型的平均精確率為0.946,在置信度閾值為0.5時,精確率為86.8%,召回率為85.2%(圖3),總體來看模型精度較高,各項指標均大于0.85。評估結果表明模型可以較好地分類所有景觀類型,其中對游樂設施、水體景觀、花卉景觀的識別能力最好(置信度>0.95,正確預測比率>85%);但對景觀設施和歷史文化以及水生植物景觀和林木景觀之間存在一定程度的混淆,混淆比率分別為27%和25%,原因可能在于2組景觀要素的部分樣本包含了重疊或相似的景觀內容,考慮到景觀的復雜性和人工識別誤差,該部分誤差可認為是正常結果。
圖3 景觀分類Auto ML模型評估指標
2.3.2 空間尺度分類模型評估
空間尺度分類模型的平均精確率為0.887,在置信度閾值為0.5時,精確率為85.7%,召回率為84.7%,且各項標簽的模型置信度得分均大于0.85(圖4)。評估結果表明模型可以較好地分類所有空間尺度,其中對微距尺度景觀的識別能力最好(置信度得分>0.95,正確預測比率>85%)。
圖4 空間尺度分類Auto ML模型評估指標
2.3.3 圖像內容識別模型評估
圖像內容識別模型的平均精確率為0.834,在置信度閾值為0.5時,精確率為87%,召回率為61.8%(圖5)。由模型置信度得分(圖6)可知所有標簽中置信度>0.5的有35項(占92.1%),即絕大多數標簽滿足模型用于內容識別的要求;置信度>0.8的標簽過半,大于0.95的標簽超過1/4,即模型在精確識別部分標簽方面表現良好。其中模型對花瓣、主題雕塑、摩天輪、臺階、纜車、夜景6項標簽的識別能力最好(置信度=1),對水上棧道、拱橋和落葉樹幾項標簽的識別能力較差(置信度<0.5),原因可能在于部分標簽的樣本量較少及標簽之間存在一定的相似度和交叉關系,使模型學習時遇到困難,導致正確識別該項標簽的比率降低。
圖5 圖像內容識別Auto ML模型評估指標
圖6 圖像內容識別多標簽模型置信度得分
通過圖像標簽分析得到樣本照片的景觀要素單標簽、空間尺度單標簽和圖像內容識別多標簽結果,以此作為歸納景觀意象維度結構的依據。因此湖泊公園的景觀意象可解構為兩大景觀類型、8類景觀要素、4層空間尺度和38項意象元素(見2.1)。
在Vertex AI平臺上通過構建的Auto ML模型對16 883張景觀照片進行批量預測,刪除預測數據中置信度值低于0.5分的樣本數據,最后保留可用于分析研究的15 656張照片數據。
經過整理得到7個湖泊公園景觀類型的感知分析結果(圖7)和景觀要素的感知強度分析結果(圖8)??傮w來看,湖泊公園中自然景觀(60.92%)的感知高于人文景觀(39.08%),其中沙湖公園和月湖公園的自然景觀感知強度尤其高;水體景觀、林木景觀和歷史文化是湖泊公園的核心感知要素,其占比超過所有要素的半成(55.07%)。由此可知,湖泊公園中水景作為最重要的構景要素也是最受人們歡迎的景觀要素,這也反映了人們的親水心理以及對自然風景的向往很大程度上影響了其感知偏好;除此之外,歷史文化得到高度感知的原因在于其代表了城市重要的景觀風貌,武漢市作為國家歷史文化名城,楚文化的重要發(fā)祥地,城市多處旅游地的風景、建筑都展現著濃厚的人文歷史風貌,引起了游客的強烈感知。其次,由于每個公園的自身定位和景觀特色差異較大,每個公園的特性感知要素也不盡相同(表3)。
圖7 景觀類型感知分析
圖8 景觀要素感知強度分析
通過空間尺度分類模型識別景觀照片,分析游客對景觀的空間感知偏好,可得游客對7個公園中宏觀(28.92%)、中觀(28.88%)和微觀(31.52%)3種尺度的景觀感知差異不大,對微距景觀的感知略低(11.34%)。由圖9可得,人們在宏觀(81.21%)和微距(99.94%)尺度上對自然景觀的感知要明顯高于人文景觀,其中以廣闊的水體景觀和特寫花卉景觀為主;在中觀(56.19%)和微觀(56.11%)尺度上,人們對人文景觀的感知略高于自然景觀,其中以開闊的道路環(huán)境、交往尺度下的林木景觀和細節(jié)感強的歷史文化景觀為主。即在湖泊公園的空間感知層面,人們更偏好于空間廣闊深遠的自然景觀和精細化設計的人文景觀。
圖9 景觀意象的空間感知特征
利用圖像內容識別模型識別景觀照片中的意象元素,通過置信度篩選,每張照片保留1~8個標簽,最終得到42 365個標簽數據,平均每張照片分配到2.7個標簽。通過38項意象元素的感知頻率,可得湖泊公園景觀意象元素的感知共性為:常綠樹(25.96%)、湖泊(10.86%)、背景建筑群(7.82%)、草地(6.93%)和倒影(4.90%)的感知最強,這也契合了湖泊公園的景觀特色和現實情況,由于研究地均位于武漢中心城區(qū),建筑密度較高,背景建筑群入鏡景觀照片十分普遍。除去5項共性意象元素外,根據每個公園中感知較強的特性意象元素總結不同公園的感知特性并分析其感知偏好原因(表3)。
表3 湖泊公園景觀意象感知特性分析
本研究以武漢市7個湖泊公園為研究對象,對大數據網絡照片進行圖像挖掘與內容識別,歸納景觀意象的具體維度,通過在線機器學習算法構建Auto ML模型,分析景觀意象的特征及感知偏好。主要結論如下。
1)本研究將景觀意象解構為兩大類型、8類景觀要素、4層空間尺度和38項意象元素,從不同層面分析人們對景觀意象的感知偏好。
2)在感知共性方面,湖泊公園中自然景觀的感知高于人文景觀,其中水體景觀、林木景觀、歷史文化是湖泊公園的核心感知要素;在空間尺度層面,人們更偏好于大尺度的空間廣闊深遠的自然景觀和小尺度的精細化設計的人文景觀;在意象元素層面,游客對湖泊公園中常綠樹、湖泊、背景建筑群、草地和倒影的感知最強;體現了人們對自然風景的向往和對地域歷史文化的認同。
3)在感知特性方面,不同公園的感知偏好差異較大,其中代表公園特色的特異性景觀更容易得到游客的高度感知,表明了景觀特質挖掘與差異化景觀建設的重要性。
4)總體來看,游客對湖泊公園景觀意象的感知偏好表現出自然性與歷史性相結合、同質性與異質性相共存的特征。
景觀意象作為游客主體對景觀客體的認知與情感寄托的載體[1],反映了游客對景觀的感知偏好,其具體內容分析可為研究地的景觀營建與改造提供建議。1)保持自然景觀的本真性,營建開敞的濱水空間。提升濱水空間的親水性,創(chuàng)造可親近自然的休憩景觀場所。2)重視歷史底蘊,提高地域文化感。保留人文景觀的當地原真性,保護公園中的歷史資源并加以改造使之成為公園核心景點,設立文史展覽區(qū)以加強人文科普教育。3)加強公園特色建設,體現公園的異質性。避免千篇一律的景觀建設,基于不同公園的景觀風貌與感知特性,加強差異化景觀的營建與管理。
了解游客心理及其感知偏好對于公園建設和管理至關重要,目前問卷調查是獲取游客偏好最普遍的方法,但該方法存在耗時久、樣本量受限等問題,而網絡開放數據則為研究者提供了一種了解游客景觀偏好的新方式[21],隨著計算機視覺算法的應用,景觀偏好研究已向大規(guī)模定量化分析方向發(fā)展。已有研究表明計算機視覺算法是分析大量圖片內容的有效方法,且不同算法在識別不同目標上的表現存在差異,如Google Cloud Vision算法在識別景觀特征(水、植被、基礎設施等)方面表現較好[22],而Clarifai算法更擅長識別情緒[23]。因此未來可考慮結合多種方法與算法來實現更全面的游客感知偏好研究。
本研究利用Google Cloud Vision提供的在線機器學習算法,構建Auto ML模型分析大量網絡景觀照片,來量化和推斷景觀感知偏好。本研究的結論也得到了相關研究的證實,例如Pe?a L[24]和Tieskens K F[25]等發(fā)現山林、草地和水體景觀更受人們歡迎,Casado-Arzuaga I[26]等表明具有更多自然景觀的地區(qū)有更高的美學價值,其他研究還表明具有農業(yè)區(qū)、山林、水體和過渡植被的區(qū)域景觀連貫性更高,而高的景觀連貫性則有助于提高景觀美學質量[6],這與本研究的結論相一致。除此之外,本研究的結果還表明歷史文化是人們感知偏好的重點,補充支持了Langemeyer J[27]和郭先華[28]等的研究;Junge X[29]等發(fā)現季相變化會影響景觀偏好,其中花卉景觀最受人們喜愛,這也與本研究的分析結果相一致。高度的一致性不僅解釋了計算機視覺算法應用于圖像分析的合理性,也證明了網絡照片數據表征游客景觀偏好的有效性。
大眾網絡媒體可提供大數據樣本用于量化分析景觀意象特征,但由于其更常被中青年群體使用,導致數據存在固有抽樣偏差的局限性,可能無法代表所有公園游客[22]。因此,未來的研究可通過整合多源數據和多種方法來降低用戶偏差的影響,如加入老齡人群調查數據,實現更全面的分析。另外,由于國內網絡媒體中地理信息開源數據不夠完善,本研究使用的網絡照片數據未帶有地理坐標信息,故難以進行景觀意象感知偏好的空間分異分析,日后可深入探討如何實現景觀意象的可視化研究。
注:文中圖片均由作者繪制。
注釋:
① 來源:https://cloud.google.com。Google Cloud Vision提供的操作指南與教程,可參考https://cloud.google.com/vertex-ai/docs/tutorials,Vertex AI 代碼示例可參考https://github.com/googleapis/python-aiplatform/。