韓龍玫, 卿粼波
(1.成都市規(guī)劃研究設計院, 四川成都 610041; 2.四川大學電子信息學院,四川成都 610065)
?
視頻大數(shù)據(jù)在城市公共空間規(guī)劃領域的應用前景探索
韓龍玫1, 卿粼波2
(1.成都市規(guī)劃研究設計院, 四川成都 610041; 2.四川大學電子信息學院,四川成都 610065)
在新型城鎮(zhèn)化的背景下,城市規(guī)劃正在從物質規(guī)劃向以人為本的綜合規(guī)劃轉變,需要在廣度和精細度上更進一步獲取和分析人類活動的數(shù)據(jù);與此同時大數(shù)據(jù)正在推動圍繞人類活動的城市定量研究產生重大變革。視頻大數(shù)據(jù)的分析手段——智能視頻分析技術是一項具有巨大發(fā)展前景的信息處理技術。基于視頻大數(shù)據(jù)的人類理解技術已經取得了重大成果,是規(guī)劃行業(yè)潛在的龐大而重要的數(shù)據(jù)來源。而目前城市規(guī)劃領域的視頻大數(shù)據(jù)研究工作尚屬空白,文章試對視頻大數(shù)據(jù)在城市規(guī)劃領域的應用前景進行分析和探討。文章認為視頻大數(shù)據(jù)具有信息完整、維度豐富和粒度可調三大優(yōu)點,在對城市公共空間中高度動態(tài)化的人類活動場景進行精細化描述方面具有不可替代的優(yōu)勢。在城市規(guī)劃領域中的街道活力評估、公共空間活力評估、公共設施實施效果評價、空間品質評價、旅游空間規(guī)劃等場景中引入視頻大數(shù)據(jù),結合多源數(shù)據(jù)可實現(xiàn)對規(guī)劃目標的實時評估和快速優(yōu)化,推動城市定量研究更進一步。
城市公共空間; 城市定量研究; 視頻大數(shù)據(jù); 視頻分析; 人類理解
在新型城鎮(zhèn)化的背景下,城市規(guī)劃正從“廣度城鎮(zhèn)化”轉向“深度城鎮(zhèn)化”[1],從單純注重物質規(guī)劃轉向以人為本的綜合規(guī)劃,“人性(化)”、“人本”、“宜人”、“活力”、“宜居”等關鍵詞已然成為學術界探討的熱點。在廣度和精細度上廣泛獲取和分析人類活動的數(shù)據(jù)是實現(xiàn)以人為核心的綜合規(guī)劃的基本方法和重要手段[2]。
與此同時,大數(shù)據(jù)正在推動城市定量研究產生重大變革[3]。相對于城市中相對靜止的物質要素而言,瞬息萬變的人類活動難以被觀測、度量和描述。對人類活動數(shù)據(jù)的獲取,傳統(tǒng)方法依靠“現(xiàn)場觀察”和“問卷調查”,費時費力,數(shù)據(jù)采集存在瓶頸,樣本分布的空間與時間尺度非常有限[4],也是城市規(guī)劃學科被詬病為軟科學的軟肋之一。隨著大數(shù)據(jù)時代的到來,城市研究者利用采用人口普查數(shù)據(jù)[5]、手機信令數(shù)據(jù)[6-8]、LBS數(shù)據(jù)[8-10]、公交刷卡數(shù)據(jù)[11-12]、POI[5、8、12-14]等各種大數(shù)據(jù),從多個維度描繪兼顧大尺度小粒度屬性的人類移動和活動,在城市定量研究領域已經有了重大突破。
近年來,整個世界正以難以想象的速度產生大量的視頻。以2013年為例,全球有超過1億個監(jiān)控攝像頭,如果都按720p高清攝像頭計算,每個攝像頭每天產生1G的數(shù)據(jù),那么全球每天將產生800PB+(1億×1G)raw的視頻。如今這個數(shù)字還在呈爆炸性增長。城市公共空間中人類的各種活動被這些攝像設備所記錄,視頻大數(shù)據(jù)是城市規(guī)劃領域潛在的龐大而重要的數(shù)據(jù)來源。相較于已有研究中所采用的大數(shù)據(jù),視頻大數(shù)據(jù)更加直觀準確,在對城市公共空間中高度動態(tài)化的人類活動場景進行精細化描述方面具有不可替代的優(yōu)勢。利用更多類型的大數(shù)據(jù)來描述和分析人類活動是大數(shù)據(jù)時代城市定量研究的必然趨勢,而目前缺少視頻大數(shù)據(jù)的相關研究工作。
本文首先介紹當前基于視頻分析的人類理解(Human understanding)技術的最新研究前沿,進而闡述從視頻大數(shù)據(jù)可以獲得的人類活動數(shù)據(jù)類型,在此基礎上對視頻大數(shù)據(jù)在城市公共空間規(guī)劃領域的應用前景做出分析和探討。
近年來隨著計算機技術、移動互聯(lián)網、人工智能技術、圖像及視頻處理技術的飛速發(fā)展,智能視頻分析技術借助計算機的數(shù)據(jù)處理能力,依托計算機視覺技術的理論支撐,能夠對海量視頻數(shù)據(jù)進行高速分析處理,獲取各種關鍵信息。該技術在公共安全、智能交通、遠程醫(yī)療、智能家居、軍事等領域已經得到廣泛的應用并已發(fā)揮了巨大作用。
隨著視頻傳感器技術、計算機處理技術及半導體存儲技術的飛速發(fā)展,數(shù)字視頻已進入高清時代并向4K或更高分辨率邁進,高清視頻圖像為智能視頻分析提供更多的圖像細節(jié),為進一步提高智能視頻分析算法的準確性和穩(wěn)定性,并對視頻圖像進行更高層次的智能分析提供了更加有效的數(shù)據(jù)源[15]。隨著云計算、大數(shù)據(jù)、存儲技術和設備的飛速發(fā)展,高效處理高清視頻大數(shù)據(jù)并深度挖掘其中包含的海量信息變得可行。
針對基于視頻分析的人類理解,研究者們已經開展了大量工作并獲得了有價值的成果,獲取的數(shù)據(jù)信息可分為個體和群體兩大類,下面按圖1所示的框架展開介紹。
圖1 基于視頻分析的人類理解
1.1 基于視頻分析的個體理解技術
對視頻場景中的人類個體進行理解的主要目的是分析人類自身個體特性,是對場景中人類活動理解的基礎,因此研究者已經開展了非常廣泛的工作,目前主要包括如下幾個方面:(1)個體年齡和性別識別。年齡和性別是人類個體的基本特征,Khryashchev V[16]等采用基于人臉LBP特征和SVM分類的方法實現(xiàn)了基于視頻的人體性別和年齡的算法,性別識別率已經高達94%,年齡識別誤差控制在7歲以內。Levi G等[17]通過將最新的深度學習引入到人體性別及年齡識別,在更大范圍內獲得了更高的性能,且更能發(fā)揮大數(shù)據(jù)分析技術的優(yōu)勢。(2)個體行為識別。個體行為則是人類個體影響社會的關鍵因素,目前相關研究主要在 UCF101[18]和 HMDB51[19]兩大個體行為數(shù)據(jù)庫上面開展,UCF101定義了101種人體行為(如化妝、剃須、拉小提琴、騎自行車、部隊游行等)及13 320個真實視頻片段,HMDB51[19]定義了51種行為(如行走、親吻、笑、握手等)及6 766個真實視頻片段,目前相關研究[20]已經獲得了近87 %的準確性。(3)個體表情識別。表情是人類個體情緒的外在表現(xiàn),目前相關研究[21]主要在CK+數(shù)據(jù)庫(生氣、憂傷、害怕等7種表情,327個視頻)及JAFFE數(shù)據(jù)庫(主要針對東方人的6種表情,213
個視頻)開展,部分研究成果的準確性已經高達97 %(CK+)和89 %(JAFFE)等。
1.2 基于視頻的群體行為理解技術
對視頻場景中的人類群體理解可以在更高層面理解人類活動,近年來獲得大量研究者的關注,其中典型的研究包括如下幾個方面:(1)人流量統(tǒng)計。人流量是反應公共空間人群活動的基本數(shù)據(jù),統(tǒng)計人群流量特別是高密度人群流量(如廣場、商場等)是相關研究領域的重點,Khan S等[22]已經獲得了高達90 %的準確率。(2)群體行為識別。群體行為是體現(xiàn)視頻場景中人群理解的更高層次,相關研究成果可以對人群的聚集程度[23]、異常程度[24]、群體行為[25](如游行、宴會、參觀、音樂會、廣場活動等)等進行理解識別,已應用于智能監(jiān)控、人群管理、公共場所設計等領域。(3)群體情緒識別。群體情緒是反應群體活動特性的又一關鍵因素,Yanhao Zhang等[26]的最新研究表明群體運動模式中的空間相互作用和結構層次能有效地對群體行為中的社交情緒進行評估,其準確性高達87.5 %。
針對城市公共空間的評估、優(yōu)化和改造,人的活動由于瞬時變化大、活動類型多樣化等原因一直存在較大的數(shù)據(jù)獲取瓶頸,時間的滯后和調研數(shù)據(jù)的片面導致規(guī)劃的嚴謹性和評價的客觀性都備受質疑。新數(shù)據(jù)環(huán)境下采用大數(shù)據(jù)方法可以對目標公共空間中人使用情況的長期觀測和記錄,進而實現(xiàn)對規(guī)劃目標的實時評估和快速優(yōu)化,有效改善城市公共空間的品質。
2.1 圍繞度量人群活動的數(shù)據(jù)方法比較
度量人群活動的定量研究方法見表1。
表1 圍繞度量人群活動的城市定量研究數(shù)據(jù)方法
目前圍繞度量人群活動的城市公共空間定量研究的數(shù)據(jù)獲取和分析方法可分為傳統(tǒng)方法和大數(shù)據(jù)方法兩類,如表1所示。傳統(tǒng)方法[27-29]一般為“現(xiàn)場調研加問卷調查”,直觀、維度豐富,在特定空間和時間內對人類活動的描述比較精準,但費時費力無法大面積開展。大數(shù)據(jù)方法主要采用了手機信令、IC卡、LBS、POI、社交網絡數(shù)據(jù)等大數(shù)據(jù),已有研究主要集中在用城市人口分布情況解讀宏觀尺度的城市結構、功能分布、街道活力等,與傳統(tǒng)方法相比在空間和時間尺度上均大大拓展,與此同時研究者也意識到自身存在缺陷[6、10、30]。筆者認為已有大數(shù)據(jù)研究存在以下缺陷:(1)數(shù)據(jù)有偏。目前在城市公共空間研究中的大數(shù)據(jù)幾乎集體濾掉了兒童和老年人這兩類公共空間的頻繁使用者,顯然存在問題。(2)粒度不夠。手機信令只能對一定范圍內的人口分布進行估算,且不能區(qū)分建筑內和建筑外的人群,不能區(qū)分駐足人群和路過人群,數(shù)據(jù)反映的信息與真實情況存在一定差異,故適用于宏觀和中觀層面的分析,在微觀層面顯得乏力。(3)分析方法有偏。僅用人口密度分布單一指標推導城市公共空間活力情況,有失偏頗。(4)信息缺失。基本只能反映“某時段某人從A地到B地”、“某人某時刻在某地”這兩種信息,即“移動”和“到達”,缺失詳細的個體差異化活動信息。(5)定義粗略。通常根據(jù)行為發(fā)生地點類別定義人群行為類型,商業(yè)區(qū)=休閑購物,公園=游憩,無法在微觀層面進一步解構人類行為。
2.2 視頻大數(shù)據(jù)的實質、方法和優(yōu)點
視頻大數(shù)據(jù)的實質是采用直接觀察法,所見即所得,但用“機器眼+機器腦”代替“人眼+人腦”處理海量數(shù)據(jù)。其基本方法為利用城市公共空間重要節(jié)點的監(jiān)控攝像頭和超低衛(wèi)星攝像頭,對目標區(qū)域的人群進行持續(xù)的觀測。通過云智能視頻處理技術對原始視頻進行運動檢測、人體追蹤、人臉識別、姿態(tài)估計等人類理解技術處理,獲得群體行為數(shù)據(jù)和個體行為數(shù)據(jù)。在中微觀層面與其它大數(shù)據(jù)相比,視頻大數(shù)據(jù)在數(shù)據(jù)維度、粒度和完整性方面大大提升,在城市公共空間中高度動態(tài)化的人群活動場景進行精細化描述方面具有不可替代的優(yōu)勢,特別適合微觀尺度的精細化規(guī)劃,可在一定程度上彌補現(xiàn)有大數(shù)據(jù)研究的某些缺陷。
其優(yōu)點在于:(1)信息完整。實現(xiàn)對目標區(qū)域人群的全記錄,避免數(shù)據(jù)有偏。(2)維度豐富。既可以獲得人流量、人群移動速度等群體行為數(shù)據(jù),也獲得路過人數(shù)、停留人數(shù)、年齡構成、活動類型、活動停留時間和活動停留地點、公共空間進出人數(shù)、行人移動速度、表情等精細化的個體行為數(shù)據(jù)。(3)粒度可調。以街道活力為例,是獲取整個城市所有街道一周的人流變化趨勢還是獲取某幾條街道某個時段行人的詳細活動情況,可根據(jù)研究需要確定。
2.3 視頻大數(shù)據(jù)的應用場景及研究范疇
視頻大數(shù)據(jù)結合其它多源數(shù)據(jù)對目標公共空間的人群進行長期觀測和記錄,進而實現(xiàn)對規(guī)劃目標的實時評估和快速優(yōu)化,具有廣闊的研究和應用前景??蓱糜诮值阑盍υu估、公共空間活力評估、設施實施效果評價、空間品質評價等場景,對城市總體規(guī)劃用地布局、商業(yè)設施布局、公共服務設施布局、交通站點布局提供數(shù)據(jù)支撐,特別適合在中微觀尺度的公共空間規(guī)劃(街道、廣場、公園、綠地、社區(qū)等)、公共服務設施規(guī)劃(體育設施、文化設施等)、商業(yè)設施規(guī)劃、旅游空間規(guī)劃等范疇進行輔助方案生成、場景模擬比較、實施效果評價等。下面以三種應用場景為例詳細說明(圖2)。
圖2 視頻大數(shù)據(jù)在城市規(guī)劃的三類應用場景
(1)街道活力評估??砂囱芯砍叨确譃閮深悾喝绻麨榇蟪叨鹊难芯浚缯麄€城市所有街道活力評估,則采集人流量、人群移動速度等群體行為數(shù)據(jù);如果為小尺度的研究,如某城市幾條商業(yè)街的街道活力對比、全國幾個大城市商業(yè)街街道活力對比、某居住區(qū)范圍內所有街道的活力評估等,則采集路過人數(shù)、停留人數(shù)、年齡、性別、停留活動類型、活動持續(xù)時間和心情等個體行為數(shù)據(jù),可參照姜蕾[27]的研究構建多層級的街道活力指數(shù)量化方程式,亦可同時開展橫向對比和縱向對比,實現(xiàn)長時間尺度上街道活力的研究和探討。
(2)開敞空間(廣場、公園等)活力評估。利用地面和空中攝像頭獲取人群行為軌跡、年齡、性別、行為類型、行為持續(xù)時間、心情等數(shù)據(jù),按設施分布將開敞空間劃分為N個片區(qū),分析和評估各個設施的使用情況。比如哪些設施更受歡迎,哪些設施長期閑置,目標人群有沒有享受到設施提供的服務,設施是否被某一類活動長時間侵占導致不公等。
(3)公共設施(體育設施、文化設施、社區(qū)中心等)實施效果評價。利用出入口的攝像頭,獲取進出人數(shù),區(qū)分年齡構成、(非)工作日、高峰時段,從視頻中識別出個人特征,還可以得出每一類人群的使用時長??稍u估公共設施在工作日和非工作日的使用情況,是否存在長時間的閑置,高峰期是否存在較長的排隊等候,不同年齡段的人使用場館所占的比例等。
研究范疇可著眼但不限于以下幾個方面: (1)數(shù)據(jù)挖掘方法。比如視頻檢索、視頻分析技術、編碼解碼技術等,可將量化方程式做成模塊嵌入云智能處理設備進行實時處理以提高效率。(2)多元數(shù)據(jù)整合??紤]樹木、構筑物的遮擋問題,視頻大數(shù)據(jù)可與GPS、手機信令等其它大數(shù)據(jù)相校核;整合氣象、空氣質量等跨域數(shù)據(jù)探討在不同場景下的數(shù)據(jù)變化趨勢及原因等。(3)分析模型。探討和建立適合微觀尺度人群行為模式的分析模型。(4)可視化。視頻大數(shù)據(jù)豐富的信息維度使其可視化工作具有很大的探索空間。(5)信息安全。如何利用信息開展研究又不暴露個人隱私,比如可對海量原始視頻進行嚴格管控,云設備通過技術手段處理、計算和儲存不帶有精準個人信息的數(shù)據(jù),用戶利用終端設備與其進行交互,嚴格保護個人隱私。
視頻大數(shù)據(jù)具有信息完整、維度豐富和粒度可調三大優(yōu)點,在城市公共空間中高度動態(tài)化的人群活動場景進行精細化描述方面具有不可替代的優(yōu)勢。在大數(shù)據(jù)支撐的城市定量研究中,視頻大數(shù)據(jù)既能在宏觀和中觀層面做出補充,又能在微觀層面填補空白。視頻大數(shù)據(jù)在城市規(guī)劃中的具體應用有待進一步的挖掘和思考,具有相當?shù)难芯壳熬?。作為跨學科合作的典范,需進一步研究數(shù)據(jù)挖掘方法、數(shù)據(jù)處理方法、分析模型和可視化方式,助力城市定量研究。
[1] 仇保興. 深度城鎮(zhèn)化——“十三五”期間增強我國經濟活力和可持續(xù)發(fā)展能力的重要策略[J]. 城市發(fā)展研究, 2016, 22(1):45-46.
[2] 龍瀛, 沈堯. 數(shù)據(jù)增強設計——新數(shù)據(jù)環(huán)境下的規(guī)劃設計回應與改變[J]. 上海城市規(guī)劃, 2015(2):81-87.
[3] 龍瀛, 吳康, 王江浩,等. 大模型:城市和區(qū)域研究的新范式[J]. 城市規(guī)劃學刊, 2014(6).
[4] 秦蕭,甄峰,熊麗芳, 等.大數(shù)據(jù)時代城市時空間行為研究方法[J].地理科學進展, 2013, 32(9):1352-1361.
[5] 龍瀛. 中國人口密度的時空演變與城鎮(zhèn)化空間格局初探:2000-2010[C]// 2014中國城市規(guī)劃年會, 2014.
[6] 龍瀛,周垠.街道活力的量化評價及影響因素分析——以成都為例[J].新建筑, 2016(1).
[7] 方家, 王德, 謝棟燦,等. 上海顧村公園櫻花節(jié)大客流特征及預警研究——基于手機信令數(shù)據(jù)的探索[J]. 城市規(guī)劃, 2016, 40(6):43-51.
[8] 茅明睿, 儲妍, 張鵬英,等. 人跡地圖:數(shù)據(jù)增強設計的支持平臺[J]. 上海城市規(guī)劃, 2016(3).
[9] 冉斌, 邱志軍, 裘煒毅,等. 大數(shù)據(jù)環(huán)境下手機定位數(shù)據(jù)在城市規(guī)劃中實踐[C]// 2013中國城市規(guī)劃年會, 2013.
[10] 郝新華, 龍瀛, 石淼,等. 北京街道活力:測度、影響因素與規(guī)劃設計啟示[J]. 上海城市規(guī)劃, 2016(3):37-45.
[11] 龍瀛, 張宇, 崔承印. 利用公交卡刷卡數(shù)據(jù)分析北京職住關系和通勤交通形態(tài)[J].地理學報,2012, 67(10): 1339-1352.
[12] Long Y, Han H, Tu Y, et al. Evaluating the effectiveness of urban growth boundaries using human mobility and activity records[J]. Cities, 2015, 46:76-84.
[13] 李苗裔, 龍瀛. 中國主要城市公交站點服務范圍及其空間特征評價[J]. 城市規(guī)劃學刊, 2015(6).
[14] 秦蕭, 甄峰, 朱壽佳,等. 基于網絡口碑度的南京城區(qū)餐飲業(yè)空間分布格局研究——以大眾點評網為例[J]. 地理科學, 2014(7):810-817.
[15] 周立. 智能視頻分析技術的發(fā)展現(xiàn)狀與趨勢分析[J].智能建筑與城市信息, 2010(9):79-81.
[16] Khryashchev V, Priorov A, Ganin A. Gender and age recognition for video analytics solution[C]// Applied Imagery Pattern Recognition Workshop. IEEE, 2014:1-6.
[17] Levi G, Hassncer T. Age and gender classification using convolutional neural networks[C]. Computer Vision and Pattern Recognition, 2015.
[18] Soomro K, Zamir A R, Shah M. UCF101: A Dataset of 101 Human Actions Classes From Videos in The Wild[J]. Computer Science, 2012.
[19] Kuehne H, Jhuang H, Garrote E, et al. HMDB: A Large Video Database for Human Motion Recognition[C]// International Conference on Computer Vision. IEEE, 2011:2556-2563.
[20] Shi F, Laganiere R, Petriu E. Gradient Boundary Histograms for Action Recognition[C]// Applications of Computer Vision. IEEE, 2015:1107 - 1114.
[21] Liu P, Tsang I W, Meng Z, et al. Feature Disentangling Machine - A Novel Approach of Feature Selection and Disentangling in Facial Expression Analysis[C]. European Conference on Computer Vision, 2014.
[22] Khan S D, Vizzari G, Bandini S, et al. Detecting Dominant Motion Flows and People Counting in High Density Crowds[J]. Journal of WSCG, 2014, 22(1): 21-30.
[23] Zhou B, Tang X, Wang X. Measuring Crowd Collectiveness[C]// IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2013:1586-99.
[24] Shao J, Chen C L, Wang X. Learning Scene-Independent Group Descriptors for Crowd Understanding[J]. IEEE Transactions on Circuits & Systems for Video Technology, 2016.
[25] Zhao F, Huang Y, Wang L, et al. Learning Relevance Restricted Boltzmann Machine for Unstructured Group Activity and Event Understanding[J]. International Journal of Computer Vision, 2016:1-17.
[26] Zhang Y, Qin L, Ji R, et al. Exploring Coherent Motion Patterns via Structured Trajectory Learning for Crowd Mood Modeling[J]. 2016.
[27] 姜蕾. 城市街道活力的定量評估與塑造策略[D]. 大連理工大學, 2013.
[28] 徐磊青, 康琦. 商業(yè)街的空間與界面特征對步行者停留活動的影響——以上海市南京西路為例[J]. 城市規(guī)劃學刊, 2014(3).
[29] 王俠, 馬遠航, 楊萌. 基于游客時空行為的麗江甘海子旅游服務中心改造規(guī)劃[J]. 規(guī)劃師, 2014(9):47-52.
[30] 楊振山, 龍瀛, Nicolas DOUAY. 大數(shù)據(jù)對人文—經濟地理學研究的促進與局限[J]. 地理科學進展, 2015, 34(4):410-417.
韓龍玫(1984~),女,碩士,高級工程師,從事城市規(guī)劃設計工作;卿粼波(1982~),男,博士,副教授,從事圖像處理、模式識別、視頻分析等領域的研究工作
TU984.11+3
A
[定稿日期]2017-01-08