機(jī)器學(xué)習(xí)使我們的工作和生活更加高效和智能。本文分析了如何利用機(jī)器學(xué)習(xí)建設(shè)智慧城市,主要從兩方面進(jìn)行展開:1)分析城市發(fā)生變化的原因;2)機(jī)器學(xué)習(xí)作為一門科學(xué)在智慧城市研究中的應(yīng)用。
機(jī)器學(xué)習(xí)正在幫助城市規(guī)劃師認(rèn)同或反駁長期存在的關(guān)于城市的理論。
為什么某些城市讓人感到安全,而有些則讓人覺得危險?為什么別的城市是美麗的?隨著時間的推移,城市是如何發(fā)展和變化的?最重要的是,我們?nèi)绾瘟炕覀兏兄鞘械目捶ǎ⒂盟鼇砀侠淼匾?guī)劃城市地區(qū)?
麻省理工學(xué)院媒體實驗室集體學(xué)習(xí)小組主任CésarHidalgo花了數(shù)年時間, 他使用眾包數(shù)據(jù)和機(jī)器視覺技術(shù)來建立城市模型,以回答統(tǒng)計和調(diào)查根本無法解答的問題。
Hidalgo的研究表明,人工智能已經(jīng)滲透在我們?nèi)粘I畹姆椒矫婷?,從芭比娃娃到網(wǎng)頁設(shè)計,而且也開始滲透到學(xué)術(shù)研究領(lǐng)域,尤其是在我們在研究智慧城市方面。但隨著這一新興領(lǐng)域的發(fā)展,人工智能也面臨著新的挑戰(zhàn)。
研究人員利用機(jī)器學(xué)習(xí)分析谷歌七年間的街景照片,觀察城市是如何發(fā)生變化的。
是什么使城市發(fā)生變化?
以該小組最近在《美國國家科學(xué)院院刊》上發(fā)表的論文為例。該研究使用了谷歌發(fā)布的五個城市在七年間的街景照片,分析了一些關(guān)于城市復(fù)興的著名觀點。這是一個已經(jīng)被研究了幾十年的關(guān)鍵問題,人們圍繞著幾個學(xué)派關(guān)于如何以及為什么會出現(xiàn)城市復(fù)興的思想進(jìn)行了大量的辯論。Hidalgo和他的團(tuán)隊以160萬張街景照片為對照組,通過機(jī)器學(xué)習(xí)對那些“經(jīng)典”的城市理論進(jìn)行測試。
研究小組發(fā)現(xiàn), 城市積極變化的最大因素實際上是受過高等教育人群的數(shù)量。 而且,整潔的城市和商業(yè)區(qū)也有聯(lián)系,其“安全評分”也一樣。但令人驚訝的是,與某些理論相反的是,收入和住房成本與城市的積極或消極的物理變化沒有關(guān)聯(lián)。Hidalgo在麻省理工學(xué)院新聞中解釋道:“城市復(fù)興這與收入理論無關(guān),也就是說,聚集高收入群體的城市并不代表受教育程度高。”
利用機(jī)器學(xué)習(xí)來加深我們對城市化的理解,類似這樣的研究,我們可以把這門學(xué)科變成一門科學(xué),而不僅僅是一門社會科學(xué)。Hidalgo說:“我希望這個研究能夠幫助我們理解城市環(huán)境對人們的影響以及人們對環(huán)境的影響。這樣我們在制定城市規(guī)劃方案時,我們就會對不同設(shè)計方案有更加科學(xué)的解釋。這些方法還可以幫助我們了解官方數(shù)據(jù)未統(tǒng)計到的增長與變化。”
從社會科學(xué)到科學(xué)
然而,在這種情況下使用機(jī)器學(xué)習(xí)仍然有許多挑戰(zhàn)。 最大的挑戰(zhàn)是什么呢?數(shù)據(jù)。
Hidalgo之前研究使用的數(shù)據(jù)來自于他和同事共同創(chuàng)建的網(wǎng)頁。在網(wǎng)頁上,用戶可以評價街景的安全和美觀程度,從而給研究員提供人們?nèi)绾慰创志暗臄?shù)據(jù)。但是要想全面開展這項研究,他還需要更多的數(shù)據(jù)支撐。到目前為止,他們?nèi)匀灰揽烤W(wǎng)頁用戶的有機(jī)增長來填充機(jī)器學(xué)習(xí)的數(shù)據(jù)。但是要想真正擴(kuò)大樣本容量,Hidalgo表示他們也許會為參與者提供一些報酬。
但是, 這種研究方法的挑戰(zhàn)不會隨著數(shù)據(jù)的獲得而結(jié)束。城市是不斷變化的,動態(tài)的,而且不是每一個圖像都能理想地適用于算法處理。 Hidalgo說,Nikhil Naik是麻省理工學(xué)院Abdul Latif Jameel貧困行動實驗室的博士后,多年來致力于數(shù)據(jù)研究。研究過程中,主要的挑戰(zhàn)是解析谷歌街景圖像,因為即使只有一輛卡車在行駛,也會導(dǎo)致圖像解析前后的巨大差異。而且,該小組還必須考慮季節(jié)性變化,比如地上的積雪和暴風(fēng)雨天氣。
為了修正數(shù)據(jù)中的這些異常,研究人員必須對數(shù)據(jù)庫中160萬個圖像中的每個像素描繪的真實對象進(jìn)行分類。如果有太多的像素被識別為卡車或行人,程序就不會使用那個很精確的圖像,反而在同一街區(qū)將其轉(zhuǎn)換為類似的圖像。這個系統(tǒng)也被設(shè)置為忽略類似于樹木或天空這樣的東西,因為在不同的季節(jié),它們的變化太大,以至于不能得出準(zhǔn)確的變化圖像。
真正的挑戰(zhàn)在于把實驗室的研究成果應(yīng)用于城市建設(shè)。Hidalgo說:“我認(rèn)為兩者結(jié)合的方法在城市規(guī)劃方面是比較常見的。但是,這個方法需要更好地擴(kuò)展,那就是如何將這些方法整合到規(guī)劃者和架構(gòu)師手中。”
機(jī)器學(xué)習(xí)的前景是光明的,正如Hidalgo的工作成果一樣。他認(rèn)為,機(jī)器學(xué)習(xí)將在未來5-10年內(nèi)用于智慧城市的研究。而且變化具有相通性。城市隨著時間進(jìn)行變化,同時也適用于機(jī)器學(xué)習(xí)的傳播。
原文來自:IT時代網(wǎng)