解析|為什麼投放共享單車也需要人工智能?

微信號:數盟

微信號:DataScientistUnion

我們每天都能見到大量的共享單車,有的地方共享單車成排投放,有的地方卻看不到這些小車的身影。對於平台來說,在哪裡投放共享單車、投放多少共享單車是一個值得研究的問題。如果投放車輛的地方沒人需要,那投放效果就會大打折扣;如果人們在需要的地方找不到車,平台也會蒙受損失。

但是怎樣確定哪裡是合適的投放地點呢?單車被騎走到城市的各個角落後,如何調度才能保證它們能被更多人騎到呢?每天都有成千上萬的故障車輛圖片被上報給平台,其中的真假又如何分辨呢?最近,摩拜數據科學家尹大飛進行了一次分享,探討了在解決上述問題中所採用的人工智能手段。

以下是尹大飛的演講記錄,以下為編輯整理:

大家下午好!我是摩拜單車的數據科學家尹大飛,非常有幸在今天下午跟大家在這兒分享一下我們過去幾個月時間在摩拜單車平台上做的一些數據分析和數據挖掘,甚至人工智能方面的一些研究。

今天講座主要講的是我們怎麼樣利用人工智能或者大數據的方法解決經營的問題。因為我們有幾百萬輛車,怎麼樣科學高效調度,幾乎所有關心我們的朋友都會問到這樣的問題。我的演講過程中大家誰有問題可以隨時舉手提問。

我們數據部門不光是支持經營,我們也支持公司的財務部門、客戶部門、包括運維。所以,應該說今天所講的人工智能只是在我們公司一個部門的應用。今天給大家分享的是怎麼樣通過科學的調度方法以及預測方法解決在城市中管理上百萬單車的事情。

首先,經過我們的一段時間經營之後發現,在各個城市每個地區單車供需極度不平衡。比如以我個人為例,我家在酒仙橋蔣台路附近,會發現這個地鐵A口往北是非常密集的工業區,有恒通商業院、有360和58同城等等一系列的大型工業園區。C口是傳統的居住區,每天早上自行車A口很快的被上班的人騎走了,C口的車會往往瘀積。所以我們的數據平台通過簡單分析會發現,A口是一個熱點區域,而在C口是冷點區域。做一些簡單分析以後,其實我們經營同事就已經在我們的指導下優化了投車的方向和投車策略。投車的時候在A口多投一些車輛,C口有意地少投一些車輛。

除了利用歷史數據做一些回歸和策略性的計算之外,還做了一些跟預測相關的事情。大家知道影響單車供需最大的不確定因素就是天氣,天氣中我們沒有區分出來是雨雪、還是PM2.5,還是氣溫、還是風速,經過我們一系列的回歸分析發現,氣溫和降雨對我們的定單影響量的影響是最大的。

氣候變化對訂單量的影響

我們在這兒使用了GDDP,是一個機器學習算法,進行天氣和定單量的預算,藍色的點是實際定單,紅色的點是預測的,大家看到基本預測還是符合這個趨勢的。

摩拜對訂單量的預算

我們的車輛上面有GPS,而且不光是GPS傳感器,還有車輛的電壓傳感器等等監測我們車輛自身狀態的傳感器,我們可以實時知道每輛車到底是不是故障車甚至它有多長時間沒有被騎行。這樣情況下我們會輔助經營人員做一些車輛回收和優化經營的事情。其中還有一個問題就是,如果我們有很多車輛是故障車,那麼怎麼樣回收它?有車輛負責經營。有一個問題就是,我們有很多這樣的調度車輛,怎麼樣去優化它們的路徑。因為每一輛車在城市中間漫無目的的行走非常浪費資源。我們的同事使用的是,先把故障車的位置進行確位,然後再使用一個優化技術,就是讓這些處之間的差異,車輛便利出處的差異最小,使得經營車輛能夠最大化它的經濟效益。

對這些工作我們和史丹佛一些做同類工作的同事進行了緊密的交流和合作。

除了自身的經營人員維護這些單車之外,我們還把經營工作某種程度上外包給了我們的用戶。我們是通過什麼樣的方法外包的呢?就是我們最近發布的一個比較大的功能紅包車,大家在搶紅包的時候有沒有體會到自己搶的紅包金額到底是由什麼樣的因素決定的?事實上我們在紅包的設置上,背後做了一些精細的算法。基本原理就是,如果有一些車是故障車,或者是它經常的不被騎行的話,我們會把它設置成紅包車。這些紅包某種程度上降低了我們的經營費,因為我們每次把犄角旮旯的車找出來難度也非常大。通過紅包激勵,熱心的用戶幫助我們把這些車從一些偏遠的角落,甚至小區裡面移到了熱門的地鐵站附近。

紅包車

還有一個問題,我們有了這麼多車,是不是就可以引導大家把這個車停在一個規範的停車地點,事實上我們也是麼做的,我們用了一個MPL智能電子圍欄設備放到一個指定的區域,引導大家把車停在指定的地點。設置MPL的時候也有一個問題,哪裡設置才是比較合理的呢?設置MPL之初我們通過歷史數據進行了分析,我們是利用一種基於密度的確位方法,對熱門的停車方法進行了分析,所以今天看到的熱門的MPL也是歷史上經常被大家停放的地方的一個中心點。有了MPL智能硬體之後我們可以做一些更多的事情,比如MPL有WiFi甚至今後還可以有一些充電的設施,幫助你臨時充電。

供需預測上我們已經使用了深度學習方法,也使用了Google的tenserFlow基於ResNet開發的,在每個格網中間做了供需預測,從這個曲線圖可以看到,基本上它的預測值和實際值差距在每個格網中間也就相差20輛左右(最大的時候),事實上相對於某些我們競爭對手宣稱的說未來使用tenser Flow,我們早已經在實際生產中使用了。

我們不光是做了一些算法,還有一些成熟的系統在背後支撐著我們的經營,這是我們的摩拜單車經營平台「魔方」,給經營人員每天使用。可以看到這個地圖中心每天車輛使用的實時熱點圖,旁邊是相對,這一個區域的智能報表。如果點擊到某一個區域的話報表緯度會自動縮放到那個區域,你在這兒可以查詢某一條街道,最左上角還可以選擇視線範圍進行查詢。

我們還做了一些跟規範停車相關的工作,就是關於地理圍欄方面的。地理圍欄可能很多人或多或少聽說過,我們這邊是通過我們自己的經營人員,根據一個開放的系統,經營人員可以手動在這上面標識圍欄區域,如果你停到這個裡面是對你的信用分有影響的。

除此之外,還是有很多熱心的用戶幫我們舉報,就是在APP裡面報障下面有個上傳圖片的功能,每天有成千上萬的圖片通過這樣的方式上傳到我們的服務器。我們的客服人員精力非常有限,他怎麼樣識別上萬張圖片呢?我們使用了一個方法,我們再度使用了TenserFLOW,深度學習的方法對圖片進行識別比如右邊這是違停在小區裡的圖片,我們通過學習和積累經驗,現在我們學習的表現已經超過了97%,也就是說有這麼一張圖片上傳到我們的系統,我們有超過97%的概率來判斷它確實是張違停圖片,對拍攝違停照片的人會給予獎勵,把車騎到這違停區域的人我們會進行懲罰。

主要的算法方面就給大家介紹這麼多,我們的研究還在繼續,非常誠摯的歡迎各位能對我們的經營、對我們的算法提出寶貴意見。

媒體合作請聯繫:

郵箱:[email protected]

讚賞

熱門文章