日前,交通运输部科技大讲堂邀请微软研究院主任研究员郑宇博士,带来了题为“大数据和AI驱动城市智能——交通篇”的讲座。大数据的核心是什么、能解决城市交通哪些问题,目前难点在哪?针对这些问题,郑宇带来的城市交通大数据解题思路。
多元数据融合是大数据核心
郑宇认为,大数据的核心并不是要处理很大量的数据,而是要应用多种数据解决实际问题。比如计算一个城市汽车的总排放量,首先面临的难题是算出这个城市中的车流量。因为城市道路中有电子感应线圈的通常不到1%。用路口摄像头计算车流量也比较困难,因为只要摄像头的高度、角度不同,就得重新建立计算模型,工作量非常巨大。所以要计算一个城市的车流量,需要用到出租车GPS数据、路网结构数据、天气数据和周边基础设施数据等,用多元数据建立一个比较复杂的计算模型。
郑宇又举了用大数据监测城市道路异常情况的例子:“车流量增加了10%并不会让我们感觉有什么异常,可当这条路上和周边区域刷微博的人多了10%,共享单车的使用量也增加了10%的时候,大数据就能预测到这条路可能面临拥堵,需要采取措施进行疏导。疏导交通需要找到源头,可能这条路堵,源头是在另一条路或者更远的地方,这时候就需要更多的数据,如轨道交通数据、天气数据、突发事件数据、市内大型活动等数据。”
郑宇表示,用大数据解决问题,经常有人会说数据不够,其实是个思路问题,要放开思路和思维维度,让更多的数据为我所用。大数据是多元数据融合,有时更考验人的视野和想象力,要“既见树木,又见森林”。
既能算道路规划还能算客货运营
从城市道路规划到出租车运营,甚至到城市急救站的设置,大数据都有用武之地。
郑宇举例说:“有些城市拥堵是因为道路规划不科学造成的,大数据计算可以解决这个问题。首先要把城市网格化,形成一个个区域,然后把各区域之间连接线每天的路况特征提取出来,这些特征主要有速度、流量和绕路比等。例如从A到B,如果速度慢,还经常被绕路,说明这两个区域间的交通出了问题,需要重新规划。”
在天津,以前急救中心的设置主要靠人的经验,通过大数据计算后,在不增加任何人和车辆资源的情况下,还是原来的道路,通过改变急救中心的位置,急救车接送病人的时间降低了30%,这也意味着医生有更充裕的时间来救治这些危重病人,挽救更多的生命。拼车最优一直是交通大数据领域的难题之一,前不久高考期间还有考生因为拼车错过了考试时间。目前郑宇博士带领团队建立了拼车最优的大数据模型,运力可以提高10%到15%。如果把人变成货物,该模型还可复制到物流中。
郑宇表示,在城市交通领域,送餐问题是大数据面临的最难的挑战之一,因为送餐涉及到送餐员、餐厅、买家三点联动的问题,三点联动会产生多种选择,这种选择随着业务量的增加呈几何级增加,而且送餐对时间要求更加苛刻。一个成熟的送餐员面对2到3单时还可以用经验算出最优路径,但面对4到5单以上时,人脑就不够用了,必须靠大数据系统来计算。这个问题的解决对于互联网餐饮配送公司尤为重要,甚至可以成为公司的核心竞争力。
人的功能不能被忽视
“在人工智能和大数据领域,计算机深度学习的概念非常热,但在大数据应用领域,人的功能不能被忽视。”郑宇举例说,要在一个区域设置5个充电桩,如何设置才能让充电桩覆盖的范围最大?这是一个复杂的问题,其计算模型是在人机交互中不断调整完善的。首先通过一些简单条件建立模型,计算机会得出一个结果,然后行业专家根据经验对结果进行调整并增加条件,机器根据调整结果和条件进行再计算,行业专家再调整,这样经过几轮的反复,计算模型才会趋于完善和科学。从上面例子可以看出,大数据不仅是计算机深度学习,还有人机交互,互相学习。
“根据银行以往的交易数据,来确定信用卡发卡客户,做的是数据分析员的工作。但如果要弄清设立城市副中心带来交通影响,需要一名数据科学家。一名数据科学家需要7到10年的培养,属于稀缺人才。”郑宇表示,成为一名数据科学家要有深厚的行业知识,知道产生问题的深层次原因;还要了解数据的涵义,视野宽阔,知道社交媒体的数据可以用来解决交通问题;此外还要懂算法和云平台。数据科学家不仅要解决问题,还要想问题,甚至要比政府提前看出问题。
另外,郑宇认为,要解决城市问题包括交通问题,建立城市大数据平台是必须的。在这个平台上,集多元、异构、多模和大规模数据于一体,遇到问题时可以迅速调取数据,建立模型进行计算。