行业动态
en
新闻动态
news information
首页 > 新闻动态 > 行业动态 > 详情
李瑞敏:交通大数据背后的真相

楔子

         近日业余做了一件事情,具体不去阐述,大概如下:某一个路口(编号为A)近期安装了检测器,具有良好的流量采集水平,故在京远程分析处理了下然后给了个配时的建议,选择早晚高峰进行了测试,从视频看、从路况看,相应时段还是有一定的优化效果,但是在某部门给的日常监测中,几无向好趋势,纳闷之余对比了一下其他路口,突然发现另有 B 路口,无论是实际感受、还是视频监控等,显示都比 A 要更堵,但是在监测中却是比 A 好的明显,再对比一下不同来源数据,由此禁不住怀疑,“脑”们的数据都是对的吗?

数据的准与不准

        近年来,基于大数据的“大脑”等已经流行,基于“大数据+AI”的其他各种“超脑”、“云脑”等也雨后春笋般的不断涌现,功能纷繁复杂、令人眼花缭乱。

        然而另一方面,在实际的工作中,各类“脑”等尚未发挥充分的作用,在大家关注的各类交通问题中,如缓解拥堵、提高安全、改善出行等方面似乎作用有限、场景不足。

        总体来看,无论什么“脑”,其核心基础之一就是数据,是海量的交通相关数据,而近年来在大数据概念的驱动下,似乎在有了量的积累之后,对数据的质的关心却有些不足,再加上从不同视角给出的一些观点(类似舍恩伯格的《大数据时代》中指出的大数据时代的三个转变之一为“更杂:不是精确性,而是混杂性”,认为“允许不精确的出现已经成为一个新的亮点,而非缺点”、“大数据不仅让我们不再期待精确性,也让我们无法实现精确性”等观点),可能使得部分大数据从业人员开始忽略数据的精准性。

        当然,舍恩伯格的书中也指出了“错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有可能长期存在”,只是,是不是有时被忽略掉了呢? 从宏观的交通政策的出台到微观的交通渠化及信号配时优化,无不需要准确的数据的支撑,而现实却是,随着大数据的发展,似乎当数据大了后对精准度的关注不再重要。

        例如看到过众多城市的大数据仪表盘上都有所谓“在途量”等统计参数,很多都是靠卡口识别的,然后以此作为依据,那么这个数据准确性几何?卡口覆盖的范围是否能够不遗漏车辆?卡口的识别准确性又如何?诚然,有了这个数据总比没有好,但是有了数据后也要去精益求精。

        另一方面,各种检测器返回的数据,量越来越大,但是质是否都有所保证?众多安装了大量检测器的路口,却连感应控制迟迟用不起来,是信号机的问题?还是控制逻辑的问题?还是也有数据精度的问题呢?我们的每个检测设备是否都有精细的标定?是否都有持续的精细的标定和质量的监督呢?

数据的多与少

        一方面,现在都在喊“大数据”,交通领域相关数据一经罗列,貌似有好多可以用的数据,似乎数据已经很多很多,众多的单位也都在推广自己的大数据价值。 但是另一方面,很多从事各类具体工作的人员却仍感到数据不足(当然有与其接触到的数据类型、总量有限有关,但也要注意到是否真的现阶段的“大数据”对于很多事情就是足够了的呢?)。

        从微观上而言,做个信号优化,现在有很多用大数据做优化的,但是真正在实施的时候,除了大数据能够在特定场景提供支撑外,众多情况下似乎还是要详细的分转向、分时段的流量数据,在缺乏常规检测器的路口很多时候还是束手无策。

        从宏观上而言,居民出行调查曾经是交通规划的必要基础,大数据的出现也让部分人员开始乐观地认为不再需要繁琐的居民出行调查,但是现实来看,似乎到目前为止难有有效地取代方式。

        虽然已经身处大数据时代,但是经常也会被人问到,“我想做什么什么,但是缺乏需要的数据,该怎么办”,目前看现状确实是表面看起来数据多多,实际用起来却捉襟见肘,因此,如何客观地评价已有数据的量、质及能效,客观定位已有数据的价值,是当前需要理性对待的事情,以便能够更为理性的继续搭建坚实的数据基础。

 数据的用与效

        当有了相对充分的数据或多源数据后,如何用好数据、充分挖掘数据的价值也是非常重要的方面,当然,各个数据拥有者在这方面做的工作都非常多,一种数据从无数的维度进行分析展现,但在与交通工程专业的结合上还有待进一步加强。

        当前看各类指挥中心的数据平台、各个 TOCC 的数据平台,数据种类、数据量都是非常丰富,但是在效用的发挥上又如何呢? 现实中,受制于众多因素限制,在数据平台开发的时候,有时缺乏交通专业领域人员参与,致使精巧展现有余,实用价值不足;在数据平台应用过程中,建设处(科)室(指挥中心、TOCC、科技处(科)等)组织搭建,却缺乏更多业务部门对系统的使用反馈,使得数据平台的价值尚未得以充分的发挥。

        另外,在当前的数据使用上,受制于数据保密、部门割据等问题,实际上的数据共享、开放还是非常不足的,众多的数据躺在了海量的数据库或数据湖中,而被使用的可能只是一部分,其中又产生真正价值的可能更只是凤毛麟角。

        大数据有一个特性就是数据价值密度较低,要真正发挥大数据的作用,需要在浩瀚如海的数据中遨游,从中撷取有价值的知识乃至智慧,一如沙里淘金,而目前淘的机会有限,有能力淘的队伍有限,则价值发挥亦有限。

        通常将数据——信息——知识——智慧作为递进的关系,目前情况则是数据已日渐充足,所能够提取出来的信息也鳞次栉比,但形成的有价值的新知识则凤毛麟角,而智慧更似沧海一粟,难以寻觅。

尾声

        前文虽论调颇为消极,但必须承认,过去数年,交通大数据的利用取得了长足的进步,只是与理想的情况尚有差距。

        未来,首先需要做到的是展示的大屏上的各类数据结果能够是符合逻辑的、是经得住推敲的、是精准的,即无论数据的多少,务必要保证准确、说得通

(目前困境之一:一流的界面展示、二流的功能设计、三流的数据支撑);

        其次,要充分融合实际的业务工作需求,数据科学家与交通工程师、管理人员等要充分交流沟通,共同提升数据平台的应用价值及水平;

        最后,要通过数据的融合、技术的融合、专业的融合等真正从当前和未来的数据中挖掘出交通系统中的智慧来。

(文章选自交通人)