注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Mister.Hu(巷里人家)

Go abroad!

 
 
 

日志

 
 
关于我

A campus photograph palyer,an enthusiastic reader,a solitary writer,a future traffic engineer.

网易考拉推荐

上海交流最终成果总结  

2015-01-09 23:31:04|  分类: Junior |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

在大数据背景下基于手机信令数据的高速公路OD分析及运行状态辨识

本报告以大数据为背景,基于电信公司提供的用户手机信令数据建立了一系列模型与推导体系,总结出高速公路的往返OD量、截面流量、车辆运行速度、路段运行状态、路段异常状态的辨识与求解的方法。

路线选择

暂定选择从武汉到十堰的高速公路进行分析。

沿途经过了武汉(WH-孝感(XG-随州(SZ-襄阳(XY-十堰(SY)共五个城市,一共有4link。如果数据量过大,可考虑只选取其中一部分进行分析。

数据提供

公司可以提供的数据包括:

1、各城市之间的全局OD数值。形式如下:

 

WH

XG

SZ

XY

SY

WH

——

 

 

 

 

XG

 

——

 

 

 

SZ

 

 

——

 

 

XY

 

 

 

——

 

SY

 

 

 

 

——

2、高速公路各路段基站集合。

3、通过高速公路的手机用户信令数据及每个用户的OD,形式如下:

用户ID

手机伪码

基站ID

基站经纬

出行OD

时间戳

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

OD量分析

OD调查分为三块进行,即:

1.  不进行路段匹配时的两点全局OD量分析

2.  将数据匹配到高速公路上后,对高速公路的子OD量分析。

3.  将数据匹配到高速公路上后,对数据进行时段划分,计算不同时段不同路段的交通密度。

现全局OD量不需处理便能得出。对于高速公路的子OD量及交通密度,由于公司已经给出通过高速公路的手机用户信令数据及每个用户的OD,因此对于23块的得出,仅需做一个数据的筛选与叠加即可。

思路:(表格使用字段:手机伪码、出行OD、时间戳、基站经纬度)

1)按照手机伪码将所有伪码相同的信令数据划分为一个用户。

2)设定需要计算的O点与D点,如为WH-XG

3)对所有ODWH-XG的用户进行筛选。

4)3)中的用户进行计数即得到高速公路的子OD量。

5)开始计算各时间段内各路段交通密度,步骤如下:

1.   确定计算时段,如为9:00AM-10:00AM

2.   将所有ODWH-XGWH-SZWH-XYWH-SY的用户手机信令数据筛选出来。

3.   3.中得到的数据按照9:00AM-10:00AM对时间戳进行截取筛选。

4.   4.得到的用户手机信令数据进行匹配处理。处理方法:

a)   找出WHXG进出高速公路的起讫点的经纬度;

b)   将用户手机信令数据的基站经纬度与起讫点经纬度进行对比;若手机信令数据对应的基站经纬度在起点(WH)与端点(XG)的经纬度之间,则提取出来储存到一个组里。

5.   得出在该指定时间内所有通过该指定路段的手机用户的信令数据集合。

6.   5.中数据集合进行计数,得出指定时间内所有通过该指定路段的手机用户数。

7.   将该数目除以路段长度即得到指定时间内该路段的交通密度。

6)按照设定的时间段(与之后的1h对应)分别对属于该时间段的信令数据进行计数(如白天和晚上),得出不同时间段该高速路段的用户数,并与路段长度相除得到路段在该时段的交通密度。

7)循环计算出所有路段的子OD量及交通密度。

注意:展示过程中,在阐述我们如何从全局OD量内的手机用户信令数据中得到通过高速公路的手机用户信令数据时,步骤应当按照下面所述进行:

1、以每两个城市节点之间为路段,得出相应高速公路的基站集合[高速公路路段基站集合](需要使用软件ARCGIS

1)ARCGIS上绘出高速公路,同时标定高速公路附近的基站位置。

2)ARCGIS上对高速公路做Buffer线,然后将Buffer线内的基站截取出来即为总的基站集合,设为[高速公路路段基站集合]

2、得出每个手机用户的基站集合[手机用户出行基站序列集合]

1)对全局OD内的手机数据进行排序,以手机伪码为排序关键字。

2)对基站LAC&CELL值(后文所述的基站ID即指基站LAC&CELL值)相同的手机信令数据进行剔除。

3)对每一个伪码对应的基站集合进行组合,得出的集合即为[手机用户出行基站序列集合]

3、将集合[高速公路路段基站集合](暂设为A与集合[手机用户出行基站序列集合] (暂设为B进行相似性匹配:(需要使用软件VCACCESSVB

1)将集合A与集合B的数据导入数据库中。

2)编写程序,引用数据库中数据并进行交集运算。

运算思路:确定一个匹配成功值X,将B分别与A进行比较,判断B中元素属于A集合的个数,设为YcountB集合中元素个数Z。如果Y/Z大于等于X,则将集合B记入高速公路OD量。

匹配成功值X的确定:X50%100%做梯度递增,并分别计算出在该X值下所有手机(以伪代码为关键字)的匹配成功频数,做出“X-频数”曲线图,以85%位频数值对应的X为最佳X

3)得出的数据为每一个路段的OD量。

而事实上,这三步公司已经做好了。通过这几步,可得出通过高速公路各路段的手机用户信令数据。

下面继续介绍在得到OD量、子OD量与交通密度之后的分析过程:

1、OD量结果的分析:

1)绘出各城市间一周内平均静态往返OD图,可得出各城市间吸引强度的指标(往返值之比)。

2)绘出各城市间一周内不同时间段(如白天和晚上)的高速公路交通密度图,可得出不同时间段不同路段的交通密度变化曲线。

3)绘出各城市间全局OD与高速公路OD量的对比图,比值可作为高速公路贡献度的指标。

2、成果展示:

1)全局OD流量展示图。

2)不同时间的动态各路段交通密度展示图。

3)各城市间的联系强度图。

4)高速公路在整个运输体系中的贡献度。

运行速度

求解运行速度的具体步骤阐述如下:

1、计算区间的选定

暂定两城市之间路段为一个判别运行状态、计算速度的区间。同时应考虑剔除进入高速公路与离开高速公路前后的交织段。

在展示过程中,可以强调,在数据处理能力许可的前提下,只需将计算区间缩小,便能得到更精确实用的运行速度及其他交通元素。

2、计算时间的选定

暂定最小时间颗粒为1h,此项数据值应根据最终拿到数据的时间更新周期与车辆通过空间LAC跨度时所需时间进行比较,取两者之大者作为计算时间段。

3、数据处理

1)确定计算路段,如为WH-XG

2)确定计算时段,如为9:00AM-10:00AM

3)将所有ODWH-XGWH-SZWH-XYWH-SY的用户手机信令数据筛选出来。

4)3)中得到的数据按照9:00AM-10:00AM对时间戳进行截取筛选。

5)4)得到的用户手机信令数据进行匹配处理。处理方法:

a)  找出WHXG进出高速公路的起讫点的经纬度;

b)     将用户手机信令数据的基站经纬度与起讫点经纬度进行对比;若手机信令数据对应的基站经纬度在起点(WH)与端点(XG)的经纬度之间,则提取出来储存到一个组里。

6)得出在该指定时间内所有通过该指定路段的手机用户的信令数据集合。

可见其处理流程与之前在计算不同时间段内路段交通密度是时完全相同,即,其数据可以直接从上面的结果中引用。

4、数据分类

对筛选出的信令数据进行分类,分类标准为:

1)时间戳起终点都不在路段内的车辆;

2)时间戳的起终点只有一个在路段内的车辆;

3)时间戳的起终点都在路段内的车辆。

据初步推测估计,由于选择路段较长,考虑到期间穿过的LAC较多,每个用户在该路段间产生的信令数据应该较多,即情况a)b)所占比例较小,可以剔除。

5、速度计算

直接对第三步中得到的指定时间内所有通过该指定路段的手机用户的信令数据集合进行处理。

1)将数据按时间戳排序;

2)按时间筛选出最靠近路段起终点的信令数据;

3)以2)中的起终点对应的基站经纬度计算车辆距离。

在此过程中,讨论出的另外两种思路是:

a)   根据起终点对应的多个基站折线长度计算车辆距离。

b)   将基站投影到路段矢量图上后再通过在ARCGIS对两投影点之间的路段矢量图进行折线拟合,求出拟合后折线段长度。

4)将2)中对应的最靠近路段起终点的信令数据的时间戳相减;

5)将3)/4)得出单车运行平均速度;

6)将计算出的单车平均速度做一个曲线分布图,取置信区间;

7)以起终点相距长度所占路段距离的比重为权重,对单车平均速度进行加权(可考虑引入神经网络模型);

8)得到最终的路段平均速度。

运行状态

在求解出运行速度后,运行状态的判别就显得比较简单了,其关键在于如何确定一个合理的划分标准以及如何验证其准确性。

可按照美国标准、GB以及武汉市参考标准(即北京市标准)同时对得出的运行速度进行划分,得出不同的拥堵等级。

验算的方式有:

1)通过查询该时间段内网上的路况数据进行对比。

2)通过VISSIM仿真,将仿真结果与之进行对比。

仿真步骤为:

a)  设定一条高速公路,路面设计与WH-SY相同。

b)  将高速公路沿线基站以检测器的形式设置在高速公路两侧。

c)  300040005000pcu/h的交通量设定高速公路入口流量。

d)  将检测器捕获的车辆经过的时间导出。

e)  在该时间上人为加一个随机变量因子。

f)  将得出的位置及随机时间戳数据导入到之前的模型中计算中仿真模拟速度。

g)  将该仿真得出的速度按照相同的划分标准进行路段划分,得出仿真状态下的拥堵等级。

h)  将两种拥堵等级进行对比。

异常状态

在对异常状态的判别中,可以按照下面三种方法来做。

方法一:

与历史数据做比较。求出历史数据平均值,将需判别时间段内的速度与该平均值做差再做比,判断是否超过阈值,阈值可通过查找标准值来确定。方法简单,但缺乏严谨与新意。

方法二:

相邻路段(主要考虑下游)的运行速度与历史相邻路段运行速度进行对比。需要神经网络的支持,计算难度大,暂不考虑。

方法三:

通过对之前时间段内的运行速度做预测后再进行对比。考虑到对于一个用户而言,在时间序列模型中可能需要的数据不够,应做数据细化处理。整个步骤如下:

1)假设已有周五10:00之前的手机用户数据。需判断周五10:00-12:00内指定路段是否出现异常状态。

2)周五6:00-8:00内该路段的平均速度可由前面步骤得出。

3)现将时间调至6:15-8:15,重复计算速度步骤,可得出6:15-8:15内该路段的平均速度。

4)继续滚动计算,可得出6:30-8:306:45-8:45······8:00-10:00一系列时间段内该路段的平均速度。

5)以这些数据为输入数据,可根据时间序列预测模型预测10:00-12:00内该路段的平均速度。

6)10:00-12:00实际计算出的该路段平均速度与预测得到的速度进行做差再做比,判断是否超过阈值(阈值可通过查找标准值来确定)。

7)根据判别情况可得出是否出现异常状况。

判断完异常状况后,还需对判断的正确性做出验证,验证过程可通过查询该时间段内网上的真实路况数据进行对比。

总结分析

1、    项目亮点:

a)  以当前交通领域的热点研究方向BIGDATA为背景,立足点高。

b)  采用的数据源自手机用户产生的信令数据,对基站以及手机本身都完全不需要再做改造,可直接对通讯公司已有数据进行操作处理。

c)  可以通过公司获取到湖北省所有电信用户的手机信令数据,数据充足而且质量高。

d)  在对数据的处理过程中,采用了多种软件进行建模,如ARCGISVISSIMMATLAB;运用了多种数学模型,如神经网络模型、时间序列预测模型;进行了许多编程操作,如VC语言、VB语言。同时整个过程建立在ACCESS数据库的基础上,保证了大数据处理的高效迅速。

e)  通过对大量却杂乱无章的手机信令数据的处理,提取各城市间全局OD量、各城市间高速公路总交通流量、高速路段不同时间段内的交通密度、高速路段不同时间段内的运行平均速度、高速路段不同时间段内的运行状态、并能做到对高速路段不同时间段内的非常态突发异常状态进行判别,符合和谐交通的主题。

f)  对得出的数据进行了二次开发,得出诸如城市联系强度、高速公路贡献度等新的指标。

2、    待完善点

a)  由于学生现有电脑的性能问题,对数据的处理能力尚不足。因此本项目虽然以大数据为背景,但实际处理的数据并没有真正达到大数据强调的“大”的概念,而是在其基础上做了一些简化。

b)  本项目主要提出的一种思维及方法,得出的结果的准确性尚不具备被考证性。因为我们使用的仅为电信手机用户的数据(不包括移动、联通),而且在对数据操作过程中没有进行扩样。

c)  仅仅根据手机信令数据得出的信息本身是有限的,比如,不能得出出行者的运行方式、不能得出精确的交通量(因为手机用户对应人而不对应车辆)。可考虑与其他数据如收费站数据结合处理。

d)  对异常状态的灵敏度尚不足,仅当异常状态发生后会对交通流产生影响时系统才能检测出来,对于小型的车祸或事故,若对路段整体运行速度不产生影响,则无法检测出。

e)  本项目在进行车辆距离计算时,直接利用指定路段内该用户产生的手机信令数据中最靠近路段起终点的基站经纬度计算得出,其精确度有待改进。

 

 

 

  评论这张
 
阅读(95)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016