公交車到站時間預(yù)測方法研究畢業(yè)論文.docx
《公交車到站時間預(yù)測方法研究畢業(yè)論文.docx》由會員分享,可在線閱讀,更多相關(guān)《公交車到站時間預(yù)測方法研究畢業(yè)論文.docx(62頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、2015屆交通運(yùn)輸專業(yè)畢業(yè)論文 重慶601路公交車到站時間預(yù)測方法研究摘 要:隨著中國城市化進(jìn)程的快速發(fā)展,城市交通問題日益嚴(yán)重,發(fā)展城市公共交通是解決現(xiàn)代交通問題的唯一途徑。在眾多的城市公共交通方式中,常規(guī)的公共汽車仍是各個城市客運(yùn)的核心力量。因此,必須從普通出行者的角度出發(fā),考慮他們的實(shí)際需求,才能更有針對性地提高運(yùn)輸服務(wù)質(zhì)量。美國曾針對乘客所關(guān)心的公交信息種類類進(jìn)行問卷調(diào)查,調(diào)查結(jié)果顯示:公交車輛到站時間為出行者最為關(guān)心的信息之一1。所以公交車到站時間的準(zhǔn)確發(fā)布,具有十分重要的意義。本文從大量的先進(jìn)文獻(xiàn)中,總結(jié)了現(xiàn)有的各種公交車到站時間預(yù)測方法的特點(diǎn)。結(jié)合實(shí)際的跟車調(diào)查分析影響公交車到站
2、時間的各個因素,其中主要有駕駛員、車輛、道路、環(huán)境和突發(fā)因素這幾個,對可數(shù)值化分析的因素進(jìn)行了篩選。建立起基于歷史數(shù)據(jù)的實(shí)時修正公交車到站時間預(yù)測模型,并利用重慶市的601路公交車的歷史GPS數(shù)據(jù)對模型進(jìn)行了實(shí)例驗(yàn)證。最后,分析了誤差范圍,證明得出基于歷史數(shù)據(jù)的實(shí)時公交車到站時間預(yù)測模型具有模型簡單易懂、所需數(shù)據(jù)量小、預(yù)測靈活等明顯的優(yōu)勢。關(guān)鍵詞:公交車到站時間;預(yù)測;歷史數(shù)據(jù);GPS 57Study on The Prediction Method for Arrival Time of the 601 Bus in ChongqingAbstract:With the rapid deve
3、lopment of urbanization in China, the problem of urban transportation is becoming serious, and developing urban public transport is the only way to resolve modern transportation problem . Among the numerous public transport modes, the conventional bus is the core strength of the urban passenger tran
4、sport. Therefore, must be from the perspective of an ordinary traveler, considering their actual needs, can be more targeted to improve the quality of transport services. The United States has conducted a questionnaire survey which is about the bus kind of information that passengers concern, the su
5、rvey results show that: the arrival time of the bus station is one of the most concerned information. So accurate bus arrival time of publication has very important significance.Firstly, this paper summarizes the characteristics of various existing methods to predict bus arrival time from large numb
6、er of frontier literature.Combined with the actual bus following investigation and analysis of various factors affecting bus arrival time, which is the main driver, vehicle, road, environment and sudden factors, the numerical analysis of the factors were screened. The real-time correction bus arriva
7、l time model based on historical data is established, and the model is verified by the historical GPS data of 601 bus of Chongqing city. Finally, the error range is analyzed,and the obvious advantages of real-time bus arrival time prediction model based on historical date is proved,such as simple mo
8、del,small data,flexible forecast,etc. Keywords:Bus arrival time; Forecast ; Historical data ;GPS 目 錄中文摘要IABSTRACTII1 緒論11.1研究背景11.2 研究目的及意義11.3 國內(nèi)外研究現(xiàn)狀21.3.1 國外研究現(xiàn)狀21.3.2 國內(nèi)研究現(xiàn)狀31.4 本文研究方法和研究內(nèi)容41.5 本章小結(jié)52 到站時間影響分析與數(shù)據(jù)采集62.1 公交車到站時間影響因素分析62.1.1 路段運(yùn)行時間影響因素分析72.1.2 站點(diǎn)滯留影響因素分析72.2 影響公交車到站主要因素篩選82.3 數(shù)據(jù)采集9
9、2.3.1 數(shù)據(jù)采集設(shè)備車載GPS92.3.2 GPS數(shù)據(jù)的傳輸102.3.3 GPS在交通領(lǐng)域的應(yīng)用102.4 本章小結(jié)113 到站時間預(yù)測模型123 1 到站時間預(yù)測模型原始模型123.1.1 移動平均法123.1.2 指數(shù)平滑法133.1.3 回歸分析法143.2 公交車到站時間預(yù)測模型的建立183.2.1 站點(diǎn)運(yùn)行時間預(yù)測193.2.2 站點(diǎn)滯留時間預(yù)測203.3 綜合預(yù)測模型213.4 公交車到站時間預(yù)測流程213.5 本章小結(jié)224 實(shí)例計(jì)算234.1 數(shù)據(jù)的預(yù)處理234.1.1缺失數(shù)據(jù)的處理234.1.2 錯誤數(shù)據(jù)的排查與更正254.2 數(shù)據(jù)的粗分析264.3 計(jì)算過程294.3
10、.1 站點(diǎn)運(yùn)行時間的計(jì)算294.3.2 站點(diǎn)滯留時間的預(yù)測計(jì)算384.3.3 實(shí)時預(yù)測過程分析454.4 預(yù)測結(jié)果與誤差分析474.4.1 站點(diǎn)運(yùn)行時間誤差分析474.4.2 站點(diǎn)滯留時間誤差分析484.5 本章小結(jié)505 結(jié)論與展望51致謝52參考文獻(xiàn)53附錄 部分GPS原始數(shù)據(jù)551 緒論1.1 研究背景在中國的各大城市中,“擁堵、事故、污染”的交通現(xiàn)狀已經(jīng)成為制約城市經(jīng)濟(jì)發(fā)展的首要問題。想要改變各大城市的這一現(xiàn)狀,實(shí)現(xiàn)城市未來的可持續(xù)發(fā)展,就必須從改善人們的出行方式抓起,切切實(shí)實(shí)大力發(fā)展城市公共交通,改善公共交通的服務(wù)質(zhì)量,讓更多的人能夠從公共交通的出行當(dāng)中獲取滿意的服務(wù)。常規(guī)的城市公共
11、汽車是一種極其常見的公共交通工具,它能在一定程度上滿足多種出行目的乘客的需要,它以其低廉的運(yùn)價、龐大的車輛數(shù)目、較低的建設(shè)成本,成為了城市客運(yùn)的“領(lǐng)頭羊”。盡管如此,我國的公共汽車客運(yùn)的發(fā)展仍然任重道遠(yuǎn)。就目前而言,相當(dāng)部分的城市公共汽車的智能化程度較低,依然采用傳統(tǒng)的作業(yè)方式來進(jìn)行運(yùn)營管理,不能緊跟信息化的潮流3。這就需要建立起更加準(zhǔn)確和完善的時間預(yù)測方法體系,以便滿足城市不斷提高的公交出行需求。1.2 研究目的及意義隨著智能交通系統(tǒng)(ITS)的快速發(fā)展,交通管理者面臨了新的挑戰(zhàn)和要求,那就是需要建立起高效、快捷、全面的信息化公交系統(tǒng)。要達(dá)到整個城市公交系統(tǒng)服務(wù)質(zhì)量有所上升的目的,就必須利用
12、好智能公交車系統(tǒng),就必須能夠適時地預(yù)測公交車到站時間。這是因?yàn)楣卉嚨秸緯r間的準(zhǔn)確程度在提高城市運(yùn)輸服務(wù)效率方面有著不可估量的作用,它涉及乘客最切身的時間利益,對出行的及時性提出了更高的要求;同時,它又是公交公司自身對外宣傳形象的良好名片,并且可以作為高效調(diào)度的參考2。此外,公交公司為乘客提供準(zhǔn)確的到達(dá)時間可以提高公交系統(tǒng)的整體運(yùn)營效率、增強(qiáng)公交運(yùn)輸?shù)母偁幜Γ龠M(jìn)公共交通事業(yè)的持續(xù)發(fā)展,緩解城市交通的壓力?;谶@樣的背景,本文通過查閱大量的國內(nèi)外相關(guān)文獻(xiàn),系統(tǒng)地分析了國內(nèi)外關(guān)于公交車到站時間預(yù)測的優(yōu)秀理論,對現(xiàn)有的公交車到站時間預(yù)測方法的優(yōu)劣性和適用性有了一定的掌握。結(jié)合車載GPS裝置采集得到
13、的數(shù)據(jù),并深入公交車的每一個站點(diǎn)調(diào)查,掌握公交到站時間的相關(guān)規(guī)律,分析影響到站時間的影響因素 。建立起基于歷史數(shù)據(jù)的實(shí)時修正公交車到站時間預(yù)測模型。在實(shí)例計(jì)算部分,選取了重慶市601路公交車在2013年12月24日采集到的GPS數(shù)據(jù)作為原始數(shù)據(jù)帶入模型,通過對預(yù)測誤差的分析,來對基于歷史數(shù)據(jù)的實(shí)時修正公交車到站時間預(yù)測模型進(jìn)行評價。全文主要是通過對歷史的GPS數(shù)據(jù)分析,來得到公交車到站時間在時間上和空間上的運(yùn)行規(guī)律。通過對公交車影響因素的分析和篩選,為后期建立歷史數(shù)據(jù)到站時間預(yù)測模型建立提供必要的數(shù)據(jù)支撐,同時,對于實(shí)際數(shù)據(jù)的代入計(jì)算和誤差分析,也在一定程度上驗(yàn)證了基于歷史數(shù)據(jù)的預(yù)測方法的簡單
14、易算、適合較小的數(shù)據(jù)量的優(yōu)點(diǎn)。1.3 國內(nèi)外研究現(xiàn)狀1.3.1 國外研究現(xiàn)狀公交車到站時間的預(yù)測對于整個城市交通系統(tǒng)的作用和意義是不言而喻的,國內(nèi)外的交通工程方面的專家和學(xué)者都對此作了大量的研究,國外的公交車到站時間預(yù)測技術(shù),無論是在理論上還是在應(yīng)用上,都比國內(nèi)的成熟很多。就國外而言,發(fā)達(dá)國家很多城市已經(jīng)將可以預(yù)測到站時間的電子站牌普遍應(yīng)用推廣,但是采用的公交車到站時間預(yù)測方法卻不盡相同。其中,舉以下案例加以說明:澳大利亞的城市悉尼市最早采用公交車到站時間預(yù)測是在其到機(jī)場的快速路上,由于在這樣的快速路上,其他的車輛和環(huán)境的不可控因素較少,所以其建立的模型也較為簡單,是一種修正過的線性化的預(yù)測方
15、法,其原始數(shù)據(jù)的來源是網(wǎng)絡(luò)旅行時間系統(tǒng)(ANTTS,Automatic Network Travel Time System)3。公交車到站時間的預(yù)測在應(yīng)用在倫敦的應(yīng)用情況并不是像機(jī)場高速那么簡單,而是將其應(yīng)用于普通的城市干道,這樣的話其算法也不能利用簡單的線性化的預(yù)測方法,一位來自荷蘭的Edwin M.Reinhoudt和英國的S.A.Velastin巧妙地運(yùn)用動態(tài)卡爾曼濾波代替?zhèn)鹘y(tǒng)靜態(tài)均值算法,使得預(yù)測精度有了明顯的上升4。Wall和Dailey采用的是卡爾曼濾波的方法和原理,利用自動汽車定位技術(shù)AVL來大致估計(jì)車輛的到站時刻。這樣的做法存在著很大的誤差,這是因?yàn)樵谶@個過程中并沒有考慮公交
16、車輛由于上下乘客所帶來的站點(diǎn)滯留時間5。后來的學(xué)者的研究成果總是在不斷總結(jié)前面成果的不足中發(fā)現(xiàn)的,前面利用自動汽車定位技術(shù)由于沒有考慮因?yàn)槌丝蜕舷萝囁鶐淼墓卉囇诱`時間,預(yù)測結(jié)果顯得較為粗糙,Shalaby、Farhan采用了卡爾曼濾波的原理,對車輛的運(yùn)行時間和站點(diǎn)滯留時間分別進(jìn)行了估計(jì),并利用實(shí)際采集到的信息,對該模型進(jìn)行了評估6。Frechette從另外的角度出發(fā),并沒有考慮將到站時間預(yù)測應(yīng)用于快速路或者普通干道,他將眼光放在了大城市里主要商務(wù)活動進(jìn)行的CBD地區(qū),這樣的情況下,公交車輛所受的外界干擾信息會更多,也更加影響公交車輛的可達(dá)性。因此,在建模時,考慮的額外因素會更多,主要考慮的
17、有:交叉口當(dāng)中各個方向流量的比例、轉(zhuǎn)盤數(shù)目、混合車流比例等,預(yù)測的模型是建立在Ebers算法之上的7。Khan的研究跟Frechette考慮方面很類似,同樣考慮影響車輛到站時間的眾多因素,但是由于應(yīng)用的目的地是不同的,Khan考慮的因素包括了:道路的距離、交通流三參數(shù)、路途中的轉(zhuǎn)彎次數(shù)、站點(diǎn)數(shù)量等,結(jié)合這些因素建立起了非線性的回歸模型8。Patnaik等專家考慮到歷史的運(yùn)行數(shù)據(jù)肯定對當(dāng)前的運(yùn)行狀態(tài)產(chǎn)生或多或少的影響,所以,在建立模型時,將歷史的站點(diǎn)運(yùn)行時間作為影響因子來考慮,再結(jié)合當(dāng)前運(yùn)行路況上具體的信息建立起回歸模型9。Amer Shalaby、Ali Farhan這兩位專家通過自動車輛定位
18、技術(shù)和電力轉(zhuǎn)換公司得到的數(shù)據(jù)進(jìn)行試驗(yàn),對加拿大多倫多市的公交到站時間運(yùn)用VISSIM軟件進(jìn)行了仿真模擬,并且得到了意想不到的結(jié)論10。此外,公交車到站時間預(yù)測技術(shù)在亞洲的日韓也取得了一定的研究成果。在韓國,專家Taehyung Park和他的團(tuán)隊(duì)運(yùn)用的是相對智能化的學(xué)習(xí)方法人工神經(jīng)網(wǎng)絡(luò)法來對公交車到達(dá)時間進(jìn)行建模分析,并且每隔一個星期對實(shí)際值和估計(jì)值進(jìn)行模型校對,以此提高預(yù)測精度11。日本研究人員的方式更顯先進(jìn),因?yàn)樗麄兝玫氖茿utomatic vehicle identification system(車輛自動識別系統(tǒng))來記錄當(dāng)前的交通狀況,并通過查找歷史的數(shù)據(jù)庫中與當(dāng)前的交通狀況最相似的
19、信息來當(dāng)作當(dāng)前的車輛運(yùn)行時間12。1.3.2 國內(nèi)研究現(xiàn)狀就目前國內(nèi)而言,公交車到站時間還基本處于理論研究階段,將公交車到站時間預(yù)測應(yīng)用于電子站牌的城市少之又少,一些城市的部分線路的公交車電子站牌只是發(fā)布到站的距離和站點(diǎn)數(shù),并沒有發(fā)布到站的具體時間。吉利大學(xué)的楊教授課題組:包括了朱中、初連羽等人,利用較多的公交站點(diǎn)影響因素作為模型的輸入量,通過模糊回歸的模型,做了預(yù)測軟件進(jìn)行實(shí)時的交通信息預(yù)測站點(diǎn)運(yùn)行時間,因?yàn)榫哂袑?shí)時性,所以預(yù)測精度明顯。此外,楊教授等還將快速道的誘導(dǎo)裝置轉(zhuǎn)移到公交汽車上面來13。周雪梅、王磊等利用GPS等先進(jìn)設(shè)備,將采集到的歷史數(shù)據(jù)作為支撐,綜合聯(lián)想到干擾到站時間預(yù)測的多個
20、因子,最終建立起以不同站點(diǎn)為單元的到站時間影響系統(tǒng),并利用某市的歷史數(shù)據(jù)進(jìn)行了實(shí)例研究14。總的來說,國內(nèi)目前的到站時間預(yù)測分為兩個大的方向:一個方向是通過軟件或者先進(jìn)到達(dá)交通實(shí)況采集設(shè)備,運(yùn)用一定的機(jī)器學(xué)習(xí)方法來實(shí)時預(yù)測公交車輛到站時間;另外一個方向則是以歷史數(shù)據(jù)為源,考慮當(dāng)前路段與歷史運(yùn)行路段的關(guān)系,來建立起相關(guān)模型?,F(xiàn)有的研究成果從不同的角度建立了公交車到站時間預(yù)測模型,通過綜合地對比,不難發(fā)現(xiàn)各種模型各有其優(yōu)缺點(diǎn),其適用范圍也不盡一致,現(xiàn)將各種模型的優(yōu)缺點(diǎn),適用性概括如下:1、基于歷史數(shù)據(jù)的模型是這些模型當(dāng)中最為簡單的一種,并且計(jì)算速度也是最快的,但是該種方法是基于歷史數(shù)據(jù)的,實(shí)時性相
21、對較差,適合郊區(qū)公路或者非高峰時期的時間預(yù)測;2、回歸預(yù)測模型也是相對較為簡單的一種,它綜合考慮影響公交車到站的各個因素,通過將各個影響因素數(shù)值化,預(yù)測站點(diǎn)運(yùn)行時間和站點(diǎn)滯留時間,該方法具有很強(qiáng)的適用性,也相對于較簡單;3、神經(jīng)網(wǎng)絡(luò)模型是一種模仿人的神經(jīng)元的機(jī)器學(xué)習(xí)模型,它能夠處理非常復(fù)雜的非線性函數(shù)關(guān)系,通過大量的輸入數(shù)據(jù),來尋找這些數(shù)據(jù)之間的依賴關(guān)系,這是一種相對復(fù)雜的方法,因此在它預(yù)測精度較高的背后也是它的局限性,在使用神經(jīng)網(wǎng)絡(luò)模型時,常常難以確定神經(jīng)節(jié)點(diǎn),并且系統(tǒng)容易造成過學(xué)習(xí)和欠學(xué)習(xí)的狀態(tài);4、卡爾曼濾波模型是一種基于遞推算法的模型,所以它的實(shí)時性是很好的,也適合處理高維問題和非平衡
22、過程,但是在預(yù)測較長路徑時,采用多步預(yù)測的精度會下降明顯,所以適合的是多路徑的時間預(yù)測;5、支持向量機(jī)是一種具有很強(qiáng)的學(xué)習(xí)能力的學(xué)習(xí)機(jī),它也同樣適合復(fù)雜的線性關(guān)系,但是由于在整個過程當(dāng)中,需要很大規(guī)模的數(shù)據(jù),在實(shí)際應(yīng)用中很難滿足,由于其本身的模型結(jié)構(gòu)太過復(fù)雜,很難準(zhǔn)確確定核函數(shù),并且計(jì)算相當(dāng)耗時,使得該方法難以大規(guī)模推廣;6、基于概率的預(yù)測模型,相較于回歸模型而言,它更加充分地考慮到了在車輛運(yùn)行途中的不確定因素,但是該模型同樣需要大量的數(shù)據(jù)支撐,并且整個模型的可移植性較差,因此只是適合不確定性因素影響下的時間預(yù)測。1.4 本文研究方法和研究內(nèi)容在對國內(nèi)外公交車到站時間預(yù)測方法地充分理解上,本文
23、系統(tǒng)而全面地總結(jié)了目前國內(nèi)外常用的各類預(yù)測方法的優(yōu)缺點(diǎn)、適用性,以及各種模型對原始數(shù)據(jù)的要求。結(jié)合實(shí)際的公交車跟車調(diào)查的分析,總結(jié)得出影響公交車到站時間的因素,除了常見的人、車、路的影響外,還包括在時間上是否處于高峰期、是否處于周末節(jié)假日,以及季節(jié)性、天氣等因素的影響。通過對這些因素的綜合整理,建立起基于歷史數(shù)據(jù)的實(shí)時修正公交車到站時間預(yù)測模型。最后本文以現(xiàn)有的重慶公交601路公交車在2013年12月24日上午6:00:408:50:23每隔10秒發(fā)送回來的25組公交車GPS數(shù)據(jù)為研究原始數(shù)據(jù),利用SPSS和EXCEL軟件進(jìn)行原始數(shù)據(jù)的分析,分析公交車到站時間的統(tǒng)計(jì)學(xué)規(guī)律,得出公交車在時間上的
24、準(zhǔn)確程度。獲取來的歷史GPS數(shù)據(jù)證明了基于歷史數(shù)據(jù)的實(shí)時公交車到站時間預(yù)測模型的可行性和有效性,并分析了誤差程度。全文的內(nèi)容結(jié)構(gòu)圖如圖1.1所示。重慶601路公交車到站時間預(yù)測方法研究圖1.1 文章內(nèi)容框架圖1.5 本章小結(jié)本章是全文的緒論部分,首先闡明本研究課題是在解決城市公交擁堵,大力推行公交優(yōu)先的背景上提出來的。當(dāng)下又是智能交通發(fā)展好時機(jī),因此大力推行智能公交有著舉足輕重的意義。公交車到站時間作為乘客最為關(guān)心的信息,在提高公交車服務(wù)質(zhì)量,增加公交車的吸引力等方面有著必不可少的意義。將智能公交的技術(shù)引入公交車到站時間的預(yù)測當(dāng)中是一件自然的事情,因此,本文目標(biāo)便是通過運(yùn)用先進(jìn)的智能公交手段G
25、PS定位技術(shù),實(shí)時獲取公交車到站的原始數(shù)據(jù),為公交管理者進(jìn)言獻(xiàn)策。2 到站時間影響分析與數(shù)據(jù)采集從乘客的角度來分析,出于以下幾種原因會關(guān)注公交到站時間:將要出行時,借助手機(jī)來查詢公交到達(dá)時間,從而選擇最優(yōu)的公交車乘坐方案;出行的途中,已經(jīng)處于公交站牌下,想要知道自己所等的目標(biāo)公交車還有幾個站,還有多長時間到達(dá),借此來緩解心中等車帶來的焦躁情緒。如果時間公交不能及時到達(dá),好改乘出租車等其他方式的交通工具;乘客并不是當(dāng)天出行,需要提前一天查詢第二天或者更久的公交車到站時間,為工作以及其他目的的出行提供時間安排的依據(jù)。綜上,公交到站時間的預(yù)測主要可以分為兩種類型:一種是短時間的到站時間預(yù)測,主要通過
26、電子站牌等形式向乘客發(fā)布,需要乘客到達(dá)公交車站才能獲取相關(guān)的信息;另一種則是長時間的到站時間預(yù)測,主要通過手機(jī)短信,車輛信息網(wǎng)站等方式發(fā)布,它不需要乘客一定要到達(dá)公交車站,直接在家就能獲取相關(guān)信息。相對于短時間的到站時間預(yù)測而言,長時間的到站時間預(yù)測需要更大的數(shù)據(jù)支撐,存在的不可控因素也更多,因此,長時間的公交車到站時間預(yù)測的精度更低。由于數(shù)據(jù)有限,本文研究的方面不可能做到全面,因此主要研究的是短時間的到站時間預(yù)測。2.1 公交車到站時間影響因素分析公交車輛的運(yùn)行過程受多種因素的影響,到站時間同樣是一個或多或少帶有突變和隨機(jī)因素的一個過程。交通工程學(xué)告訴我們需要從人、車、路、交通環(huán)境四個方面來
27、分析交通事件。就公交車運(yùn)行的整個過程的時間組成而言,公交車的到站時間顯然是由車輛的路途運(yùn)行時間和公交車站點(diǎn)的滯留時間這兩個部分組成。因此在分析影響公交到站時間的因素時,應(yīng)該分別從這兩個方面來著手。假設(shè)要預(yù)測公交車在運(yùn)行至i站點(diǎn)的時間,可以用下面的模型:Ai=1i-1Di 2iRi (2iN) (2.1)Di=Li-Ai (2.2)其中: Ai表示公交車在i站點(diǎn)的到站時間; Di 表示公交車在i站點(diǎn)的站點(diǎn)滯留時間; Li表示公交車在i站點(diǎn)的離站時間; Ri表示公交車以i站點(diǎn)為終點(diǎn)的路段運(yùn)行時間。2.1.1 路段運(yùn)行時間影響因素分析道路運(yùn)行時間影響因素可以根據(jù)前文提到的總體分析思路分為人的因素、車
28、輛的影響因素、道路的影響因素和環(huán)境的影響因素。(1)人的影響因素主要包括駕駛員的年齡,性別 ,駕齡,以及反應(yīng)快慢等方面;(2)車輛的影響因素車輛的起步,爬坡和制動性能等。(3)道路的影響因素包括道路通行能力,車道數(shù),道路等級情況,以及途中經(jīng)過路段是否強(qiáng)制限速,有無紅綠燈、交叉口、轉(zhuǎn)盤等。(4)環(huán)境的影響因素主要有天氣情況、是否為周末和節(jié)假日、以及突發(fā)因素如車禍等突發(fā)因素可能造成的影響。2.1.2 站點(diǎn)滯留影響因素分析所謂的站點(diǎn)滯留時間,通俗地講便是不管何種原因,公交車輛在每一個站點(diǎn)耽誤了多長時間沒有行駛。由于目前重慶的公交車均使用公交車專用道,所以影響公交車的站點(diǎn)滯留時間因素主要有:公交車輛進(jìn)
29、出站的排隊(duì)等待時間、便道行為延誤時間、公交車輛的車門數(shù)、上下車乘客的方式和人數(shù),上車乘客車費(fèi)的支付方式等方面。一般認(rèn)為,公交車第i個站點(diǎn)的站點(diǎn)滯留時間主要由上下車乘客人數(shù)來決定15。通常可通過如下公式的線性模型來表示16:(1)單車門的情況Di=b+B*Bi+A*Ai , &Bi0或Ai00, Bi=Ai=0& (2.3)(2)雙車門的情況Di=b+max(B*Bi,A*Ai), Bi0或 Ai0&0, Bi=Ai=0 (2.4)其中:Di表示公交車輛第i個站點(diǎn)開關(guān)門時間及其他損失時間;B、A分別表示公交車輛在第i個站點(diǎn)的平均乘客上、下車時間;Bi表示公交車輛在第i個站點(diǎn)的上車乘客數(shù);Ai表示
30、公交車輛在第i個站點(diǎn)的下車乘客數(shù)。2.2 影響公交車到站主要因素篩選由前面的分析不難知道,影響公交車到站的因素較多,現(xiàn)將能夠用于建模和數(shù)值化的并不是全部的影響因子,各種可以數(shù)值化的影響因素如表2.1所示。表2.1 各種影響因素統(tǒng)計(jì)表因素名稱 量化方式站點(diǎn)運(yùn)行時間道路因素 道路等級 通行能力路段長度有無交叉口紅綠燈車輛的因素 車輛的轉(zhuǎn)彎次數(shù)車輛的時間平均速度人的因素 駕駛員的駕齡性別環(huán)境因素車道數(shù) 是否為高峰期續(xù)表2.1因素名稱 量化方式站點(diǎn)滯留影響因素時間因素 是否為節(jié)假日車輛進(jìn)出站是否排隊(duì)等待 進(jìn)出站平均等待時間車輛在站點(diǎn)的開門關(guān)次數(shù) 開關(guān)門時間上下車客流量 上下車人數(shù)乘客付款方式 人均付款
31、時間在具體地分析時,不可能將每一個因素都一一考慮到,所以應(yīng)該根據(jù)預(yù)測方法的實(shí)際需要,選擇主要影響因素,拋棄次要因素。本文的預(yù)測目標(biāo)是能根據(jù)歷史的GPS數(shù)據(jù),假設(shè)已知車輛某時刻處于某個位置,預(yù)測其到達(dá)后續(xù)某個站點(diǎn)的時間,并根據(jù)前續(xù)站點(diǎn)的實(shí)際到達(dá)時間和實(shí)際站點(diǎn)滯留時間來對到達(dá)的時刻進(jìn)行實(shí)時地修正。就這個目的而言,本文采基于歷史數(shù)據(jù)的二元線性回歸、二次移動平均、二次指數(shù)平滑這三種預(yù)測方法是具有現(xiàn)實(shí)意義的。由于在當(dāng)天的歷史數(shù)據(jù)中,以上分析的各個影響因素均是相同的,如果將影響因素作為預(yù)測模型的變量輸入則不具有參考性。2.3 數(shù)據(jù)采集實(shí)驗(yàn)的所有數(shù)據(jù)均來源于重慶公交車載GPS監(jiān)控系統(tǒng),該系統(tǒng)有兩個方面的功能
32、,分別是定位和控制??刂撇糠值墓δ苤饕怯砂惭b在車上的接收設(shè)備、無線網(wǎng)絡(luò)、控制中心、監(jiān)控平臺這幾個部分來實(shí)現(xiàn)的。2.3.1 數(shù)據(jù)采集設(shè)備車載GPS本文利用數(shù)據(jù)采集設(shè)備是公交車載 GPS終端。獲得主要是所研究的601路公交車在2013年12月24日的上午6::00:40到8:50:23發(fā)車的25個班次每個班次每隔十秒反饋回來的經(jīng)緯度、速度、方向角、路途時間、站點(diǎn)滯留時間等信息。GPS采集數(shù)據(jù)比起傳統(tǒng)的人工調(diào)查具有精度更高、實(shí)時性更強(qiáng)、便于統(tǒng)計(jì)分析等優(yōu)勢。如圖2.1是GPS設(shè)備采集回來的部分?jǐn)?shù)據(jù)。車載裝有GPS接收機(jī)是進(jìn)行GPS定位的前提條件,公交車的GPS接收機(jī)是屬于導(dǎo)航型的GPS接收機(jī),采用C
33、A碼偽距測量17。公交車車載GPS 接收機(jī)主要由天線變頻器、信號通道、微處理器、存貯器、顯示器和電源組成18。2.3.2 GPS數(shù)據(jù)的傳輸GPS 系統(tǒng)的用戶是隱蔽的,因?yàn)樗菃蜗蛐畔⒌膫鬏斚到y(tǒng),用戶只能接受而不能發(fā)射信號20。圖2.1 GPS采集回的部分?jǐn)?shù)據(jù)2.3.3 GPS在交通領(lǐng)域的應(yīng)用GPS 在車輛導(dǎo)航監(jiān)控方面的應(yīng)用利用GPS進(jìn)行車輛監(jiān)控和調(diào)度可以充分利用計(jì)算機(jī)進(jìn)行自動化、智能化的監(jiān)控管理,能迅速處理分析大批量數(shù)據(jù),大大減少了人為誤差及管理人員的工作量。隨著計(jì)算機(jī)和通信技術(shù)的發(fā)展,使得實(shí)現(xiàn)城市公交車輛定位系統(tǒng)成為可能,并可建立起統(tǒng)一的公交車輛管理系統(tǒng),對公交車輛進(jìn)行統(tǒng)一的調(diào)度,實(shí)現(xiàn)科學(xué)、
34、經(jīng)濟(jì)的運(yùn)營管理模式19。GPS 在交通規(guī)劃領(lǐng)域的應(yīng)用1)GPS在交通數(shù)據(jù)采集管理中的應(yīng)用 就現(xiàn)實(shí)而言,重慶市主城的大部分公交車輛已經(jīng)實(shí)現(xiàn)GPS設(shè)備的裝配,該GPS以每隔10秒的間隔向終端發(fā)送信息段。這為車輛的監(jiān)控管理提供了很大的便利。1)GPS與地理信息系統(tǒng)GIS的結(jié)合 二者的結(jié)合本就是一項(xiàng)新技術(shù)的突破,GIS讓GPS增強(qiáng)了空間概念,讓傳輸回來的數(shù)據(jù)更具有參考價值,更具有實(shí)用性。3)GPS與交通規(guī)劃在交通工程學(xué)中,無時無刻不需要獲取道路上交通量、交通密度、交通速度這三個方面的參數(shù),人工調(diào)查存在著諸多的問題,不僅耗費(fèi)大量人力物力,還只能獲得較低的準(zhǔn)確率。而GPS系統(tǒng)恰好能完美地填補(bǔ)這一空白,讓獲
35、取交通流的這三個參數(shù)變得簡單易得,同時也減少了由于傳統(tǒng)調(diào)查帶來的諸多問題,讓實(shí)時的路況播報成為可能。2.4 本章小結(jié)本章系統(tǒng)分析了影響公交車到站時間的影響因素,包括了交通工程學(xué)當(dāng)中給出的人、車、路、交通環(huán)境以及突發(fā)事故這幾個方面的內(nèi)容。通過對可數(shù)值化影響因素的篩選,使得在分析到站之間預(yù)測問題上更加具有邏輯性。由于數(shù)據(jù)的局限性,本文的GPS數(shù)據(jù)只是在同一天的同一時段上得到的,如果選擇路段距離、天氣因素、是否為節(jié)假日因素等作為預(yù)測模型的輸入變量,則不具有對比性。所以本文考慮以歷史的數(shù)據(jù)作為輸入來建立公交車到站時間預(yù)測模型。3 到站時間預(yù)測模型將得到的公交車歷史數(shù)據(jù)進(jìn)行簡單的分析,就很容易發(fā)現(xiàn)其到站
36、時間存在著時間上和空間上的變化特性。在時間上,后續(xù)發(fā)車班次的到站時間深受前續(xù)站點(diǎn)到站時間的影響;在空間上,后續(xù)站點(diǎn)的到站時間深受前續(xù)站點(diǎn)的到站時間的影響。根據(jù)這樣的規(guī)律,采用基于時間序列分析為原始模型并根據(jù)前續(xù)站點(diǎn)實(shí)際到站時間為依據(jù)的公交車到站時間預(yù)測模型。3.1 到站時間預(yù)測模型原始模型所謂時間序列分析法,就是將同一變量的一組樣本值,以序列順序排成一列,這是因?yàn)槠浒l(fā)展具有一定規(guī)律。該方法的基礎(chǔ)便是時序上的先后順序,運(yùn)用一定的方法使其向外延伸。該種方法在的一個優(yōu)點(diǎn)便是預(yù)測值在很大程度上不以人的意志為轉(zhuǎn)移,操作起來也很方便,所用價格也很低廉;任何事物都要一分為二地來看待,它的缺點(diǎn)歸納起來便是準(zhǔn)確
37、程度有待提高、可移植性不強(qiáng),只適用于短時預(yù)測。這里對本文將要應(yīng)用到的移動平均法和指數(shù)平滑法這兩種方法作一定的介紹,對于時間序列的其他方法這里不作累述。3.1.1 移動平均法顧名思義,移動平均法,并不是簡單地求取數(shù)列的平均值,而是按照時間序列的順序,依次求取平均值,以此來不斷更新均值,好比是要預(yù)測第4個時序的值,先求取第1個和第2個時序的值的均值A(chǔ),在利用這個均值A(chǔ)和第3個時序的值求取均值便是第4個時序的預(yù)測值了。這樣的一個逐漸平均化的過程,能在一定程度上避免了一次性求取平均值帶來的突變化的風(fēng)險。這個逐漸平均化的過程,在模型上表現(xiàn)為:設(shè)有一時間序列y1、y2、y3、y4yt按照時序在表格中依次排
38、出來,求出N個點(diǎn)的平均值,首次得到的移動均值為:Mt(1)=yt+yt-1+yt-N+1N=Mt-1(1)+ytyt-NN (3.1)其中:yt為第t 周期的樣本值;N 為移動平均的項(xiàng)。從上面的公式可以很清楚地得到,當(dāng)時序每向后面移動一次,就與移動的新數(shù)據(jù)結(jié)合成為均值,而又將前面經(jīng)過的數(shù)據(jù)摒棄掉,這樣不斷地“接受與舍棄”的過程,能夠使時序中的每個值向前移動,使其達(dá)到逐漸平均化的目的。3.1.2 指數(shù)平滑法指數(shù)平滑法的目的與前面的移動平均法相類似,都是旨在一定程度上消除不可控因素的干擾,需要區(qū)別來看的是,指數(shù)平滑法不需要保存大量的數(shù)據(jù),只要能夠獲取當(dāng)前批次樣本的真實(shí)值和預(yù)測值,就能預(yù)測就近的下個
39、批次數(shù)據(jù)的值。指數(shù)平滑的分類主要為兩類,一次平滑和多次平滑,這里只是介紹多次平滑當(dāng)中的二次平滑。一次平滑法設(shè)有一時間序列y1、y2、y3、y4yt則一次指數(shù)平滑的公式為:St(1)=yt+(1-)St-1(1) (3.2)其中:St(1)為第 t周期的一次指數(shù)平滑值;為系數(shù),0t,則回歸系數(shù)顯著。5)進(jìn)行預(yù)測如果觀測值的數(shù)據(jù)量較小,近似的置信區(qū)間的常用公式為:置信區(qū)間=yTse (3.15)多元線性回歸在現(xiàn)實(shí)生活中,社會生活的各個方面總是有著千絲萬縷地聯(lián)系,同樣一個結(jié)果,可能是由多個因素共同導(dǎo)致的。在這點(diǎn)上,一元回歸的應(yīng)用顯得有些局限,因此誕生了多元線性回歸。多元線性回歸預(yù)測的原理跟一元線性回
40、歸相同,只是選取的變量不再是一個,至少兩個及其以上。先以簡單的二元線性回歸為例來講解。1)二元線性回歸模型:y=a+b1x1+b2x2 (3.16)2)擬合優(yōu)度指標(biāo):標(biāo)準(zhǔn)誤差,是對y值和預(yù)測值之間的離差的度量。其計(jì)算公式為:SE=(y-y)2n-3 (3.17)可決系數(shù):R2=1-(y-y)2(y-y)2 (3.18)R20.96意味著回歸模型對自變量的全部變差做出解釋。3)置信范圍置信區(qū)間的公式為:置信區(qū)間:ytpSE (3.19)其中:tp 是自由度為n-k的t 統(tǒng)計(jì)量數(shù)值表中的數(shù)值; n 是觀察值的個數(shù); k 是包括因變量在內(nèi)的變量的個數(shù)。4)自相關(guān)和多重共線性問題自相關(guān)檢驗(yàn):D-W=i
41、=2n(i-i=1)2i=1ni2 (3.20)其中:i=yi-yi (3.21)多重共線性檢驗(yàn):在預(yù)測的過程當(dāng)中,建立回歸模型時是假設(shè)各個已知數(shù)之間是彼此無關(guān)的,但是在實(shí)際中,這種假設(shè)可能是謬論,并且會使人信以為真而建立起錯誤的方程。為了避免類似問題的發(fā)生,應(yīng)該對不同的已知參量之間的關(guān)系進(jìn)行檢驗(yàn)。任何兩個自變量之間的相關(guān)系數(shù)為:r=(x-x)(y-y)(x-x)2(y-y)2 (3.22)通常認(rèn)為自變量之間存在多重線性關(guān)系的條件是相關(guān)系數(shù)的絕對值大于0.25或者0.5.3.2 公交車到站時間預(yù)測模型的建立本文的公交車到站時間預(yù)測模型是在基于當(dāng)天的歷史數(shù)據(jù)基礎(chǔ)上建立起來的,因?yàn)閿?shù)據(jù)的有限性,不
42、可能將影響公交車到站時間的駕駛員因素、公交車因素、道路條件因素、突發(fā)狀況等可以直接量化的影響因素作為模型的輸入變量。因?yàn)槭窃谕惶斓南嗤瑫r段,以上因素基本都是相同的,所以不具有參考性和對比性。采用歷史的數(shù)據(jù)作為模型的輸入變量,能夠反映歷史的公交車到站時間影響因素對于實(shí)際到站時間的影響程度,這個影響程度又可以通過預(yù)測模型間接地反映到當(dāng)前的公交車到站時間上來。所以本文建立的基于歷史數(shù)據(jù)的實(shí)時公交車到站時間預(yù)測模型為:AN=Bi+TN-i (3.23)其中:AN表示第y班次的公交車到達(dá)第N個站點(diǎn)需要的時間; Bi表示該公交車距離就近的站點(diǎn)所需要的運(yùn)行時間;TN-i表示該公交車從i站點(diǎn)到N站點(diǎn)總共的運(yùn)
43、行時間;TN-i=n=iN-1Dn+n=i+1NTn (3.24)其中:Dn表示第n個站的站點(diǎn)滯留時間;Tn表示第n個站的運(yùn)行時間;合并以上兩式:AN=Bi+n=iN-1Dn+n=i+1NTn (3.25)在計(jì)算過程當(dāng)中,為了將模型簡化,使計(jì)算更加方便,假設(shè)公交車剛好處在某個站點(diǎn)上,則Bi取0,上式變?yōu)椋篈N=n=iN-1Dn+n=i+1NTn (3.26)在模型的實(shí)際運(yùn)用當(dāng)中,為了使預(yù)測精度更高,使預(yù)測更具有實(shí)時性,則以公交車每到達(dá)一個站點(diǎn)為基準(zhǔn)點(diǎn),將當(dāng)前車次的數(shù)據(jù)帶入模型中,繼續(xù)預(yù)測的后續(xù)站點(diǎn)的到站時間,以此類推,反復(fù)迭代。以此反復(fù)地對首次的預(yù)測時間進(jìn)行修正。簡而言之,假設(shè)車輛從站點(diǎn)i出發(fā)
44、,運(yùn)用以下公式:AN=n=iN-1Dn+n=i+1NTn (3.27)設(shè)第一次求得的AN為q,當(dāng)車輛運(yùn)行出i站時,用第i個站的實(shí)際站點(diǎn)滯留Di1代替預(yù)測值Di,則可以算出相對于q更加精確的q1;當(dāng)車輛運(yùn)行到達(dá)就近的站點(diǎn)i+1時,用車輛運(yùn)行到i+1站點(diǎn)的實(shí)際運(yùn)行時間Ti+11用來替代之前的Ti+1,再帶入公式中,則可以計(jì)算出相對精確的q2來代替q1;依次向后續(xù)的站點(diǎn)推移,不斷提高AN的實(shí)時性和精確性。3.2.1 站點(diǎn)運(yùn)行時間預(yù)測根據(jù)第2章的分析,公交車到站時間受多種因素的影響,其中包括了駕駛員的因素、車輛本身的因素、道路的因素、以及可能的突變因素的影響。在這些因素當(dāng)中,其中很大一部分因素是可以量
45、化計(jì)算的,但是仍然有部分的因素是不能量化來計(jì)算的。本文的模型利用歷史的GPS數(shù)據(jù)為對當(dāng)前車輛運(yùn)行時間的影響因素,因?yàn)?,前文歸納的人、車、路、不可控因素等的影響已經(jīng)在前續(xù)班次的到站時間中表現(xiàn)出來。在一定的時間段內(nèi),交通狀況具有一定的連續(xù)性,本文基于GPS的歷史數(shù)據(jù),運(yùn)用回歸分析就是利用了這一點(diǎn)。本文以當(dāng)前預(yù)測班次臨近的兩個班次的歷史數(shù)據(jù)作為當(dāng)前班次到站時間的影響因素,建立起基于歷史到站數(shù)據(jù)的二元線性回歸模型。設(shè)當(dāng)前某路段運(yùn)行時間為Y、臨近的第一車次的該路段的歷史運(yùn)行時間為X1、臨近的第一車次的該路段的歷史運(yùn)行時間為X2,則有:y=a+b1x1+b2x2 (3.28)式中:y因變量X1、X2自變量
46、a、b1、b2待定回歸系數(shù)3.2.2 站點(diǎn)滯留時間預(yù)測在現(xiàn)有的GPS歷史數(shù)據(jù)當(dāng)中,沒有直接的對公交車滯留時間的影響因素,故不能采用回歸分析法,但是存在著大量有規(guī)律的歷史數(shù)據(jù),故采用二次移動平均和二次指數(shù)平滑這兩種方法來綜合預(yù)測公交車滯留時間。(1)移動平均法設(shè)跨越期n=2個車次,令一次移動平均值Qt1;二次平均值為Qt2。at、bt為移動系數(shù);T由預(yù)測模型所處的時間周期至需要預(yù)測的時間之間的周期數(shù)。 則可建立二次移動平均法的預(yù)測模型:QT+t=at+btT (3.29)(2)指數(shù)平滑法一次平滑指數(shù)的計(jì)算公式為:Qt1=y1+1-Qt-11=k=0t-1(1-)kyt-k+(1-)tQ01 (3
47、.30)其中:Qt1t期的一次平滑值;Qt-11第t-1次的平滑值;平滑常數(shù),0 1;yt第t期的觀察值;Q01零期的指數(shù)平滑值;二次平滑的計(jì)算公式是建立在一次平滑之上的,為:Qt2= Qt1+(1-)tQt-12 (3.31)其中:Qt2第t期的二次指數(shù)平滑值;Qt1第t期的一次指數(shù)平滑值;Qt-12第t-1期的二次指數(shù)平滑值;3.3 綜合預(yù)測模型在公交車到站時間預(yù)測模型當(dāng)中,站點(diǎn)的滯留時間采取了移動平均和指數(shù)平滑這兩種不同的預(yù)測方法。這兩種預(yù)測方法在使用時,分別考慮了不同的方面,預(yù)測的結(jié)果也有一定的差異。在這樣的情況下,并不能一味地否定或者肯定其中的某一種方法的預(yù)測結(jié)果,所以采取加權(quán)的方式
48、來綜合預(yù)測站點(diǎn)滯留時間,以便提高預(yù)測結(jié)果的準(zhǔn)確程度。組合預(yù)測模型為:Y=WiYi (3.32)其中:Y綜合預(yù)測值,即組合模型的最終預(yù)測值;Wi第i種預(yù)測方法賦予的權(quán)重系數(shù),Wi=1;Yi第i種預(yù)測方法獲得的預(yù)測值;采用標(biāo)準(zhǔn)差法確定權(quán)重Wi:Wi=S-SiS1n-1 (3.33)式中:S=si,Si為第i種模型的標(biāo)準(zhǔn)差。3.4 公交車到站時間預(yù)測流程通過前面的分析過程,可以將本次建立的公交車輛預(yù)測模型的整個到站時間預(yù)測流程概括如圖3.1所示。圖3.1 到站時刻預(yù)測流程圖3.5 本章小結(jié)本章首先分析了到站時間預(yù)測模型的原始模型回歸模型和時間序列模型的原理及步驟,結(jié)合實(shí)際的公交車到站時間預(yù)測的問題,
49、本文建立起基于歷史數(shù)據(jù)的實(shí)時修正公交車到站時間預(yù)測模型,并對模型中涉及到的站點(diǎn)運(yùn)行時間預(yù)測和站點(diǎn)滯留時間預(yù)測作了詳細(xì)的論述。并對整個公交到站時間的預(yù)測過程進(jìn)行了流程分析。4 實(shí)例計(jì)算本文以重慶601路公交車在2013年12月24日6時40秒到8時50分23秒的25組歷史GPS數(shù)據(jù)作為預(yù)測到站時間的原始數(shù)據(jù)。通過車載GPS終端得到的GPS原始數(shù)據(jù),包括車牌、發(fā)車次數(shù)、發(fā)車時間、每隔十秒傳回的速度信息,以及站點(diǎn)之間的運(yùn)行時間,站點(diǎn)的停靠時間等。通過以上的25組GPS數(shù)據(jù)來驗(yàn)證公交車到站時間預(yù)測模型。4.1 數(shù)據(jù)的預(yù)處理4.1.1缺失數(shù)據(jù)的處理在獲取原始數(shù)據(jù)的過程中,由于城市高樓或者裝有GPS設(shè)備的
50、車輛臨時停車等原因?qū)е翯PS數(shù)據(jù)的丟失。數(shù)據(jù)的缺失是一種常見的誤差,尤其車輛在通過高樓林立的城市或者隧道時。所以有必要采取一定的措施對缺失的數(shù)據(jù)進(jìn)行預(yù)處理。在本文的原始數(shù)據(jù)中,丟失的數(shù)據(jù)并不是大量,針對這樣少量丟失的數(shù)據(jù),根據(jù)情況的不同,采取不同的處理方法。第一種情況利用相鄰前一班次數(shù)據(jù)和后一班次求取均值的方法來求取缺失值:圖4.1 缺失數(shù)據(jù)示例圖1如圖4.1所示,車牌號為5702的7:24:23發(fā)車的車輛丟失了紅旗河溝東站、大廟站、小苑站這三個站的3組車輛運(yùn)行時間,2組站點(diǎn)滯留時間數(shù)據(jù)。根據(jù)我們處理誤差的方法,則5702缺失的起點(diǎn)站嘉華世紀(jì)城到紅旗河溝東站的站點(diǎn)運(yùn)行時間數(shù)據(jù)則為前一輛車牌為5
51、246的車輛經(jīng)過該路段的運(yùn)行時間80秒和后一輛車牌號為10498經(jīng)過該路段的運(yùn)行時間80秒的平均值,則缺失的數(shù)據(jù)為80秒。同理可以得到后面四個缺失的數(shù)據(jù),依次為:40秒,130秒,75秒,155秒。第二種情況利用眾數(shù)和時序均值的綜合方法來補(bǔ)齊缺失值:圖4.2 缺失數(shù)據(jù)示例圖2如圖4.2所示:由于本次收集到的GPS數(shù)據(jù)有限,只有25組,如果缺失的數(shù)據(jù)剛好是第25組,則沒有第26組的數(shù)據(jù)能參考,或者說連續(xù)缺失23、24、25這三組數(shù)據(jù),不但沒有第26組數(shù)據(jù)可以參考,而且也沒有在時序上連續(xù)的數(shù)據(jù)作為估值依據(jù),則第一種情形的誤差處理方法則顯得局限。根據(jù)情形二描述的缺失數(shù)據(jù)處理方法求取小苑站點(diǎn)的站點(diǎn)滯留
52、時間,由于缺失的是第25組數(shù)據(jù)的值,直接求取前面24組數(shù)據(jù)的眾數(shù)就可以了,其缺失的數(shù)據(jù)求得為10秒。又如華新街站點(diǎn)第24組數(shù)據(jù)和第25組數(shù)據(jù)的站點(diǎn)滯留時間缺失,則首先利用求取前面23組數(shù)據(jù)的眾數(shù)作為第25組數(shù)據(jù)的缺失值,再用第23組數(shù)據(jù)和第25組數(shù)據(jù)的均值作為第24組數(shù)據(jù)的缺失值。通過以上方法,可以將缺失的數(shù)據(jù)補(bǔ)全,但是,補(bǔ)上的數(shù)據(jù)并不一定完全準(zhǔn)確,正是這個原因,為后期預(yù)測可能帶來的誤差埋下了隱患。4.1.2 錯誤數(shù)據(jù)的排查與更正本文通過折線圖的方式,排查出偏離的錯誤數(shù)據(jù),然后將將偏離的點(diǎn)舍去,該點(diǎn)的數(shù)據(jù)按照缺失數(shù)據(jù)的方式來處理。以上清寺站到兩路口站為例,首先統(tǒng)計(jì)出這25個車次的車輛分別需要的
53、時間由圖4.3所示,我們不難發(fā)現(xiàn),在6:00:40發(fā)車的班次從上清寺到兩路口的運(yùn)行時間是900秒,而其余班次基本在100秒左右波動,這說明900秒這個數(shù)據(jù)存在著明顯的錯誤,應(yīng)該給予修正。圖4.3 錯誤數(shù)據(jù)折線圖首先應(yīng)該將900這個值舍去,現(xiàn)在變?yōu)槿笔У臄?shù)據(jù)的處理了。則該位置的值選取眾數(shù)為110秒,錯誤值處理后的圖4.4所示。圖4.4 錯誤數(shù)據(jù)更正折線圖其余各組數(shù)據(jù)均可按照此方法對存在的錯誤數(shù)據(jù)進(jìn)行排查和更正。4.2 數(shù)據(jù)的粗分析對GPS數(shù)據(jù)分析的目的主要是想通過運(yùn)用統(tǒng)計(jì)的方法,能發(fā)現(xiàn)現(xiàn)有的GPS數(shù)據(jù)在時間和空間分布上的規(guī)律,為公交車到站時間預(yù)測模型的建立提供必要的數(shù)據(jù)依據(jù)。由于收集到的GPS所表達(dá)的數(shù)據(jù)量很龐大,本小節(jié)的主要任務(wù)就是將信息歸類,便于直觀地觀察其分布規(guī)律,如表4.1所示的是各個班次到達(dá)各個站點(diǎn)的總運(yùn)行時間。表4.1 各個班次車輛到達(dá)各個站點(diǎn)的總時間
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。