點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)

上傳人:文*** 文檔編號(hào):48698327 上傳時(shí)間:2022-01-13 格式:DOC 頁(yè)數(shù):14 大?。?02.90KB
收藏 版權(quán)申訴 舉報(bào) 下載
點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)_第1頁(yè)
第1頁(yè) / 共14頁(yè)
點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)_第2頁(yè)
第2頁(yè) / 共14頁(yè)
點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)_第3頁(yè)
第3頁(yè) / 共14頁(yè)

下載文檔到電腦,查找使用更方便

10 積分

下載資源

還剩頁(yè)未讀,繼續(xù)閱讀

資源描述:

《點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)》由會(huì)員分享,可在線閱讀,更多相關(guān)《點(diǎn)擊率及其準(zhǔn)確性研究分析網(wǎng)絡(luò)工程專業(yè)(14頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、點(diǎn)擊率及其準(zhǔn)確性研究 摘要 在互聯(lián)網(wǎng)時(shí)代網(wǎng)頁(yè)點(diǎn)擊率日益成為重要的理論和運(yùn)用熱點(diǎn),本課題正是基于這樣一個(gè)原因圍繞統(tǒng)計(jì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率和準(zhǔn)確性問題展開了較為全面的研究。首先對(duì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率問題的研究背景、現(xiàn)狀和趨勢(shì)進(jìn)行了闡釋;其次針對(duì)點(diǎn)擊率中存在的問題,重點(diǎn)研究了單頁(yè)面統(tǒng)計(jì)、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、利用jsp application和session統(tǒng)計(jì)等三種方法,同時(shí)著眼如何區(qū)分同一IP上不同用戶點(diǎn)擊情況,納入點(diǎn)擊時(shí)間、點(diǎn)擊頻率兩個(gè)因素,設(shè)計(jì)改進(jìn)了點(diǎn)擊率的統(tǒng)計(jì)方法,結(jié)果表明改進(jìn)后的點(diǎn)擊率統(tǒng)計(jì)方法能夠更加準(zhǔn)確反映用戶點(diǎn)擊的真實(shí)情況。 關(guān)鍵詞 頁(yè)面點(diǎn)擊率;準(zhǔn)確性;

2、點(diǎn)擊時(shí)間;點(diǎn)擊頻率 Research on Click-through Rate and Its Accuracy Abstract In the Internet age, the click-through rate of web pages has become an increasingly important theoretical and application hotspot. This topic is based on this reason, focusing on the statistical issues of page click-through

3、 rate and accuracy. Firstly, the research background, current situation and trend of web page click-through rate are elaborated. Secondly, aiming at the problems of click-through rate, three methods are studied: counting by single page, counting with JSP built-in object application, counting with JS

4、P application and session. In order to distinguish clicks of different users on the same IP, including click time and click frequency, a click rate statistics method was designed and improved. The results show that the improved click-through rate statistics method can more accurately reflect the cli

5、ck-through rate of users. Key words page click rate; accuracy; click time; click frequency 13 1 概述 1.1 研究背景與意義 當(dāng)今進(jìn)入網(wǎng)絡(luò)時(shí)代、智能時(shí)代和電子商務(wù)時(shí)代,網(wǎng)絡(luò)上電子商務(wù)店鋪、輿論輿情分析人員、文案創(chuàng)作人員等等許多主體都會(huì)更加關(guān)注自己在網(wǎng)絡(luò)上的網(wǎng)頁(yè)備關(guān)注的程度,這種被關(guān)注程度衡量的重要依據(jù)就是點(diǎn)擊率的多少,每天或者是每個(gè)小時(shí)有多少人在點(diǎn)擊網(wǎng)頁(yè),特別是隨著電子商務(wù)發(fā)展,網(wǎng)頁(yè)上的廣告成為一種和電視媒體廣告一樣重要的廣告模式,如何知道廣告瀏覽情況,點(diǎn)擊率也是最重要的衡

6、量指標(biāo)。反映了網(wǎng)頁(yè)上某一內(nèi)容的受關(guān)注程度,經(jīng)常用來衡量廣告的吸引程度。因此,對(duì)互聯(lián)網(wǎng)網(wǎng)頁(yè)點(diǎn)擊率的研究越來越重要。 當(dāng)前研究人員研究的重點(diǎn)是關(guān)注網(wǎng)站頁(yè)面上某個(gè)內(nèi)容,被點(diǎn)擊次數(shù)與被顯示次數(shù)之比,用公式表示就是Click frequency=clicks/time*100%。點(diǎn)擊率的計(jì)算可以通過多種方式進(jìn)行,最基本的公式為:點(diǎn)擊率=點(diǎn)數(shù)數(shù)訪問數(shù)。如一個(gè)新聞網(wǎng)站的網(wǎng)頁(yè)鏈接在一小時(shí)之內(nèi),某網(wǎng)頁(yè)刊登的廣告被點(diǎn)擊10次,以10s為單位時(shí)間,這個(gè)網(wǎng)頁(yè)上的廣告點(diǎn)擊率=點(diǎn)擊數(shù)訪問數(shù)=10/360*100%=2.8%。。當(dāng)前通用的計(jì)算方法是指網(wǎng)站的點(diǎn)擊率,也就是指一個(gè)鏈接單位時(shí)間內(nèi)的點(diǎn)擊次數(shù)。 在互聯(lián)網(wǎng)廣告成為

7、了商家推崇的一種主流營(yíng)銷方式的時(shí)代,選擇了網(wǎng)站網(wǎng)頁(yè)點(diǎn)擊率與準(zhǔn)確性這個(gè)課題進(jìn)行研究,并把研究的范圍聚焦到電子商務(wù)中網(wǎng)頁(yè)廣告的點(diǎn)擊率問題,采用一定的算法預(yù)估精準(zhǔn)廣告投放的效益,在精確廣告投放過程中扮演了很重要的角色。預(yù)估的準(zhǔn)確性對(duì)廣告主的收益、廣告商的收益以及用戶的友好體驗(yàn)有著重大的影響,因此受到互聯(lián)網(wǎng)企業(yè)的廣泛關(guān)注。這時(shí)用點(diǎn)擊率衡量出一個(gè)比值,有多少人看到一個(gè)鏈接,然后又有多少人點(diǎn)進(jìn)去看,用這兩個(gè)數(shù)字之比來衡量一個(gè)網(wǎng)絡(luò)內(nèi)容的受歡迎程度和影響程度,如圖1.1在線廣告投放模式所示。 圖1.1 在線廣告投放模式 但是當(dāng)前采取的方法計(jì)算網(wǎng)頁(yè)點(diǎn)擊率CRT,最突出的特點(diǎn)是這種點(diǎn)擊率計(jì)算方法不重復(fù)計(jì)算

8、24小時(shí)內(nèi)相同IP的點(diǎn)擊行為,因?yàn)橄嗤腎P意味著相同的人,相同的人看一萬(wàn)次和看一次沒有什么區(qū)別。典型的是百度統(tǒng)計(jì)和谷歌統(tǒng)計(jì),使用百度統(tǒng)計(jì)可以很好的區(qū)分搜索推廣與自然流量,可以自動(dòng)推送給搜索引擎爬蟲,一條統(tǒng)計(jì)代碼可以和很多的百度產(chǎn)品結(jié)合在一起,所以百度統(tǒng)計(jì)還是比較方便的,目前常用點(diǎn)擊率統(tǒng)計(jì)方法有三種:第一種是單頁(yè)面統(tǒng)計(jì),第二種是利用jsp的內(nèi)置對(duì)象application進(jìn)行統(tǒng)計(jì)的方法,第三種是利用jsp的application和session進(jìn)行統(tǒng)計(jì)的方法。 本課題考慮到因?yàn)辄c(diǎn)擊率可以反映人們對(duì)一個(gè)網(wǎng)站或app喜愛程度,而如何探究點(diǎn)擊率的準(zhǔn)確性就需要仔細(xì)分析,比如在網(wǎng)吧一個(gè)IP可以不同的人登

9、錄,所以點(diǎn)擊率的準(zhǔn)確性是個(gè)值得探討的問題。正是基于這樣一個(gè)原因圍繞統(tǒng)計(jì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率和準(zhǔn)確性問題展開了較為全面的研究,首先對(duì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率問題的研究背景、現(xiàn)狀和趨勢(shì)進(jìn)行了闡釋;其次針對(duì)點(diǎn)擊率中存在的問題,重點(diǎn)研究了單頁(yè)面統(tǒng)計(jì)、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、利用jsp application和session統(tǒng)計(jì)等三種方法,同時(shí)著眼如何區(qū)分同一IP上不同用戶點(diǎn)擊情況,納入點(diǎn)擊時(shí)間、點(diǎn)擊頻率兩個(gè)因素,設(shè)計(jì)改進(jìn)了點(diǎn)擊率的統(tǒng)計(jì)方法,結(jié)果表明改進(jìn)后的點(diǎn)擊率統(tǒng)計(jì)方法能夠更加準(zhǔn)確反映用戶點(diǎn)擊的真實(shí)情況。 1.2 研究現(xiàn)狀 在國(guó)內(nèi)外對(duì)這個(gè)問題的研究多年來一直都是熱點(diǎn),有研究基本理論的,也有研

10、究算法應(yīng)用的,還有創(chuàng)新方法結(jié)構(gòu)的。從國(guó)外典型的有代表性的研究來看,發(fā)表比較早的研究成果是來自于Google. Microsoft、Yahoo三大互聯(lián)網(wǎng)公司。這三個(gè)公司近些年來把廣告點(diǎn)擊率預(yù)估作為了一個(gè)很熱門的研究課題,把廣告點(diǎn)擊率預(yù)估模塊作為實(shí)時(shí)廣告系統(tǒng)中一個(gè)不可或缺的組成部分,在學(xué)術(shù)上和工業(yè)界都有著很深入的研究,研究?jī)?nèi)容的重點(diǎn)是點(diǎn)擊率預(yù)估模型的設(shè)計(jì)、信息的提取和處理、長(zhǎng)短期利益權(quán)衡策略、模型訓(xùn)練分布式系統(tǒng)實(shí)現(xiàn)等方面, 并取得了一系列的理論成果和應(yīng)用成果,這種價(jià)值可以起到聯(lián)鎖作用,也就是說預(yù)估效果的好壞嚴(yán)重影響著廣告商的收益、廣告主的廣告投放效果以及用戶的上網(wǎng)體驗(yàn),如圖1.2廣告點(diǎn)擊率預(yù)估問

11、題模型所示。 圖1.2 廣告點(diǎn)擊率預(yù)估問題模型 此外,在國(guó)外的研究方面還有從事其他有關(guān)研究的。從國(guó)內(nèi)有代表性的典型研究來看,隨著國(guó)內(nèi)網(wǎng)絡(luò)理論和信息理論發(fā)展,國(guó)內(nèi)學(xué)者也十分重視點(diǎn)擊率及其準(zhǔn)確性研究,有跟蹤國(guó)外研究前沿的,有獨(dú)創(chuàng)派系的,也有國(guó)內(nèi)國(guó)外結(jié)合的,當(dāng)前的一個(gè)重點(diǎn)就是 信息的提取和處理,由于這是一個(gè)很復(fù)雜的過程,國(guó)內(nèi)學(xué)者把關(guān)注的重點(diǎn)放在如何從原始數(shù)據(jù)中提取出有助于點(diǎn)擊率預(yù)估的信息,目前取得了一系列成果,通常使用回歸或者分類方法,構(gòu)建點(diǎn)擊率預(yù)估模型,模型中考慮了各種對(duì)點(diǎn)擊率可能產(chǎn)生影響的因素。 1.3 研究框架 本文將論文分為5個(gè)部分,第一部分研究點(diǎn)擊率及其準(zhǔn)確性概述,第二部

12、分研究點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)原理,第三部分研究點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)方法分析,重點(diǎn)是基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于jsp application和session統(tǒng)計(jì),第四部分研究進(jìn)點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)新方法,主要包括利用點(diǎn)擊時(shí)間優(yōu)化統(tǒng)計(jì)方法和 利用點(diǎn)擊頻率優(yōu)化統(tǒng)計(jì)方法,第五部分對(duì)全文進(jìn)行總結(jié),并對(duì)研究課題進(jìn)行展望。 2 點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)原理 2.1 點(diǎn)擊率及其準(zhǔn)確性含義 通過前面的概述可以知道點(diǎn)擊率的含義,即網(wǎng)頁(yè)點(diǎn)擊率就是指一個(gè)鏈接單位時(shí)間內(nèi)的點(diǎn)擊次數(shù),最基本的公式為點(diǎn)擊率=點(diǎn)擊數(shù)訪問數(shù)。 點(diǎn)擊率的公式可表示為:

13、 (2-1) 當(dāng)前通用的計(jì)算方法是指網(wǎng)站的點(diǎn)擊率,就是指一個(gè)鏈接單位時(shí)間內(nèi)的點(diǎn)擊次數(shù),目前可以用百度統(tǒng)計(jì)來監(jiān)測(cè),百度統(tǒng)計(jì)點(diǎn)擊率當(dāng)前成為國(guó)內(nèi)最流行和可信的點(diǎn)擊率統(tǒng)計(jì)工具。如一個(gè)新聞網(wǎng)站的網(wǎng)頁(yè)鏈接在一小時(shí)之內(nèi),某網(wǎng)頁(yè)刊登的廣告被點(diǎn)擊10次,以10s為單位時(shí)間,這個(gè)網(wǎng)頁(yè)上的廣告點(diǎn)擊率=點(diǎn)擊數(shù)訪問數(shù)=10/360*100%=2.8%。 2.2 點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)方法分類 當(dāng)前對(duì)點(diǎn)擊率問題的典型研究,目前常用的方法有三種模式。 第一種,用戶瀏覽CTR模型預(yù)測(cè)模型。這種方法利用了概率論和統(tǒng)計(jì)論的思想,首先假設(shè)對(duì)網(wǎng)站上網(wǎng)頁(yè)上某個(gè)廣告的每一次點(diǎn)擊都是相互獨(dú)

14、立的獨(dú)立事件,第一次與后面的不相關(guān),則就可以利用相關(guān)性因素和IP位置的因素得到網(wǎng)頁(yè)的點(diǎn)擊率。這種模型是本文研究的重點(diǎn),在操作層面重點(diǎn)設(shè)計(jì)和創(chuàng)新基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、jsp application和session統(tǒng)計(jì)的方法。 第二種,動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型。這種方法以智能算法為基礎(chǔ),用到了貝葉斯網(wǎng)絡(luò)模型,貝葉斯網(wǎng)絡(luò)模型是研究過程的動(dòng)態(tài)模型。這里用到計(jì)算網(wǎng)頁(yè)點(diǎn)擊率主要是對(duì)使用者點(diǎn)擊網(wǎng)頁(yè)廣告的過程進(jìn)行建模,估算出觀察相關(guān)性、實(shí)際相關(guān)性指標(biāo)。這一個(gè)過程的建模和估算具體為:假設(shè)使用者點(diǎn)擊URL地址,當(dāng)且僅當(dāng)使用者確實(shí)關(guān)注到了URL這個(gè)鏈接,所謂的觀察相關(guān)性已經(jīng)滿足條

15、件;若使用者點(diǎn)擊后續(xù)的URL地址,則實(shí)際相關(guān)性不符合用戶的要求。這樣的一個(gè)模型大大的提高了計(jì)算點(diǎn)擊的實(shí)際效果,更加具有真實(shí)性。 第三種,點(diǎn)擊鏈模型。這種模型是對(duì)CRT預(yù)測(cè)方法的擴(kuò)展,這種方法的最大的優(yōu)點(diǎn)是充分考慮的使用者的心理因素和實(shí)際需求因素,對(duì)網(wǎng)頁(yè)上的廣告進(jìn)行瀏覽,反復(fù)的瀏覽,當(dāng)達(dá)到使用者的需求時(shí)才點(diǎn)擊,這樣的模型建模比較復(fù)雜,但經(jīng)過人工智能算法分析,則可以比較準(zhǔn)確的不僅計(jì)算了點(diǎn)擊率,而且預(yù)估的使用者的實(shí)際需求,對(duì)商業(yè)上有更高的價(jià)值。 2.3 本章小結(jié) 本章從分析點(diǎn)擊率的內(nèi)涵和外延出發(fā),對(duì)這一個(gè)概念進(jìn)行了闡釋,爾后研究了點(diǎn)擊率統(tǒng)計(jì)方法,重點(diǎn)分析了點(diǎn)擊率統(tǒng)計(jì)的典型方法,如用戶瀏覽CTR

16、模型預(yù)測(cè)模型、動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型、點(diǎn)擊鏈模型,最后分析了本課題研究中所用到的方法,進(jìn)行了典型的歸納,為后續(xù)研究做好鋪墊。 3 點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)方法分析 3.1 基于單頁(yè)面統(tǒng)計(jì) 這種統(tǒng)計(jì)方法對(duì)于網(wǎng)站的頁(yè)面,當(dāng)點(diǎn)擊了網(wǎng)站的某個(gè)頁(yè)面,計(jì)數(shù)器就統(tǒng)計(jì)一次點(diǎn)擊量,通過以獨(dú)立的IP地址或者網(wǎng)站頁(yè)面為訪問對(duì)象,只要被訪問點(diǎn)擊就記錄一次點(diǎn)擊量。在實(shí)際中將統(tǒng)計(jì)代碼放置在需要統(tǒng)計(jì)的網(wǎng)站網(wǎng)頁(yè)內(nèi),完成內(nèi)置代碼就可以實(shí)現(xiàn)點(diǎn)擊量的統(tǒng)計(jì)。 主要代碼如下: _hmt.push([_trackPageview, /virtual/login]); router.afterEach((to, from) => {

17、 console.log(to); console.log(to.fullPath); window._hmt.push([_trackPageview, /# + to.fullPath]); }); 3.2 基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì) Jsp可以內(nèi)置request、response、pageContext、session、application、out、config、page、exception等內(nèi)置對(duì)象,這種應(yīng)用對(duì)象——application,是存活范圍最大的對(duì)象,當(dāng)服務(wù)器一直開啟時(shí),application在整個(gè)服務(wù)器運(yùn)行過程中數(shù)據(jù)一直

18、存在,但利用application統(tǒng)計(jì)也有弊端,這個(gè)程序結(jié)果運(yùn)行分析,也是訪問一次頁(yè)面統(tǒng)計(jì)一次。感覺還是不夠好。真正滿意的是瀏覽器打開網(wǎng)頁(yè),到關(guān)閉網(wǎng)頁(yè)算一次,這樣統(tǒng)計(jì)比較實(shí)際。 application實(shí)現(xiàn)一個(gè)簡(jiǎn)單的網(wǎng)頁(yè)計(jì)數(shù)器主要代碼如下: @ page language="java" import="java.util.*" pageEncoding="UTF-8"%> String path = request.getContextPath();

19、l> "> My JSP application.jsp starting page

20、t="keyword1,keyword2,keyword3"> <% if(application.getAttribute("counter")==null) { application.setAttribute("counter", "1");

21、 } else { String strnum=null; strnum =(String)application.getAttribute("counter"); int icount=0; icount=Integer.valueOf(strnum).intValue(); icount++; application.setAttribute("counter",Integer.toString(icount))

22、; } %> 您是第<%=application.getAttribute("counter") %>位訪問者; 3.3 基于jsp application和session統(tǒng)計(jì) 利用Application對(duì)象實(shí)現(xiàn)訪問人數(shù)的統(tǒng)計(jì)很常見,這種統(tǒng)計(jì)方法的原理是,Jsp調(diào)用Javeabean命令UseBean中有Scope設(shè)置,當(dāng)訪問者打開瀏覽器到關(guān)閉瀏覽器算一次訪問,每次打開首頁(yè),創(chuàng)建一個(gè)session,這個(gè)session直到瀏覽器關(guān)閉才失效。但總體來說,比前兩種要好。在這里為了解決當(dāng)jsp服務(wù)器重啟時(shí)累計(jì)的統(tǒng)計(jì)數(shù)就清

23、零的問題,本文利用Application對(duì)象把保存到web.xml的數(shù)據(jù)庫(kù)信息取出來,不但解決安全性問題,而且是一個(gè)全局變量,不用每次連接數(shù)據(jù)庫(kù),都寫一串長(zhǎng)長(zhǎng)的數(shù)據(jù)。 基于jsp application和session統(tǒng)計(jì)點(diǎn)擊率主要代碼: @ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <%@ page import="java.sql.*"%>

24、l//EN" "http://www.w3.org/TR/html4/loose.dtd"> index <% //取出web.xml中的全局變量 String url=application.getInitParameter("url"); String user=application.getInitParameter("user"); Strin

25、g pwd=application.getInitParameter("pwd"); //連接數(shù)據(jù)庫(kù),把訪問人數(shù)+1 String sql = null; Class.forName("com.mysql.jdbc.Driver"); Connection con=DriverManager.getConnection(url,user,pwd); sql = "update visitcount set visitCount=visitCount+1"; con.createStatement().execute(sql); sql = "select visitCount f

26、rom visitcount"; ResultSet rs=con.prepareStatement(sql).executeQuery(); rs.next(); application.setAttribute("counter",String.valueOf(rs.getInt("visitCount"))); //再把這個(gè)變量取出來,讓訪問網(wǎng)站的所有人看到 out.print("你是第"+application.getAttribute("counter")+"個(gè)訪問本站的人!"); %> 3.4 本章小結(jié) 本章在前面各個(gè)章節(jié)研究的

27、基礎(chǔ)上,深入到網(wǎng)頁(yè)點(diǎn)擊率統(tǒng)計(jì)方法的具體層面,重點(diǎn)分析了單頁(yè)面統(tǒng)計(jì)方法、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)方法、利用jsp application和session統(tǒng)計(jì)方法,這個(gè)三種統(tǒng)計(jì)方法是最基本的方法,也是最典型的方法,對(duì)后續(xù)研究有重要作用。 4 點(diǎn)擊率及其準(zhǔn)確性統(tǒng)計(jì)新方法 4.1 利用瀏覽時(shí)間優(yōu)化統(tǒng)計(jì)方法 由于目前本文上述研究分析的“基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于jsp application和session統(tǒng)計(jì)”等3種方法,都能夠統(tǒng)計(jì)出網(wǎng)站網(wǎng)頁(yè)的點(diǎn)擊率,但這中間存在一些問題,比如到底是不是不同的人點(diǎn)擊的,到底是過客還是有需求的客戶,到底是

28、路過網(wǎng)頁(yè)還是按照客戶的需求訪問等問題,舉一個(gè)實(shí)際例子,有個(gè)廣告商投放在網(wǎng)絡(luò)上的二個(gè)廣告,分別被放在網(wǎng)頁(yè)的不同的兩個(gè)位置上,統(tǒng)計(jì)得到前者的點(diǎn)擊率是30%,后者的點(diǎn)擊率是10%,究竟哪個(gè)廣告好一些呢?其實(shí)我們得不出任何結(jié)論。我們知道如果不考慮時(shí)間、位置等各種復(fù)雜人類行為因素,絕對(duì)的點(diǎn)擊率水平是沒有什么太大意義的。這些問題解決不好,就沒有辦法真實(shí)的統(tǒng)計(jì)出網(wǎng)站網(wǎng)頁(yè)廣告的真實(shí)需求,對(duì)商家的幫助就有差距和偏差。為了解決這個(gè)問題,在本章引入了點(diǎn)擊時(shí)間優(yōu)化統(tǒng)計(jì)方法。 在基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于jsp application和session統(tǒng)計(jì)方法的基礎(chǔ)上,在網(wǎng)頁(yè)的腳

29、本文件或者代碼中加入點(diǎn)擊進(jìn)入時(shí)間統(tǒng)計(jì)和離開時(shí)間統(tǒng)計(jì),這樣就可以知道訪問者在這個(gè)網(wǎng)頁(yè)停留的時(shí)間了,如果停留時(shí)間比較短,比如只有幾秒鐘,就可以認(rèn)為訪問者不是真正的需求者,如果在同樣的一個(gè)網(wǎng)頁(yè)上停留比較合理的時(shí)間,比如達(dá)到了閱讀全部?jī)?nèi)容的時(shí)間,則可以認(rèn)為訪問者有較大的潛在需求。經(jīng)過這樣一種改進(jìn),就能夠有效解決統(tǒng)計(jì)真實(shí)需求不準(zhǔn)的問題。 這種方法是對(duì)基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于jsp application和session統(tǒng)計(jì)三種方法的改進(jìn),通過實(shí)驗(yàn)可以較為精準(zhǔn)的得到真正的需求者和對(duì)廣告有關(guān)注的關(guān)注者。 主要代碼如下: //統(tǒng)計(jì)用戶訪問網(wǎng)站頁(yè)面時(shí)間 va

30、r tjSecond = 0; var tjRandom = 0; //定時(shí)增加時(shí)間 window.setInterval(function() { tjSecond++ }; //獲取隨機(jī)的時(shí)間 tjRandom = (new Date()).valueOf(); //加載 window.onload = function() {}; //onbeforeunload 事件在即將離開當(dāng)前頁(yè)面(刷新或關(guān)閉)時(shí)觸發(fā) //該事件可用于彈出對(duì)話框,提示用戶是繼續(xù)瀏覽頁(yè)面還是離開當(dāng)前頁(yè)面 window.onbeforeun

31、load = function() { //定義空的容器 var params = {}; params.tjRd = tjRandom; //獲取當(dāng)前的url地址 params.url = location.href; params.time = tjSecond; params.timeIn = Date.parse(new Date()) - (tjSecond * 1000); params.timeOut = Date.parse(new Date()); //獲取頁(yè)面的t

32、itle標(biāo)題 params.title = document.title; //獲取域 params.domain = document.domain; //獲取屏幕的高度 params.sh = window.screen.height; //獲取屏幕的寬度 params.sw = window.screen.width; //獲取語(yǔ)言 params.language = navigator.language; //獲取來源地址 params.refer = getRefer

33、rer(); //定義空變量,用來做傳遞的參數(shù) var args = ""; for (var i in params) { if (args != "") { args += "&" } args += i + "=" + encodeURIComponent(params[i]) } $.post(" + args, { jsstr: "" }, function(data) {},

34、 "json") }; 4.2 利用點(diǎn)擊頻率優(yōu)化統(tǒng)計(jì)方法 本章第一節(jié)的思路作為解決網(wǎng)站網(wǎng)頁(yè)真實(shí)點(diǎn)擊情況的方法比較有效,在此基礎(chǔ)上還有這樣一種方法,利用點(diǎn)擊頻率優(yōu)化統(tǒng)計(jì)方法解決這種問題,這個(gè)方法的基本思路是:當(dāng)訪問者在一個(gè)網(wǎng)站網(wǎng)頁(yè)上點(diǎn)擊頻率來判斷是不是真正的有效的點(diǎn)擊,如果點(diǎn)擊頻率很高,則不是真正的訪問者,如果點(diǎn)擊頻率不高,則是真正的訪問者。這種方法是在基于單頁(yè)面統(tǒng)計(jì)、基于jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、基于jsp application和session統(tǒng)計(jì)方法基礎(chǔ)上的改進(jìn),和3.1利用瀏覽時(shí)間優(yōu)化統(tǒng)計(jì)方法在解決問題的性質(zhì)上一致的,只是利用了單位時(shí)間點(diǎn)擊的次數(shù)

35、。 主要代碼如下: Integer id = (Integer)request.getAttribute("id"); Map obj=(Map) application.getAttribute("count"); if(obj==null){ obj = new HashMap(); obj.put(id,1); application.setAttribute("count",obj); } else{ Integer count = (Integer)obj.get(i

36、d); if(count==null){ count = 1; } else{ count++; } obj.put(id,count); application.setAttribute("count",obj); 4.3 本章小結(jié) 本章在第三章研究的基礎(chǔ)上,特別是重點(diǎn)分析了單頁(yè)面統(tǒng)計(jì)方法、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)方法、利用jspapplication和session統(tǒng)計(jì)方法的基礎(chǔ)上,著眼當(dāng)前點(diǎn)擊率計(jì)算存在的主要問題,如何區(qū)分來自于同樣的IP上的不同用戶的點(diǎn)擊情況,特別是網(wǎng)吧電腦貢獻(xiàn)的點(diǎn)擊數(shù)統(tǒng)計(jì)問題,從點(diǎn)擊時(shí)間和點(diǎn)擊頻率兩個(gè)方面設(shè)計(jì)了改進(jìn)統(tǒng)計(jì)的方法。 5

37、 結(jié)束語(yǔ) 在互聯(lián)網(wǎng)時(shí)代網(wǎng)頁(yè)點(diǎn)擊率日益成為重要的理論和運(yùn)用熱點(diǎn),本課題正是基于這樣一個(gè)原因圍繞統(tǒng)計(jì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率和準(zhǔn)確性問題展開了較為全面的研究,特別是針對(duì)當(dāng)前研究中存在的問題。首先對(duì)網(wǎng)頁(yè)頁(yè)面點(diǎn)擊率問題的研究背景、現(xiàn)狀和趨勢(shì)進(jìn)行了闡釋;其次針對(duì)點(diǎn)擊率中存在的問題,重點(diǎn)研究了單頁(yè)面統(tǒng)計(jì)、利用jsp內(nèi)置對(duì)象application統(tǒng)計(jì)、利用jsp application和session統(tǒng)計(jì)等三種方法,同時(shí)著眼如何區(qū)分同一IP上不同用戶點(diǎn)擊情況,納入點(diǎn)擊時(shí)間、點(diǎn)擊頻率兩個(gè)因素,設(shè)計(jì)改進(jìn)了點(diǎn)擊率的統(tǒng)計(jì)方法,改進(jìn)后的點(diǎn)擊率統(tǒng)計(jì)方法能夠更加準(zhǔn)確反映用戶點(diǎn)擊的真實(shí)情況,具有一些理論意義和實(shí)踐意義。本文的研究既

38、有理論上的基礎(chǔ)性,又有方向上的新穎性,還有實(shí)踐上的價(jià)值性,通過本文的研究梳理出了文本相似度計(jì)算的邏輯過程和實(shí)踐過程,有較為重要的價(jià)值。 參考文獻(xiàn) [1] C.J.Wang,H.H.Chen. Learning user behaviors for advertisements click prediction [J]. SIGIR 2011 Workshop:Internet Advertising , 2011,38(04): 689~701. [2] 陳巧紅,余仕敏,賈宇波. 廣告點(diǎn)擊率預(yù)估技術(shù)綜述[J]. 浙江理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015,24 (6):851~857

39、. [3] 歐陽(yáng)晟. 基于Storm與在線機(jī)器學(xué)習(xí)的廣告點(diǎn)擊率預(yù)測(cè)的研究[D]. 武漢理工大學(xué), 2016. [4] 汪榮貴,沈明玉,偶春生. Bayes網(wǎng)絡(luò)與關(guān)系模型的集成:概率關(guān)系模型[J]. 微電子學(xué)與計(jì)算機(jī), 2002,24 (3):1000~1003. [5] 劉唐. 基于多類別特征的在線廣告點(diǎn)擊率預(yù)測(cè)研究[D]. 北京郵電大學(xué), 2013. [6] 邵迪. 在線廣告中高層特征表示及點(diǎn)擊率預(yù)測(cè)方法研究[D]. 哈爾濱工業(yè)大學(xué), 2014. [7] 張志浩. 基于深度學(xué)習(xí)的在線廣告點(diǎn)擊率預(yù)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 南京大學(xué), 2015. [8] 孔東營(yíng). 基于在線貝葉斯算

40、法的廣告點(diǎn)擊率預(yù)估[D]. 中國(guó)科學(xué)院大學(xué),2013. [9] Thorsten Joachims. Making large-scale SVM learning practical[J]. Advances in Kernel Methods-Support Vector Learning, 1999,438(42):125~130. [10] 肖垚, 畢軍芳, 韓易, 董啟文. 在線廣告中點(diǎn)擊率預(yù)測(cè)研究[J]. 華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2017,42(5): 80~86. [11] Ciaramita M,Murdock V,Plachouras V. Online le

41、arning from click data for sponsored search[J]. the 17th International World Wide Web Conference,2008,07(36):563~568. 致謝 本論文是在孫發(fā)軍老師的悉心指導(dǎo)下完成的,我衷心表示對(duì)于孫發(fā)軍老師的感謝。寫這篇關(guān)于點(diǎn)擊率及其準(zhǔn)確性研究的分析論文,對(duì)我來說經(jīng)歷了很多,我也了解到了很多沒接觸過的知識(shí),讓我受益匪淺。 千里之行,始于足下,不積跬步何以至千里,本設(shè)計(jì)能夠順利的完成,也歸功于各位任課老師的認(rèn)真負(fù)責(zé),使我能夠很好的掌握和運(yùn)用專業(yè)知識(shí),并在設(shè)計(jì)中得以體現(xiàn)。正是有了他們的悉心幫助和支持,才使我的畢業(yè)論文工作順利完成。在完成這篇論文的過程中還是充滿困難和挑戰(zhàn),要感謝我的論文指導(dǎo)老師和我的同學(xué)們,在我遇到疑惑和困難時(shí)候給我的幫助和肯定,使我有信心完成論文接下來的內(nèi)容,我誠(chéng)心的感謝我所敬愛的孫發(fā)軍老師和幫助我的同學(xué)們,為了你們我將努力學(xué)習(xí),勇敢接受到來的挑戰(zhàn),不會(huì)退縮。

展開閱讀全文
溫馨提示:
1: 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!