基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟(jì)貿(mào)易專業(yè)

上傳人:文*** 文檔編號(hào):242741256 上傳時(shí)間:2024-09-02 格式:DOC 頁數(shù):27 大?。?58.49KB
收藏 版權(quán)申訴 舉報(bào) 下載
基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟(jì)貿(mào)易專業(yè)_第1頁
第1頁 / 共27頁
基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟(jì)貿(mào)易專業(yè)_第2頁
第2頁 / 共27頁
基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟(jì)貿(mào)易專業(yè)_第3頁
第3頁 / 共27頁

下載文檔到電腦,查找使用更方便

20 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟(jì)貿(mào)易專業(yè)》由會(huì)員分享,可在線閱讀,更多相關(guān)《基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟(jì)貿(mào)易專業(yè)(27頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、 中文題目: 基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究 英文題目: Association Analysis of the Customer Shopping Based on Taobao Platform 目錄 中英文摘要與關(guān)鍵詞 1 一、引言 2 二、客戶購物關(guān)聯(lián)分析 2 (一)關(guān)聯(lián)分析技術(shù) 2 (二)客戶購物關(guān)聯(lián)挖掘過程 3 三、淘寶商務(wù)平臺(tái)數(shù)據(jù)分析 5 (一)分析對(duì)象 5 (二)數(shù)據(jù)準(zhǔn)備 7 (三)數(shù)據(jù)處理 8

2、 (四)關(guān)聯(lián)挖掘 11 (五)關(guān)聯(lián)結(jié)果分析 15 四、淘寶商務(wù)平臺(tái)中的關(guān)聯(lián)規(guī)則應(yīng)用 17 (一)客戶分析 17 (二)商品營銷 18 五、結(jié)論 19 參考文獻(xiàn) 21 附錄 23 附錄:原始數(shù)據(jù) 23 基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究 摘要: 淘寶網(wǎng)站作為國內(nèi)最大的電子商務(wù)平臺(tái),擁有龐大的消費(fèi)群體和海量的交易數(shù)據(jù)。如何對(duì)淘寶商務(wù)平臺(tái)上大量的數(shù)據(jù)進(jìn)行有效的收集、組織、挖掘和利用,找出其中真正有價(jià)值的信息和知識(shí),以指導(dǎo)企業(yè)的商業(yè)決策行為,成為電子商務(wù)經(jīng)營者關(guān)注的問題。關(guān)聯(lián)規(guī)則作為數(shù)據(jù)挖掘技術(shù)(Data Mining)中最為典型的一種,為解決這一問題提供了有效

3、途徑。通過關(guān)聯(lián)規(guī)則挖掘,找出商品之間、商品與客戶之間存在的內(nèi)在聯(lián)系,對(duì)于電子商務(wù)中客戶關(guān)系管理、企業(yè)市場定位和商品營銷有著非常重要的指導(dǎo)意義。針對(duì)目前淘寶平臺(tái)中客戶購物數(shù)據(jù)的利用問題,闡述了關(guān)聯(lián)規(guī)則挖掘的一般過程,并對(duì)采集的相關(guān)記錄數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,依據(jù)分析結(jié)果制定相應(yīng)的營銷策略。 關(guān)鍵詞: 電子商務(wù);數(shù)據(jù)挖掘;關(guān)聯(lián)分析 Association Analysis of the Customer Shopping Based on Taobao Platform Abstract: Taobao platform has huge consumer groups and gener

4、ates massive transaction data every day. How to effectively collect, organize and mine these data based on taobao platform to detect the valuable information and guide the behavior of business decision-making, has become a key problem for e-commerce operators. As one of the most typical data mining

5、techniques, association rules provide an effective way to solve this problem. It is important to find the internal relation between sales of goods and customers, which could be applied to customer relationship management, market position and sales strategy in e-commerce. To make effective use of dat

6、a on Taobao platform, this thesis analyzes the process of association rule mining, and then perform the association analysis based the collected relevant data. Finally, the corresponding marketing strategies are given. Keywords: E-commerce; Data mining; Association analysis 一、引言 近些年來電子商務(wù)迅猛發(fā)展,給

7、人們生活帶來了很多便利,同時(shí)也帶來了不少難題和挑戰(zhàn)。對(duì)于企業(yè)來說,進(jìn)行電子商務(wù)轉(zhuǎn)型和發(fā)展,需要有互聯(lián)網(wǎng)思維,即能夠從海量的交易信息中找出有用的、有潛在價(jià)值的信息,以制定更好的經(jīng)營策略;對(duì)于消費(fèi)者來說,需要花費(fèi)大量的時(shí)間和精力來瀏覽網(wǎng)上大量的商品信息,并從中比較和選購商品。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘技術(shù)中的一種,它可以反映大量數(shù)據(jù)間特有的聯(lián)系,并將這種聯(lián)系轉(zhuǎn)化為數(shù)據(jù)使用者感興趣的信息,為企業(yè)或消費(fèi)者提供決策支持。 用戶網(wǎng)上交易的原始數(shù)據(jù)是海量的,我們可以從電子商務(wù)交易中提取,也可以從百度指數(shù)和阿里指數(shù)等獲得。淘寶數(shù)據(jù)魔方、量子恒道和SAS等數(shù)據(jù)挖掘分析工具能夠幫助企業(yè)對(duì)這些數(shù)據(jù)進(jìn)行處理。目前電子商務(wù)平

8、臺(tái)中關(guān)聯(lián)規(guī)則挖掘的普及度和專業(yè)度不高,無法深入提取數(shù)據(jù)中更優(yōu)質(zhì)的信息,并借助這些信息去分析和發(fā)現(xiàn)客戶的消費(fèi)習(xí)慣和行為模式,從而改進(jìn)營銷決策和客戶服務(wù)。論文針對(duì)關(guān)聯(lián)規(guī)則技術(shù)在淘寶交易數(shù)據(jù)中的應(yīng)用,實(shí)現(xiàn)指定支持度和置信度下,交易數(shù)據(jù)中關(guān)聯(lián)規(guī)則的挖掘,并對(duì)提取到的規(guī)則進(jìn)行分析,與淘寶商務(wù)平臺(tái)現(xiàn)狀結(jié)合,制定相應(yīng)的營銷策略。 二、客戶購物關(guān)聯(lián)分析 (一)關(guān)聯(lián)分析技術(shù) 使用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則技術(shù)來對(duì)客戶購物關(guān)聯(lián)進(jìn)行分析,能夠把隱沒在一大批看似雜亂無章的數(shù)據(jù)中的信息,集中、萃取和提煉出來,以找出所研究對(duì)象的內(nèi)在規(guī)律。在互聯(lián)網(wǎng)時(shí)代發(fā)展到大數(shù)據(jù)時(shí)代,數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)增長。然而,百分之八十的數(shù)據(jù)是非結(jié)構(gòu)化的

9、,因此需要通過關(guān)聯(lián)挖掘從數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)項(xiàng)中,找出數(shù)據(jù)中結(jié)構(gòu)化的、隱藏的聯(lián)系。這些數(shù)據(jù)聯(lián)系中的交叉性信息反應(yīng)隱含了客戶的潛在購買行為,對(duì)電子商務(wù)企業(yè)的營銷決策有著非常重要的價(jià)值。 購物分析是關(guān)聯(lián)規(guī)則的一個(gè)典型案例。指的是當(dāng)顧客購買一些商品A,B,C,D...它們一起購買是偶然,還是顧客的購買行為習(xí)慣?商品A和B同時(shí)購買的概率有多大?如果兩者捆綁銷售是否會(huì)刺激顧客消費(fèi)?了解了顧客的購買行為,能夠幫助企業(yè)制定市場營銷策略。例如,什么樣的商品應(yīng)該放在一起,企業(yè)的顧客群體特征,顧客為什么購買這些商品。在制定商品策略和優(yōu)化客戶服務(wù)時(shí),根據(jù)顧客需求,實(shí)施精準(zhǔn)營銷。 關(guān)聯(lián)規(guī)則挖掘的基本模型如圖1所示

10、: 圖1 關(guān)聯(lián)規(guī)則挖掘的基本模型 (1)輸入事務(wù)數(shù)據(jù)庫D,根據(jù)最小支持度找出其中所有的頻繁項(xiàng)目集。 (2)由(1)中的頻繁項(xiàng)目集和最小置信度產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,在一定情況下,也可以通過附加興趣度來對(duì)規(guī)則進(jìn)行度量。 第一個(gè)子問題的核心是如何確定有效的支持度,以找出D中所有頻繁項(xiàng)目集。支持度是事務(wù)數(shù)據(jù)庫D中包含項(xiàng)集X的事務(wù)數(shù)與事務(wù)數(shù)據(jù)庫D的總事務(wù)數(shù)的比值,一般支持度越高越好,但是在實(shí)際關(guān)聯(lián)挖掘時(shí),需要根據(jù)業(yè)務(wù)需求不斷調(diào)整、嘗試,才能找到最合適的支持度;第二個(gè)子問題可以直接得到結(jié)果,但也需要根據(jù)不同的求解指標(biāo)如興趣度的度量標(biāo)準(zhǔn)來進(jìn)一步度量關(guān)聯(lián)規(guī)則集的合理性。 (二)客戶購物關(guān)聯(lián)挖掘過程

11、 1.確定業(yè)務(wù)問題 客戶購物關(guān)聯(lián)挖掘的主要價(jià)值應(yīng)該是決策或者輔佐決策,因此評(píng)價(jià)關(guān)聯(lián)分析的原點(diǎn)是能否滿足業(yè)務(wù)需求,解決存在的業(yè)務(wù)問題。深入理解業(yè)務(wù)本身,是避免迷失在大量數(shù)據(jù)中的前提。針對(duì)電子商務(wù)平臺(tái),這里所說的業(yè)務(wù)問題可以是流量轉(zhuǎn)化、活動(dòng)營銷、關(guān)聯(lián)銷售、會(huì)員提升等。不同業(yè)務(wù)的關(guān)鍵需求決定了關(guān)聯(lián)分析的目標(biāo)用戶和目標(biāo)價(jià)值。 2.數(shù)據(jù)探測 在確定業(yè)務(wù)問題后就要選擇相關(guān)的數(shù)據(jù),有效挖掘的關(guān)鍵問題有:數(shù)據(jù)來源、數(shù)據(jù)量、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)平衡和數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)來源通常是淘寶商務(wù)平臺(tái)的消費(fèi)者交易數(shù)據(jù)和流量數(shù)據(jù)。數(shù)據(jù)量并不是越大越好,要以效用為導(dǎo)向,以實(shí)用價(jià)值為指標(biāo),結(jié)合不同的階段性目標(biāo),進(jìn)行數(shù)據(jù)采集分析。具

12、有一定規(guī)模的企業(yè)或公司會(huì)有自己的數(shù)據(jù)庫來存儲(chǔ)海量數(shù)據(jù),對(duì)于規(guī)模很小的店鋪或個(gè)人創(chuàng)業(yè)等,可以借助電商平臺(tái)如淘寶指數(shù),或利用數(shù)據(jù)庫軟件如Oracle,SQL Server,IBM DB2,MySQL等,來存儲(chǔ)和有組織的管理各種網(wǎng)站流量數(shù)據(jù)和客戶購物交易數(shù)據(jù)。數(shù)據(jù)平衡是結(jié)合每個(gè)企業(yè)自身實(shí)際,規(guī)劃設(shè)計(jì)數(shù)據(jù)表的特點(diǎn)和結(jié)構(gòu)。很多情況下數(shù)據(jù)的質(zhì)量難以保證,充分的數(shù)據(jù)探測是為了了解數(shù)據(jù)的分布、變化趨勢和數(shù)據(jù)關(guān)系。將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化可理解的、可用的結(jié)構(gòu)化數(shù)據(jù),即對(duì)應(yīng)的分布與統(tǒng)計(jì)信息,有助于全面了解數(shù)據(jù)特征,并建立客戶購物關(guān)聯(lián)挖掘模型。 3.數(shù)據(jù)預(yù)處理 數(shù)據(jù)預(yù)處理有助于為客戶購物關(guān)聯(lián)分析提供高質(zhì)量的數(shù)據(jù)?,F(xiàn)

13、實(shí)中數(shù)據(jù)大體上是不完整的、不一致的臟數(shù)據(jù),無法直接進(jìn)行關(guān)聯(lián)分析,需要進(jìn)行清理、集成、變換和歸約,來糾正各種數(shù)據(jù)質(zhì)量問題,否則可能會(huì)影響客戶購物關(guān)聯(lián)分析得到的結(jié)果。 4.數(shù)據(jù)建模(挖掘) 對(duì)于電商平臺(tái)的客戶購物關(guān)聯(lián)分析需要選擇關(guān)聯(lián)規(guī)則方法,結(jié)合商務(wù)智能分析軟件如WEKA、SQL Server、IBM cognis等對(duì)相應(yīng)的數(shù)據(jù)進(jìn)行挖掘分析。 5.結(jié)果評(píng)估 關(guān)聯(lián)分析后會(huì)輸出許多模式,對(duì)相關(guān)模式的合理性進(jìn)行測試和評(píng)估是必要的。企業(yè)認(rèn)可的與消費(fèi)者認(rèn)可的結(jié)果不一定相同,甚至可能是相悖的。這個(gè)階段與業(yè)務(wù)人員的充分溝通、比對(duì)網(wǎng)站的交易數(shù)據(jù)是保證其效用最大化的有效途徑。 6.應(yīng)用部署 將分析的關(guān)聯(lián)

14、結(jié)果應(yīng)用到商務(wù)決策中,在客戶關(guān)系管理、個(gè)性化推薦、商品營銷、提高轉(zhuǎn)化率等方面,制定具體的、可執(zhí)行的、可管控的戰(zhàn)略實(shí)施計(jì)劃,以產(chǎn)生經(jīng)濟(jì)效益。 三、淘寶商務(wù)平臺(tái)數(shù)據(jù)分析 淘寶商務(wù)平臺(tái)中的數(shù)據(jù),信息量巨大,結(jié)構(gòu)復(fù)雜,類型眾多。對(duì)購物數(shù)據(jù)的分析,不再局限于商品名稱、商品類型、商品價(jià)格和交易時(shí)間,也包括購買商品的客戶信息。很多商家只是把這些交易信息當(dāng)作一個(gè)展示頁面,但基于交易數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘還是不夠深入,缺乏專業(yè)的挖掘工具和分析工具以及專業(yè)的分析人員對(duì)這些信息的潛在性進(jìn)行挖掘和分析。 (一)分析對(duì)象 淘寶商務(wù)平臺(tái)中的商品品種繁多,價(jià)格相對(duì)便宜,支付方便,易于消費(fèi)者選購,深受廣大網(wǎng)絡(luò)消費(fèi)者的歡迎

15、,淘寶中的客戶購物數(shù)據(jù)龐大,關(guān)聯(lián)性高,蘊(yùn)含的信息多。所以本文選取淘寶商務(wù)平臺(tái)中305個(gè)用戶在淘寶天貓超市中交易記錄,來挖掘潛在的、有價(jià)值的信息。 首先可以利用圖表看一下這些記錄展示出來的數(shù)據(jù)信息。 圖2 性別分布餅圖 圖3 職業(yè)分布柱狀圖 由圖2、圖3可以得出,天貓的消費(fèi)人群與淘寶網(wǎng)相比,更偏女性化,即女性消費(fèi)者占比更高;學(xué)生群體消費(fèi)比重大,可以看出目前網(wǎng)絡(luò)消費(fèi)者總體較為年輕;消費(fèi)人群學(xué)歷水平整體較高。 圖4 購買類目柱狀圖 從購買類目上看,購買進(jìn)口食品的可能性值是30.3%,購買食品飲料的可能性值是83.33%,購買油糧副食的可能性值是15.15%,購買美容洗護(hù)

16、的可能性值是42.42%,購買家具家電的可能性值是9.09%,購買家庭清潔的可能性值是42.42%,購買母嬰用品的可能性值是3.03%,購買生鮮水果的可能性值是10.61%,食品飲料、美容洗護(hù)、家庭清潔排在前三位,這與調(diào)查人群中女性占比例大,學(xué)生、家庭主婦、白領(lǐng)職業(yè)分布比重高有很大的關(guān)系。 圖5 購買原因柱狀圖 在購買原因中,價(jià)格優(yōu)惠的認(rèn)可度是5.38,物流速度快的認(rèn)可度是4.8,質(zhì)量保障的認(rèn)可度是4.44,品種豐富的認(rèn)可度是4.26,配送范圍廣的認(rèn)可度是2.2,優(yōu)惠促銷活動(dòng)豐富的認(rèn)可度是2.14,支付方式完善的認(rèn)可度是1.2,包裝規(guī)范的認(rèn)可度是1,其他的認(rèn)可度是0.83,運(yùn)費(fèi)便宜

17、的認(rèn)可度是0.76。由此說明價(jià)格、物流、商品質(zhì)量、品種數(shù)量等因素對(duì)客戶購買決策的影響很大。 圖6 受吸引的優(yōu)惠活動(dòng)柱狀圖 對(duì)消費(fèi)者而已,最受吸引的優(yōu)惠活動(dòng)中,直接打折降價(jià)吸引度為66.67%,限時(shí)搶購、低價(jià)秒殺吸引度為45.45%,團(tuán)購吸引度為28.79%,積分兌換券、抵用券吸引度為25.76%,滿指定金額包郵、禮品卡和購買得贈(zèng)品吸引度為24.24%,名品特賣吸引度為19.7%,抽獎(jiǎng)和其他吸引度為6.06%。直接打折降價(jià)雖然是比較傳統(tǒng)的優(yōu)惠活動(dòng),消費(fèi)者尤其是女性消費(fèi)者會(huì)對(duì)這類活動(dòng)樂此不疲,所以淘寶商務(wù)平臺(tái)經(jīng)常會(huì)在各種節(jié)假日開展優(yōu)惠活動(dòng)。 以上是部分展示出來的數(shù)據(jù)信息,這些數(shù)據(jù)信息

18、比較單一,為商家的決策提供的價(jià)值有限,無法提供更深層次的、隱藏的信息,所以需要通過關(guān)聯(lián)分析將企業(yè)面臨的業(yè)務(wù)問題和研究的分析框架相結(jié)合,推導(dǎo)出具有實(shí)用價(jià)值的結(jié)論。 (二)數(shù)據(jù)準(zhǔn)備 代寫各專業(yè)碩博學(xué)位論文,代寫代發(fā)CSSCI、北大核心論文,合作加QQ:97079517、 97079518 ; 微 電同號(hào):1580 1280 825。淘寶交易,安全無憂。 ●CSSCI來源期刊: 《電子政務(wù)》、《漢語學(xué)習(xí)》、《會(huì)計(jì)與經(jīng)濟(jì)研究》、《現(xiàn)代中文學(xué)刊》、《甘肅行政學(xué)院學(xué)報(bào)》、《天津體育學(xué)院學(xué)報(bào)》《民族學(xué)刊》、《大學(xué)教育科學(xué)》、《金融論壇》、《南方經(jīng)濟(jì)》、《東北亞論壇》、《寧夏社會(huì)科學(xué)》、《法商研究

19、》、《云南社會(huì)科學(xué)》、《人文雜志》、《甘肅社會(huì)科學(xué)》、《東北大學(xué)學(xué)報(bào)》、《自然資源與環(huán)境》。審稿周期:35-90天辦結(jié)查稿。 ●北大核心期刊: 《西安理工大學(xué)學(xué)報(bào)》、《心理與行為研究》、《統(tǒng)計(jì)與信息論壇》、《人口與發(fā)展》、《廣西民族大學(xué)學(xué)報(bào).哲學(xué)社會(huì)科學(xué)版》、《南昌大學(xué)學(xué)報(bào)·理科版》、《現(xiàn)代法學(xué)》、《江西財(cái)經(jīng)大學(xué)學(xué)報(bào)》、《武漢金融》、《學(xué)校黨建與思想教育》、《成人教育》、《中國科技翻譯》審稿周期:35-90天辦結(jié)查稿。 ●普刊:《中國新通信》、《蘭臺(tái)內(nèi)外》、《中國多媒體與網(wǎng)絡(luò)教學(xué)學(xué)報(bào)》、《農(nóng)村科學(xué)實(shí)驗(yàn)》、《今日財(cái)富》、《心血管外科》《中國結(jié)合醫(yī)學(xué)》、《經(jīng)貿(mào)實(shí)踐》、《語文課內(nèi)外

20、》、《記者觀察》、《新課程》、《現(xiàn)代職業(yè)教育》、《建筑與裝飾》、《畜牧獸醫(yī)科學(xué)》、《化工管理》、《魅力中國》、《人力資源管理》、《新教育時(shí)代》、《心理月刊》等300多家國家級(jí)、省級(jí)普刊。審稿周期:1-7天辦結(jié)查稿。 將原始數(shù)據(jù)中與客戶特征、使用情況等信息保存為用戶信息表(tb_user),與購買商品有關(guān)的保存為商品購買表(tb_good),以O(shè)racle數(shù)據(jù)庫為載體記錄相關(guān)表格。兩表的部分信息如下: 表1 用戶信息表 編號(hào) 字段 字段解釋 1 id 序號(hào) 2 ip 用戶IP 3 sex 性別 4 age 年齡 5 education 受教育程度 6

21、 vocation 職業(yè) 7 icome 月收入或生活費(fèi) 8 frequency 最近三個(gè)月購物的總次數(shù) 9 cost 平均每次購物的總花費(fèi) … … … 表2 商品購買表 編號(hào) 字段 字段解釋 1 id 序號(hào) 2 ip 用戶IP 3 import_milk 進(jìn)口牛奶 4 import_cookie 進(jìn)口餅干/糕點(diǎn) … … … (三)數(shù)據(jù)處理 原始的數(shù)據(jù)通常由于主、客觀原因,會(huì)包含異常數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)或重復(fù)數(shù)據(jù),是不能直接進(jìn)行關(guān)聯(lián)分析的,因此必須進(jìn)行數(shù)據(jù)預(yù)處理。 1.數(shù)據(jù)選擇 首先是篩選用戶信息表,用戶的性別、年齡、

22、受教育程度、月收入或生活費(fèi)、最近三個(gè)月購物的總次數(shù)、平均每次購物的總花費(fèi)等屬性,這些屬性能夠預(yù)測顧客的購買行為,對(duì)推薦產(chǎn)生作用;而次要屬性比如序號(hào),用戶IP等屬性對(duì)于統(tǒng)計(jì)分析是必要的,但是關(guān)聯(lián)分析可以刪除。對(duì)于商品購買表,客戶購買的產(chǎn)品涉及50種,要從中選取出購買頻率高的前10位產(chǎn)品,所以先做一個(gè)簡單的統(tǒng)計(jì),然后篩選下能夠進(jìn)行關(guān)聯(lián)分析的購買相對(duì)較多的產(chǎn)品。選擇后兩表的字段如下: 表3 數(shù)據(jù)選擇后用戶信息表 編號(hào) 字段 字段解釋 1 sex 性別 2 age 年齡 3 education 受教育程度 4 icome 月收入或生活費(fèi) 5 frequency 最

23、近三個(gè)月購物的總次數(shù) 6 cost 平均每次購物的總花費(fèi) 7 reason 選擇在這購物的理由 8 campaign 最喜歡的優(yōu)惠活動(dòng) 9 way 下單方式 10 satisfaction 滿意度 表4 數(shù)據(jù)選擇后商品購買表 編號(hào) 字段 字段解釋 1 import 進(jìn)口零食 2 sweet 糖果/巧克力 3 drink 飲料/水 4 protein 肉類/豆干制品 5 cookie 餅干糕點(diǎn) 6 milk 牛奶乳品 7 nut 堅(jiān)果炒貨 8 washing 個(gè)人洗護(hù) 9 tissue 紙制品/衛(wèi)生紙

24、 10 fruit 水果 2.數(shù)據(jù)清理 數(shù)據(jù)清理以提高數(shù)據(jù)質(zhì)量為目標(biāo),將數(shù)據(jù)質(zhì)量提高到挖掘技術(shù)所要求的水平。去掉不完整的數(shù)據(jù)和噪聲數(shù)據(jù),提高數(shù)據(jù)挖掘結(jié)果的質(zhì)量。例如將一行記錄中全是空值的記錄,殘缺的記錄去除,以方便進(jìn)行數(shù)據(jù)挖掘。清理后最終留下300條記錄。 3.數(shù)據(jù)轉(zhuǎn)換 主要是對(duì)數(shù)據(jù)進(jìn)行規(guī)格化操作,來適應(yīng)關(guān)聯(lián)分析工具和相應(yīng)的算法。常用的開源挖掘工具如WEKA、RapidMiner、NLTK、Orange等,需要將字符集轉(zhuǎn)換為英文,否則可能出現(xiàn)亂碼的情況。常見的關(guān)聯(lián)規(guī)則算法,如Apriori 算法是布爾類型的算法,原始數(shù)據(jù)表格中所使用的字段,數(shù)據(jù)類型不一的,需要進(jìn)行轉(zhuǎn)化成相應(yīng)的

25、布爾類型: (1)量化屬性離散化:對(duì)于數(shù)值類型的屬性,需要進(jìn)行離散化處理,先進(jìn)行最大最小值統(tǒng)計(jì),對(duì)于如果最大值是離群點(diǎn),可以選擇相對(duì)正常的較高值作為最大值,再劃分為幾個(gè)區(qū)間。例如用戶信息表中的“月收入或生活費(fèi)、最近三個(gè)月購物的總次數(shù)、平均每次購物的總花費(fèi)”字段就是數(shù)值屬性。根據(jù)取值的分布規(guī)律,我們將月收入或生活費(fèi)其劃分為五個(gè)組,分別是0-1500(1)、1501-3000(2)、3001-5000(3)、5001-10000(4)和10001-20000(5)。將最近三個(gè)月購物的總次數(shù)分成三個(gè)組,分別是0-2次(1),3-5次(2),5次以上(3),將平均每次購物的總花費(fèi)分成6個(gè)組,分別是5

26、0元及以下(1),51-100元(2),101-300元(3),301-500元(4),501-1000元(5),1000元以上(6)。 (2)類別屬性轉(zhuǎn)化:用戶戶信息表中的“性別”字段,需要轉(zhuǎn)化為M(男)和F(女)這樣的布爾型;“受教育程度”可分為college(大專及以下)、undergraduate(本科);“選擇在這購物的理由”可分為price(價(jià)格優(yōu)惠)、pay(支付方式完善)、logistics(物流速度快)、quality(質(zhì)量保障)、variety(品種豐富)、promotion(優(yōu)惠促銷活動(dòng)豐富)。“最喜歡的優(yōu)惠活動(dòng)、下單方式、滿意度”三個(gè)字段按照以上方式依次進(jìn)行類別布爾轉(zhuǎn)

27、換。 對(duì)于商品購買表,需要處理為布爾矩陣格式,即每行表示一條交易記錄,列中的yes/no值表示這條記錄中顧客是否購買了該商品,并不考慮各個(gè)商品自身的價(jià)格、購買單位等。最終完成轉(zhuǎn)化的表部分?jǐn)?shù)據(jù)如下: 圖7 數(shù)據(jù)轉(zhuǎn)化后用戶信息表 圖8 數(shù)據(jù)轉(zhuǎn)化后商品購買表 (四)關(guān)聯(lián)挖掘 本文將使用挖掘工具WEKA來進(jìn)行關(guān)聯(lián)挖掘。WEKA的全名是懷卡托智能分析環(huán)境,是一款開源數(shù)據(jù)挖掘軟件,集合了大量數(shù)據(jù)挖掘算法和數(shù)據(jù)處理功能,關(guān)聯(lián)規(guī)則是其中典型的一種。 點(diǎn)擊啟動(dòng)運(yùn)行WEKA軟件后,發(fā)現(xiàn)WEKA存儲(chǔ)數(shù)據(jù)的格式是ARFF文件。除了ARFF格式,WEKA還支持另外一種常見格式,CSV格式。而對(duì)于保存

28、在數(shù)據(jù)庫中的數(shù)據(jù),WEKA支持JDBC訪問數(shù)據(jù)庫。具體的挖掘過程如下: 1.導(dǎo)入數(shù)據(jù) 環(huán)境: (1)主機(jī):Weka 3.8,PL/SQL,ojdbc14.jar (2)VMware Workstation:Oracle11g 連接步驟: (1)安裝weka軟件,完成后將oracle的架包ojdbc14.jar放到weka安裝目錄(D:/Program Files/Weka-3-8/)下; (2)打開D:/Program Files/Weka-3-8/weka.jar這個(gè)文件,修改文件weka.jar-weka-experiment-DatabaseUtils.props.orac

29、le ,指定虛擬機(jī)中的oracle數(shù)據(jù)庫為連接的jdbc,設(shè)置相應(yīng)的數(shù)據(jù)庫的URL、端口號(hào)和數(shù)據(jù)庫名:“jdbcURL=jdbc:oracle:thin:@192.168.163.3:1521:XE”,然后將文件另存為DatabaseUtils.props,刪除安裝目錄下的原文件。 (3)打開D:/Program Files/Weka-3-8/目錄下的runweka.ini 文件,找到最后一行,設(shè)置環(huán)境變量: cp=%CLASSPATH%;D:/Program Files/Weka-3-8/lib/ojdbc14.jar。 (4) 重新啟動(dòng)weka,選擇進(jìn)入Explorer應(yīng)用,以O(shè)pe

30、n DB方式載入SQL-Viewer界面,此時(shí)Connection-URL文本框中已經(jīng)自動(dòng)設(shè)置為DatabaseUtils.props中的值“jdbc:oracle:thin:@192.168.163.3:1521:XE”,點(diǎn)擊User按鈕,設(shè)置數(shù)據(jù)庫連接的Username和Password,分別為HR和123456。如圖9所示 圖9 數(shù)據(jù)庫連接配置 點(diǎn)擊OK后連接,如果連接成功,Info下會(huì)顯示提醒信息。 (5)在Query窗口中根據(jù)查詢需要輸入SQL語句“select * from tb_user”和“select * from tb_good”,點(diǎn)擊“Execute”按鈕執(zhí)行

31、,可在“Result”框下看到對(duì)應(yīng)的表格數(shù)據(jù)。如圖10所示 圖10 查詢的結(jié)果集 (6)點(diǎn)擊“OK”按鈕即可導(dǎo)入。如圖11所示 圖11 數(shù)據(jù)導(dǎo)入完成 2.關(guān)聯(lián)規(guī)則分析 作關(guān)聯(lián)規(guī)則的分析,將WEKA切換到“Associate”選項(xiàng)卡。可選擇的算法有Apriori、FilteredAssociator、FPGrowth,默認(rèn)使用Apriori算法。如果發(fā)現(xiàn)該算法呈現(xiàn)灰色不能點(diǎn)擊,可能是數(shù)據(jù)不符合類型,需要重新調(diào)整數(shù)據(jù)。 關(guān)聯(lián)規(guī)則是形如L->R的規(guī)則,它的重要指標(biāo)支持度(Support)和置信度(Confidence),描述了其有用性和確定性。對(duì)于客戶購物關(guān)聯(lián)分析來說,支持度

32、s(L->R)就是購買了一些商品中同時(shí)觀察到商品L和R的概率,而置信度就是所有購買了L商品的記錄中時(shí)L和R的同時(shí)存在的概率。支持度和置信度都較高的規(guī)則實(shí)用價(jià)值比較高。 Apriori算法的基本思想是先設(shè)置最小支持度和最小置信度,通過對(duì)n條記錄產(chǎn)生候選頻繁項(xiàng)集進(jìn)行支持度和置信度進(jìn)行計(jì)算,將滿足最小支持度和最小置信度的項(xiàng)集保留下來,作為新的記錄,再次產(chǎn)生候選頻繁項(xiàng)集。通過迭代,最后記錄中所有滿足要求的頻繁項(xiàng)集就是關(guān)聯(lián)規(guī)則。 點(diǎn)擊“Choose”右邊的文本框修改默認(rèn)的參數(shù),計(jì)劃挖掘出最小支持度(lowerBoundMinSupport)為20%,并且最小置信度(minMetric)為90%的關(guān)聯(lián)

33、規(guī)則。將“metricType”設(shè)為confidence,其他參數(shù)不變。如圖12所示 圖12 支持度、置信度設(shè)置 點(diǎn)擊“start”得到結(jié)果如下: 圖13 用戶信息關(guān)聯(lián)結(jié)果 圖14 商品購買關(guān)聯(lián)結(jié)果 (五)關(guān)聯(lián)結(jié)果分析 Apriori算法的參數(shù),設(shè)置最小支持度為20%,最小項(xiàng)集大小為0,這兩項(xiàng)值可根據(jù)實(shí)際情況進(jìn)行設(shè)置。通過關(guān)聯(lián)規(guī)則算法找到了那些頻繁項(xiàng)目集,每一條對(duì)應(yīng)的可得到的結(jié)論為: 1.用戶信息表 (1)性別為女,購買頻率在0-2次的人,下單方式為手機(jī)的概率為100%; (2)性別為女,喜愛的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為100%;

34、(3)喜愛的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為98%; (4)購買頻率在0-2次,喜愛的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為97%; (5)受教育程度為本科,喜愛的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為97%; (6)平均每次在天貓超市購物的總花費(fèi)為51-100元的人,下單方式為手機(jī)的概率為97%; (7)購買頻率在0-2次的人,下單方式為手機(jī)的概率為96%; (8)滿意度為“基本能滿足”的人,下單方式為手機(jī)的概率為95%; (9)受教育程度為本科,購買頻率在0-2次的人,下單方式為手機(jī)的概率為95%; (10)性別為女,下單方式為手機(jī)的

35、概率為92%; 2.商品購買表 (1)購買了肉類/豆干制品并且購買了水果的人,會(huì)購買紙制品/衛(wèi)生紙的概率為99%; (2)購買了肉類/豆干制品、餅干糕點(diǎn)和水果的人,會(huì)購買紙制品/衛(wèi)生紙的概率為98%; (3)購買了進(jìn)口零食并且購買了個(gè)人洗護(hù)的人,會(huì)購買肉類/豆干制品的概率為95%; (4)購買了糖果/巧克力、肉類/豆干制品和堅(jiān)果炒貨的人,會(huì)購買餅干糕點(diǎn)的概率為93%; (5)不購買飲料/水但購買肉類/豆干制品和紙制品/衛(wèi)生紙的人,會(huì)購買餅干糕點(diǎn)的概率為91%; (6)購買了肉類/豆干制品、牛奶乳品但沒有購買水果的人,會(huì)購買堅(jiān)果炒貨的概率為91%; (7)購買了糖果/巧克力和肉類

36、/豆干制品的人,會(huì)購買餅干糕點(diǎn)的概率為91%; (8)購買了糖果/巧克力但沒有飲料/水的人,會(huì)購買餅干糕點(diǎn)的概率為91%。 這些結(jié)論和目前已經(jīng)得到日??蛻糍徺I的情況是一致的,可以作為重要參考,這證明了關(guān)聯(lián)規(guī)則算法在淘寶商務(wù)平臺(tái)客戶購物中的有效性。 四、淘寶商務(wù)平臺(tái)中的關(guān)聯(lián)規(guī)則應(yīng)用 (一)客戶分析 根據(jù)關(guān)聯(lián)結(jié)果,找出顧客群體的特征,依據(jù)特征,進(jìn)行客戶細(xì)分,實(shí)現(xiàn)精準(zhǔn)營銷。 表5 客戶特征組合表 編號(hào) 客戶特征 1 女、0-2次、手機(jī)下單 2 女、直接打折降價(jià)、手機(jī)下單 3 直接打折降價(jià)、手機(jī)下單 4 0-2次、直接打折降價(jià)、手機(jī)下單 5 本科、直接打折降價(jià)、手機(jī)

37、下單 6 51-100元、手機(jī)下單 7 0-2次、手機(jī)下單 8 “基本能滿足”、手機(jī)下單 9 本科、0-2次、手機(jī)下單 10 女、手機(jī)下單 根據(jù)以上特征可以對(duì)營銷策略做出幾點(diǎn)改進(jìn): (1)提高顧客的購買興趣。由關(guān)聯(lián)結(jié)果可知購買頻率在0-2次,每次花費(fèi)在51-100元的女性顧客通過手機(jī)下單的概率高,為了提高購買頻率和刺激顧客的購買興趣,可以對(duì)這些購買頻率低的顧客推送一些快速瀏覽、即興需求的并且有優(yōu)惠活動(dòng)的商品,以適應(yīng)移動(dòng)端購物的特點(diǎn)。“直接打折降價(jià)”能直接的利用顧客對(duì)價(jià)格的敏感心理,促使顧客做出購買的決定。像"特價(jià)只剩24小時(shí)!"這樣的限期供應(yīng),能夠幫助激發(fā)消費(fèi)者的購

38、買欲。但是要真實(shí),否則最終失去消費(fèi)者信任。 (2)讓顧客能較長時(shí)間的停留瀏覽商品??蛻羧后w中女性占比大,學(xué)生、家庭主婦較多,這就不僅僅是標(biāo)題的是否吸引人的問題。在這里針對(duì)她們的購買習(xí)慣,對(duì)商品詳情的描述非常關(guān)鍵,要盡量采用實(shí)地拍攝的商品圖片,少用官方圖片,以提高顧客對(duì)商家的信任度;還要有詳細(xì)的文字說明,不能幾個(gè)字草草了事;對(duì)于商品屬性和規(guī)格的描述要盡可能的詳細(xì);使用相關(guān)模板并利用Photoshop對(duì)圖片進(jìn)行編輯等,以提高其美觀度來吸引顧客的眼球。 (3)讓新顧客變成老顧客。事實(shí)證明,網(wǎng)店留住老顧客比開發(fā)新顧客要重要的多,前者的成本也要遠(yuǎn)低于后者。這里要充分利用顧客的情感,讓顧客感覺到一絲溫

39、馨。比如在發(fā)貨時(shí),根據(jù)商品搭配一個(gè)小禮品,給顧客一個(gè)驚喜;在節(jié)假日,通過短信、郵件等工具送去溫馨的祝福,同時(shí)可以根據(jù)顧客的消費(fèi)頻率和每次消費(fèi)金額分組,“VIP客戶、黃金客戶、普通客戶”等,給予不同的優(yōu)惠待遇,以此來加深與顧客的關(guān)系,增加顧客對(duì)網(wǎng)店的認(rèn)可度和忠誠度。 (二)商品營銷 由以上對(duì)商品購買的關(guān)聯(lián)規(guī)則分析結(jié)果,對(duì)商品營銷做出改進(jìn),可以從以下幾個(gè)方面入手: 1.商品目錄 商品目錄包括全面的導(dǎo)航條和相關(guān)產(chǎn)品展示。對(duì)于淘寶商務(wù)平臺(tái)中的天貓超市,它將進(jìn)口食品和食品飲料放在導(dǎo)航區(qū)的上端、訪問頻率高的位置是合理的。收集的數(shù)據(jù)中購買前10名的多為食品類,并且進(jìn)口食品和食品飲料一起購買的概率在9

40、0%以上。對(duì)于相關(guān)產(chǎn)品展示區(qū),一般的食品類店鋪可以將牛奶、餅干、肉類/豆干制品等顧客愿意購買的組合放在典型商品展示區(qū)。 2.商品廣告 有效的廣告投入可以增加網(wǎng)站的瀏覽量,從而幫助提高銷售額。在淘寶網(wǎng)首頁鉆展展示區(qū)可以投放店鋪活動(dòng)、品牌宣傳,例如強(qiáng)調(diào)主打的肉類/豆干制品、餅干糕點(diǎn)、糖果/巧克力等熱賣商品正在搞活動(dòng);而類似小圖、旺旺彈窗小圖等站位,可以做單品、新品宣傳,建議是熱賣種類里面的具體商品,例如糖果/巧克力種類里面具體的熱賣的費(fèi)列羅巧克力在打折,可以單獨(dú)為其投放廣告,帶來可靠回報(bào)的概率大。 3.交叉銷售 商品的低位定價(jià)策略在電子商務(wù)低成本的環(huán)境下并不一定一直有效,需要配合其他的銷售

41、策略一起實(shí)施。交叉銷售就是在客戶購買了一種商品,向其推薦他具有潛在購買欲望的商品。關(guān)聯(lián)規(guī)則發(fā)現(xiàn)了客戶隱藏的購買需求,這些交叉銷售的組合有: 表6 商品銷售組合表 編號(hào) 銷售組合 1 肉類/豆干制品、水果、紙制品/衛(wèi)生紙 2 肉類/豆干制品、餅干糕點(diǎn)、水果、紙制品/衛(wèi)生紙 3 進(jìn)口零食、個(gè)人洗護(hù)、肉類/豆干制品 4 糖果/巧克力、肉類/豆干制品、堅(jiān)果炒貨、餅干糕點(diǎn) 5 肉類/豆干制品、紙制品/衛(wèi)生紙、餅干糕點(diǎn) 6 肉類/豆干制品、牛奶乳品、堅(jiān)果炒貨 7 糖果/巧克力、肉類/豆干制品、餅干糕點(diǎn) 8 糖果/巧克力、餅干糕點(diǎn) 在促銷時(shí)將類似“肉類/豆干制品+餅干

42、糕點(diǎn)”的組合放在一起,一起打折,或者買一贈(zèng)一。即使本來客戶打算只買肉類/豆干制品這一種商品,但看見餅干糕點(diǎn)同時(shí)在促銷時(shí),也會(huì)超出預(yù)想清單,實(shí)施購買。在這些關(guān)聯(lián)規(guī)則中,也會(huì)發(fā)現(xiàn)一些有趣的組合,如“肉類/豆干制品、水果、紙制品/衛(wèi)生紙”,分析可知,紙制品與食品同時(shí)購買,一方面是消費(fèi)者享用食物時(shí)會(huì)需要紙巾清理垃圾,另一方面為了湊滿88元包郵,消費(fèi)者會(huì)選擇使用期限較長,不會(huì)變質(zhì)的商品來湊單,所以在零食類商品打折促銷時(shí),將紙制品類商品以一個(gè)小于零食類商品打折幅度的折扣進(jìn)行優(yōu)惠,就會(huì)滿足消費(fèi)者湊單的需求。這些生動(dòng)化的商品組合,不僅減輕了顧客的選擇顧慮,同時(shí)提升了客單量,增強(qiáng)了用戶粘性。 五、結(jié)論 本文

43、基于關(guān)聯(lián)規(guī)則,根據(jù)客戶購物關(guān)聯(lián)分析的一般過程對(duì)采集的數(shù)據(jù)進(jìn)行有針對(duì)性的分析,并將提取到的規(guī)則運(yùn)用到電子商務(wù)的應(yīng)用中。由此可知,有效的電子商務(wù)數(shù)據(jù)關(guān)聯(lián)分析,能夠發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品之間的聯(lián)系強(qiáng)度,挖掘用戶潛在的購買模式,并將這些模式所對(duì)應(yīng)的服務(wù)或產(chǎn)品展示給用戶,為其提供參考,從而提高用戶的購買率和滿意度,增加了企業(yè)的競爭優(yōu)勢。 本文的研究成果存在不足之處,還可以進(jìn)一步完善,具體的體現(xiàn)在以下幾個(gè)方面: (1)由于電商數(shù)據(jù)的封裝性和自身?xiàng)l件的限制,本文的購物記錄為問卷調(diào)查所得,缺乏普遍性和時(shí)效性。在后期進(jìn)一步研究中,將搜集更多實(shí)體數(shù)據(jù),并擴(kuò)大數(shù)據(jù)量。 (2)電子商務(wù)平臺(tái)可以收集到大量用戶相

44、關(guān)的數(shù)據(jù),包括交易數(shù)據(jù)、注冊(cè)數(shù)據(jù)、評(píng)分?jǐn)?shù)據(jù)、咨詢數(shù)據(jù)等。企業(yè)的決策目標(biāo)和約束往往是多因素的,如市場占有率、利潤、品牌、平臺(tái)等。本次實(shí)驗(yàn)的算法只側(cè)重于交易數(shù)據(jù)和以增加銷售量為目標(biāo),比較片面??梢赃M(jìn)一步的進(jìn)行多維度、多粒度的整合關(guān)聯(lián)分析,得到的結(jié)果會(huì)比較全面,對(duì)企業(yè)和客戶的實(shí)用價(jià)值更高。 (3)目前,WEKA的關(guān)聯(lián)分析功能僅能用來作為示范,不適合用來挖掘大型數(shù)據(jù)集,進(jìn)一步的研究可以是通過云平臺(tái)等大型專業(yè)分析工具,對(duì)數(shù)據(jù)實(shí)施更深度、 更廣度的挖掘操作。 參考文獻(xiàn) [1] 王茁,顧潔.三位一體的商務(wù)智能[M].北京:電子工業(yè)出版社,2002. [2] 箭

45、牌中國:精準(zhǔn)預(yù)測嘗“甜”頭[EB/OL].http:// bcs/ solutions/bao/case.html. [3] Dien D Phan, Douglas R Vogel. A model of customer relationship management and business intelligence systems for catalogue and online retailers[J]. Information & Management, 2010,47:69-77. [4] 陳暢偉.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘可視化系統(tǒng)的實(shí)現(xiàn)[D].武漢:武漢理工大學(xué),2004.

46、 [5] 李國輝,張軍,湯義.挖掘技術(shù)直面多媒體--信息爆炸帶來新挑戰(zhàn)[R].計(jì)算機(jī)世界報(bào),2012(27):B1-B3. [6] 黃曉濤.電子商務(wù)導(dǎo)論[M].北京:清華大學(xué)出版社,2005. [7] 趙艷霞,梁昌勇.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在電子商務(wù)中的應(yīng)用[J].價(jià)值工程.2006,(5):6-7. [8] 錢雪忠,孔芳.關(guān)聯(lián)規(guī)則挖掘中對(duì) Apriori 算法的研究[J].計(jì)算機(jī)工程與應(yīng)用.2008, (44):56-78. [9] 毛國君,段立娟. 數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005. [10] Michael J.A.Berry,Gordon S.L

47、inoff.?dāng)?shù)據(jù)挖掘[M].北京:中國財(cái)政經(jīng)濟(jì)出版社,2004. [11]高宏賓,潘谷,黃義明.基于頻繁項(xiàng)集特性的 Apriori 算法的改進(jìn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(l0):2273-2275. [12] 劉德喜,何炎祥,邢顯黎.一種新的頻繁項(xiàng)集挖掘算法[J].計(jì)算機(jī)應(yīng)用研究,2007,(2):17-19. [13]王安,仇德成,安云峰,王繼偉.一種雙進(jìn)的基于關(guān)系矩陣的關(guān)聯(lián)規(guī)則快速挖掘算法[J].現(xiàn)代電子技術(shù),2007,(3):114-116. [14]劉景春,王永利.適合在線式增量更新的關(guān)聯(lián)規(guī)則挖掘算法[J].計(jì)算機(jī)工程與應(yīng)用,2004,(12):188-1

48、92. [15]王瑋,陳思紅.關(guān)聯(lián)規(guī)則的相關(guān)性研究[J].計(jì)算機(jī)工程,2012,26(7):33-36. [16]王旭,劉明剛.關(guān)聯(lián)規(guī)則研究[J].經(jīng)濟(jì)研究導(dǎo)刊,2010,(8):04-15. [17]CHAU M, CHENG R, KAO B. Uncertain data mining: a new research direction[C]. Proceedings of Workshop on the Sciences of the Artificial. Washington DC: IEEE Computer Society, 2005.199-204.? [18

49、]趙衛(wèi)東.客戶智能[M].北京:清華大學(xué)出版社,2013. [19]Ben J S, Joseph A K, John R. E-commerce recommendation application[R]. GroupLens Research Project, 2002. 附錄 附錄:原始數(shù)據(jù) 注:表格數(shù)據(jù)量過多,無法將所有字段和記錄都列舉出來,這里的原始數(shù)據(jù)僅展示部分?jǐn)?shù)據(jù)。表頭字段依次為:序號(hào)、提交問卷時(shí)間、所用時(shí)間、來自IP、來源、您的性別、您的年齡、您的受教育程度、您的職業(yè)、您的收入或生活費(fèi)、您最近三個(gè)

50、月在天貓超市購物的總次數(shù)、您平均每次在天貓超市購物的總花費(fèi)、進(jìn)口食品、食品飲料、糧油副食、美容洗護(hù)、家具家電、家庭清潔、母嬰用品、生鮮水果、價(jià)格優(yōu)惠、品種豐富、質(zhì)量保障、配送范圍廣。表格記錄中的數(shù)字為問卷題目的選項(xiàng)序號(hào),如您的性別這列中的1和2,分別表示男和女兩個(gè)選項(xiàng),其他列以此類推。 1 2017/5/6 0:36:32 345秒 117.136.66.156 手機(jī)提交 微信 1 1 1 3 3 3 1 0 1 0 0 0 0 0 0 1 2 3 -2 2 2017/5/6 13:19:15 283秒 218.205.18.178

51、 手機(jī)提交 微信 2 1 2 3 1 1 2 1 1 0 0 0 0 0 0 1 2 -2 -2 3 2017/5/6 13:23:04 150秒 117.60.102.39 手機(jī)提交 微信 2 1 2 3 1 1 2 1 1 0 1 0 0 0 0 2 -2 -2 -2 4 2017/5/6 13:25:39 243秒 218.205.20.35 手機(jī)提交 直接訪問 2 1 2 3 1 1 2 0 1 0 0 0 0 0 0 1 -2 -2 2 5

52、 2017/5/6 13:28:52 135秒 183.206.158.14 手機(jī)提交 微信 2 1 2 3 2 1 2 0 1 0 1 0 1 0 0 1 2 3 -2 6 2017/5/6 13:34:37 223秒 140.243.232.40 手機(jī)提交 微信 2 1 1 3 2 -3 -3 -3 -3 -3 -3 -3 -3 -3 -3 -2 -2 -2 -2 7 2017/5/6 13:39:35 150秒 117.136.81.172 手機(jī)提交 微信 1 3 1 6

53、 5 1 3 0 0 1 1 1 1 0 0 1 2 3 -2 8 2017/5/6 13:41:05 269秒 117.136.79.143 手機(jī)提交 微信 2 1 2 3 1 1 2 0 1 0 1 0 0 0 0 1 -2 2 -2 9 2017/5/6 13:41:48 100秒 112.23.83.114 手機(jī)提交 微信 2 2 2 3 2 1 2 0 1 0 1 0 0 0 0 1 2 -2 -2 10 2017/5/6 13:42:38 128秒

54、 180.99.65.49 手機(jī)提交 微信 2 2 2 2 3 1 3 0 1 0 0 0 0 0 0 -2 2 1 -2 11 2017/5/6 13:43:19 143秒 112.3.149.191 手機(jī)提交 微信 2 3 1 5 1 2 2 0 1 1 1 0 1 0 1 1 -2 -2 -2 12 2017/5/6 13:45:52 116秒 101.88.64.122 手機(jī)提交 微信 2 2 1 7 3 3 2 0 1 1 0 0 1 0 0 -2

55、 -2 1 -2 13 2017/5/6 13:47:00 788秒 49.82.197.180 手機(jī)提交 微信 1 2 2 3 1 2 3 0 1 0 1 0 1 0 0 3 2 1 -2 14 2017/5/6 13:48:52 164秒 117.136.79.143 手機(jī)提交 微信 1 2 2 3 1 1 3 1 1 0 0 0 1 0 0 -2 -2 -2 3 15 2017/5/6 13:50:21 722秒 36.149.176.139 手機(jī)提交 微信 2 3

56、1 7 2 1 2 0 0 0 0 0 1 0 0 3 -2 1 2 16 2017/5/6 14:00:36 289秒 36.149.229.217 手機(jī)提交 微信 2 1 1 2 1 1 1 1 0 0 0 0 0 0 0 1 2 3 -2 17 2017/5/6 14:13:48 467秒 49.92.121.236 手機(jī)提交 直接訪問 1 2 2 6 5 1 3 0 1 1 0 0 0 0 0 2 -2 -2 -2 18 2017/5/6 14:25:

57、04 154秒 183.206.136.28 手機(jī)提交 微信 2 1 1 2 2 2 3 1 1 1 0 0 1 0 0 -2 1 2 -2 19 2017/5/6 14:41:36 149秒 36.5.9.196 手機(jī)提交 直接訪問 2 1 2 3 1 2 1 0 0 0 0 0 0 0 1 -2 3 1 -2 20 2017/5/6 14:45:06 278秒 122.96.42.130 手機(jī)提交 微信 2 1 2 3 2 1 3 0 1 0 0 0 0

58、0 0 1 -2 -2 -2 21 2017/5/6 14:45:59 263秒 36.149.216.81 手機(jī)提交 微信 2 1 2 3 1 1 2 0 1 0 1 1 1 0 0 -2 1 2 -2 22 2017/5/6 15:01:57 482秒 36.149.48.22 手機(jī)提交 微信 2 3 1 4 3 2 2 0 0 0 1 0 1 1 0 -2 -2 -2 2 23 2017/5/6 15:13:29 1492秒 180.102.116.175 手機(jī)提交

59、微信 2 1 1 3 2 1 3 1 0 0 0 0 1 0 0 1 -2 3 -2 24 2017/5/6 16:26:34 104秒 121.238.244.101 手機(jī)提交 直接訪問 2 1 2 3 1 1 3 1 1 0 1 0 0 0 0 2 -2 -2 -2 25 2017/5/6 16:34:10 81秒 39.73.127.192 手機(jī)提交 直接訪問 2 1 2 3 1 1 2 0 1 1 1 0 0 0 0 1 -2 -2 -2

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!