歡迎來到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁 裝配圖網(wǎng) > 資源分類 > PPT文檔下載  

hadoop入門實(shí)例教程40-MapReduce高階實(shí)現(xiàn).ppt

  • 資源ID:11496479       資源大?。?span id="zpx7xrb" class="font-tahoma">1.57MB        全文頁數(shù):14頁
  • 資源格式: PPT        下載積分:9.9積分
快捷下載 游客一鍵下載
會(huì)員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺(tái)登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要9.9積分
郵箱/手機(jī):
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機(jī)號(hào),方便查詢和重復(fù)下載(系統(tǒng)自動(dòng)生成)
支付方式: 支付寶    微信支付   
驗(yàn)證碼:   換一換

 
賬號(hào):
密碼:
驗(yàn)證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開,此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請(qǐng)使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預(yù)覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒有明確說明有答案則都視為沒有答案,請(qǐng)知曉。

hadoop入門實(shí)例教程40-MapReduce高階實(shí)現(xiàn).ppt

Hadoop大數(shù)據(jù)解決方案進(jìn)階應(yīng)用,Hadoop,講師:迪倫(北風(fēng)網(wǎng)版權(quán)所有),MapReduce高階實(shí)現(xiàn)(14),半連接實(shí)例全局作業(yè)參數(shù)傳遞全局?jǐn)?shù)據(jù)文件傳遞,課程目標(biāo),實(shí)例執(zhí)行結(jié)果:半連接,多數(shù)據(jù)源連接解決方法的限制,如果數(shù)據(jù)源兩兩之間需要進(jìn)行多個(gè)不同的主鍵和外鍵的連接,則無法一次性完成數(shù)據(jù)源的連接通過多次使用MapReduce過程完成不同主/外鍵鍵的連接例如,有三個(gè)數(shù)據(jù)源,Customers(CustomerID主鍵)、Orders(OrderID主鍵,CustomerID外鍵、ItemID外鍵)、Products(ItemID主鍵)解決方法:設(shè)計(jì)兩個(gè)MapReduce作業(yè)第一個(gè)作業(yè)完成Customers與Orders的連接第二個(gè)作業(yè)完成第一個(gè)作業(yè)的連接結(jié)果與Products的連接,全局作業(yè)參數(shù)/數(shù)據(jù)的傳遞,MapReduce作業(yè)處理過程中,有時(shí)需要讓每個(gè)節(jié)點(diǎn)共享一些重要的計(jì)算參數(shù)或數(shù)據(jù)對(duì)于小的計(jì)算參數(shù),可以通過Configuration類來傳遞對(duì)于較大的數(shù)據(jù),可以用共享數(shù)據(jù)文件來進(jìn)行傳遞盡量避免用硬代碼方式在程序中設(shè)置作業(yè)參數(shù),而是設(shè)置作業(yè)參數(shù)實(shí)現(xiàn)一個(gè)具有一定通用性的程序,允許任意指定字段作為參數(shù)運(yùn)行程序時(shí)指定需傳遞的數(shù)據(jù)然后該參數(shù)作為一個(gè)屬性保存在Configuration對(duì)象中并允許Map和Reduce節(jié)點(diǎn)從Configuration對(duì)象中獲取和使用該屬性值,全局作業(yè)參數(shù)的傳遞,Configuration類提供的保存和獲取屬性的方法,全局作業(yè)參數(shù)的傳遞實(shí)例,需求:處理顧客和訂單數(shù)數(shù)據(jù)集的連接連接主鍵參數(shù)希望通過在命令行中給出連接主鍵的列號(hào)來設(shè)置代碼實(shí)現(xiàn)將第1個(gè)輸入?yún)?shù)設(shè)置為GroupKeyColIdx屬性,全局作業(yè)參數(shù)的傳遞實(shí)例,在Mapper或Reducer類的初始化方法中從Configuration對(duì)象中讀取該屬性值,查詢?nèi)諱apReduce作業(yè)屬性,程序可以通過Configuration對(duì)象,使用預(yù)定義的屬性名稱查詢計(jì)算作業(yè)相關(guān)的信息,查詢?nèi)諱apReduce作業(yè)屬性,通過Configuration類中提供的屬性獲取方法進(jìn)行,在屬性讀取方法中把相應(yīng)的作業(yè)屬性名設(shè)置好即可,全局?jǐn)?shù)據(jù)文件的傳遞,通過分布式緩存實(shí)現(xiàn)數(shù)據(jù)文件的傳遞先將這些文件傳送到分布式緩存中然后各個(gè)節(jié)點(diǎn)從分布式緩存中將文件復(fù)制到本地的文件系統(tǒng)中使用為提高訪問速度,通常會(huì)將較小的文件數(shù)據(jù)讀入各節(jié)點(diǎn)的內(nèi)存中使用涉及的編程設(shè)置Job類publicvoidaddCacheFile(URLuri):將一個(gè)文件存放到分布式緩存中Mapper或Reducer的context類publicPathgetLocalCacheFiles():獲取設(shè)置在分布式緩存中的文件路徑,以便能將這些文件讀入到每個(gè)節(jié)點(diǎn),全局?jǐn)?shù)據(jù)文件的傳遞,實(shí)現(xiàn)將文件存入分布式緩存:,從Mapper或Reducer的setup()方法中進(jìn)行讀取文件的初始化處理,全局?jǐn)?shù)據(jù)文件的傳遞,歡迎訪問我們的官方網(wǎng)站,

注意事項(xiàng)

本文(hadoop入門實(shí)例教程40-MapReduce高階實(shí)現(xiàn).ppt)為本站會(huì)員(tia****nde)主動(dòng)上傳,裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng)(點(diǎn)擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因?yàn)榫W(wǎng)速或其他原因下載失敗請(qǐng)重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!