信息檢索與word文字處理.ppt
《信息檢索與word文字處理.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《信息檢索與word文字處理.ppt(31頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
信息檢索與網(wǎng)絡(luò)應(yīng)用,SENTAIDAITBADE,,信息檢索與網(wǎng)絡(luò)應(yīng)用,,,,感受檢索的魅力,網(wǎng)站內(nèi)容的獲取,常用網(wǎng)站,主題詞的設(shè)定,計(jì)算機(jī)信息的檢索,,計(jì)算機(jī)信息檢索基礎(chǔ),計(jì)算機(jī)檢索系統(tǒng)概述,計(jì)算機(jī)信息檢索:利用計(jì)算機(jī)及相關(guān)軟件和通信設(shè)備,對(duì)本地計(jì)算機(jī)、遠(yuǎn)程服務(wù)器上存貯的信息進(jìn)行檢索。1.計(jì)算機(jī)信息檢索的發(fā)展大體經(jīng)歷了三個(gè)階段:聯(lián)機(jī)檢索階段(60年代中期到70年代中期);光盤數(shù)據(jù)庫(kù)檢索階段(70年代中期到80年代末);網(wǎng)絡(luò)化檢索階段(90年代初至今)。2.計(jì)算機(jī)信息檢索的服務(wù)方式(1)回溯檢索指追溯查找過(guò)去的信息,幫助用戶查找過(guò)去幾年甚至幾十年的文獻(xiàn)信息,使用戶一次檢索就可以全面了解某一課題在某一段時(shí)間中的發(fā)展情況。,,計(jì)算機(jī)檢索系統(tǒng)概述,(2)定題檢索定題檢索服務(wù)是根據(jù)用戶檢索課題的內(nèi)容,一次性輸人事先確定好的檢索提問(wèn)式保存在檢索系統(tǒng)中。(3)人機(jī)對(duì)話檢索用戶一旦輸入檢索提問(wèn),計(jì)算機(jī)檢索系統(tǒng)就可立即執(zhí)行,并在用戶終端顯示屏上輸出檢索結(jié)果。(4)聯(lián)機(jī)訂購(gòu)用戶通過(guò)聯(lián)機(jī)檢索得到的結(jié)果一般都是二次文獻(xiàn),如果需要一次文獻(xiàn),可以通過(guò)終端聯(lián)機(jī)訂購(gòu)原始文獻(xiàn)的復(fù)印件或原文。,SENTAIDA,,計(jì)算機(jī)檢索系統(tǒng)的結(jié)構(gòu),1.計(jì)算機(jī)信息檢索原理計(jì)算機(jī)信息檢索是指人們?cè)谟?jì)算機(jī)檢索網(wǎng)絡(luò)或終端上,使用特定的檢索指令、檢索詞和檢索策略,從計(jì)算機(jī)檢索系統(tǒng)的數(shù)據(jù)庫(kù)中檢索出所需要的信息,然后再由終端設(shè)備顯示、下載和打印的過(guò)程。廣義的計(jì)算機(jī)信息檢索包含兩個(gè)過(guò)程:(1)對(duì)原始信息加工處理并存貯在各種信息載體上一是對(duì)待加工的信息進(jìn)行著錄,即按一定的規(guī)則進(jìn)行描述。二是對(duì)待加工的信息進(jìn)行標(biāo)引。形成從內(nèi)容角度查找信息的檢索點(diǎn)。,SENTAIDA,,計(jì)算機(jī)檢索系統(tǒng)的結(jié)構(gòu),(2)信息查詢過(guò)程用戶對(duì)檢索需求加以分析,明確檢索范圍,弄清主題概念,然后用系統(tǒng)語(yǔ)言或自然語(yǔ)言表示主題概念,形成檢索標(biāo)識(shí)及檢索策略,輸入計(jì)算機(jī)進(jìn)行查找。2.計(jì)算機(jī)檢索系統(tǒng)的構(gòu)成由計(jì)算機(jī)硬件,檢索軟件、數(shù)據(jù)庫(kù)、通信網(wǎng)絡(luò)等組成。,計(jì)算機(jī)檢索的基本程序,1.分析檢索課題就是明確檢索目的、要求和檢索的范圍。2.選擇檢索系統(tǒng)和數(shù)據(jù)庫(kù)根據(jù)主題范圍、信息類型、時(shí)間范圍等因素選擇檢索系統(tǒng)和數(shù)據(jù)庫(kù)。3.確定檢索途徑和檢索詞常用的檢索途徑有著者、分類、主題、文獻(xiàn)題名、文獻(xiàn)號(hào)、代碼、引文、文獻(xiàn)類型,出版時(shí)間、語(yǔ)種等。檢索詞是表達(dá)文獻(xiàn)信息需求的基本元素,是用戶輸入的檢索語(yǔ)詞。,計(jì)算機(jī)檢索的基本程序,4.構(gòu)建檢索式是用來(lái)表達(dá)用戶檢索提問(wèn)的邏輯表達(dá)式,由檢索詞和各種布爾邏輯算符、位置算符、截詞符以及系統(tǒng)規(guī)定的其他組配連接符號(hào)組成,是檢索策略具體體現(xiàn)。5.檢索并調(diào)整檢索策略在檢索過(guò)程中應(yīng)及時(shí)分析檢索結(jié)果是否與檢索要求一致,并根據(jù)檢索結(jié)果對(duì)檢索詞、檢索提問(wèn)式作相應(yīng)的修改和調(diào)整,直至得到比較滿意的結(jié)果。6.輸出檢索結(jié)果根據(jù)檢索系統(tǒng)提供的檢索結(jié)果輸出方式,選擇需要的記錄以及相應(yīng)的字段,選擇文摘或全文等,將檢索結(jié)果顯示在屏幕上、或存儲(chǔ)到磁盤上、或打印輸出。,信息檢索的基本技術(shù),計(jì)算機(jī)檢索的基本技術(shù),信息的檢索模型有布爾檢索模型、向量空間模型、概率模型、模糊集合模型、擴(kuò)展布爾檢索模型等幾種。具體檢索技術(shù)有布爾檢索、截詞檢索、限制檢索、加權(quán)檢索、聚類檢索等。1.布爾邏輯檢索技術(shù)指利用布爾運(yùn)算符連接各個(gè)檢索詞,由計(jì)算機(jī)進(jìn)行相應(yīng)邏輯運(yùn)算,以找出所需信息的方法。AND(或)、OR(或+)、NOT(或一)。2.截詞檢索技術(shù)分為后截詞檢索(前方一致),前截詞檢索(后方一致),中截詞檢索(前后方一致),以及前后截詞檢索(中間一致)基本類型?!?”代表多個(gè)字符,“#”代表單個(gè)字符,“?”或者“n?”代表O個(gè)到9個(gè)額外的字符。,計(jì)算機(jī)檢索的基本技術(shù),3.位置檢索技術(shù)可要求檢索詞以用戶所規(guī)定的相對(duì)位置出現(xiàn)。常用的位置算符有以下8種:(w)算符(WITH)、(nw)算符(nWORD)、(N)算符(NEAR)、(nN)算符(nNEAR)、(F)算符(FIELD)、(S)算符(SUBFIELD)、(C)算符(CITATION)、(L)算符(LINK)4.加權(quán)檢索技術(shù)方法是:在檢索提問(wèn)式中,根據(jù)每個(gè)提問(wèn)詞重要程度,分別給予一定的加權(quán)數(shù)值加以區(qū)別,稱為權(quán)數(shù);同時(shí)再給出檢索命中的閾值。5.限制檢索技術(shù)是通過(guò)限制檢索范圍,達(dá)到優(yōu)化檢索結(jié)果的方法。限制檢索的方式有多種,例如進(jìn)行字段檢索、使用限制符、采用限制檢索命令等。,互聯(lián)網(wǎng)信息資源概述,1.互聯(lián)網(wǎng)信息資源的內(nèi)涵即指以數(shù)字化形式記錄的,以多種媒體形式表達(dá)的,分布式存儲(chǔ)在互聯(lián)網(wǎng)不同主機(jī)上并通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)通訊方式進(jìn)行傳遞的信息資源的集合。2.互聯(lián)網(wǎng)信息資源的特點(diǎn)數(shù)字化存儲(chǔ)和傳遞;數(shù)量巨大,增長(zhǎng)迅速;內(nèi)容豐富,形式多樣;穩(wěn)定性差,變化頻繁;結(jié)構(gòu)復(fù)雜,分布廣泛;信息組織的局部有序性與整體無(wú)序性;信息新穎,定期更新;3.互聯(lián)網(wǎng)信息資源的類型和內(nèi)容類型主要包括:非正式出版信息、半正式出版信息、正式出版信息、萬(wàn)維網(wǎng)(WWW)信息資源、電子郵件(E-mail)信息資源、FTP信息資源(文件傳送協(xié)議)、Telnet信息資源(遠(yuǎn)程登錄協(xié)議)、Usenet/Newsgroup信息資源(專題討論組),互聯(lián)網(wǎng)信息資源概述,4.互聯(lián)網(wǎng)信息資源的組織互聯(lián)網(wǎng)信息組織方法可歸納為語(yǔ)法信息組織方法、語(yǔ)義信息組織方法和語(yǔ)用信息組織方法?;ヂ?lián)網(wǎng)信息資源的組織形式主要表現(xiàn)為:網(wǎng)頁(yè)網(wǎng)站、搜索引擎、專業(yè)導(dǎo)航系統(tǒng)、虛擬圖書館等。5.互聯(lián)網(wǎng)信息資源的評(píng)價(jià)評(píng)價(jià)標(biāo)準(zhǔn)包括9項(xiàng):信息的準(zhǔn)確性;信息發(fā)布者的權(quán)威性;提供信息的廣度和深度;主頁(yè)中的鏈接是否可靠、有效;版面設(shè)計(jì)質(zhì)量;信息的時(shí)效性;讀者對(duì)象;信息的獨(dú)特性;主頁(yè)的可操作性,并特別強(qiáng)調(diào)可存取性、權(quán)威性、交互性和愉悅性這四項(xiàng)標(biāo)準(zhǔn)。,互聯(lián)網(wǎng)搜索引擎,搜索引擎(searchengine)是對(duì)互聯(lián)網(wǎng)上的信息資源進(jìn)行搜集整理,然后提供查詢的系統(tǒng).它包括信息搜集、信息整理和用戶查詢?nèi)糠?。包括目錄服?wù)和關(guān)鍵字檢索兩種服務(wù)方式。搜索引擎可以是一個(gè)專門的網(wǎng)站,也可以是某個(gè)網(wǎng)站上的一個(gè)系統(tǒng)。1.搜索引擎的類型按照索引方式分為分類搜索引擎和機(jī)器人搜索引擎。分類搜索引擎采用人工或機(jī)器搜索WWW信息,依靠專業(yè)人員對(duì)信息進(jìn)行甄別和分類而建立的以分類導(dǎo)航或分類摘要查詢?yōu)橹鞯囊活愐妫址Q“主題指南”。機(jī)器人搜索引擎指由網(wǎng)上搜索軟件自動(dòng)收集網(wǎng)頁(yè)建庫(kù),以全文檢索為主的引擎。按照檢索方式可將搜索引擎劃分獨(dú)立搜索引擎、元搜索引擎、網(wǎng)絡(luò)搜索軟件。,互聯(lián)網(wǎng)搜索引擎,2.搜索引擎的工作原理搜索引擎實(shí)際上是一個(gè)專用的WWW服務(wù)器,它收集Internet上成千上萬(wàn)甚至上億個(gè)網(wǎng)頁(yè)信息,組成龐大的索引數(shù)據(jù)庫(kù)。自動(dòng)運(yùn)行并對(duì)大量頁(yè)面進(jìn)行索引。3.搜索引擎的檢索功能大多數(shù)搜索引擎提供以下檢索功能:布爾邏輯檢索、截詞檢索、限制檢索、區(qū)分大小寫檢索、加減檢索、概念檢索、結(jié)果過(guò)濾、語(yǔ)句檢索、智能化檢索等。,常用搜索引擎,著名搜索引擎的使用,1.Google中文http://www.google.comGoogle收錄20億多網(wǎng)頁(yè)。Google提供的關(guān)鍵詞查詢,查詢范圍有四種:所有網(wǎng)站、圖像、網(wǎng)上論壇和網(wǎng)頁(yè)目錄。Google所提供的幾項(xiàng)特殊檢索功能有:(1)按鏈接搜索(2)按指定網(wǎng)域搜索(3)網(wǎng)頁(yè)快照(4)查找PDF文件2.百度百度也提供了搜索幫助、高級(jí)搜索、搜索工具、百度大全等,也是基于關(guān)鍵詞的搜索引擎。百度提供網(wǎng)頁(yè)快照、在指定網(wǎng)站內(nèi)搜索、在標(biāo)題中搜索、在URI。中搜索、并行搜索、相關(guān)搜索等功能。百度搜霸。,著名搜索引擎的使用,3.metacrawlerhttp://WWWmetaerawler是一個(gè)并行式的元搜索引擎,主要提供三種類型服務(wù):Web搜索服務(wù)、黃頁(yè)服務(wù)、白頁(yè)服務(wù)。具有同時(shí)調(diào)用Google、Yahoo、AskJeevesAbout、LookSmart、TeomaOverture等搜索引擎的功能,然后按相關(guān)度給出詳細(xì)結(jié)果。4.Excite搜索引擎Excite是一個(gè)智能性的搜索引擎,主要提供頻道(channel)和搜索(search)兩種Web信息服務(wù),可以對(duì)網(wǎng)站、目錄,新聞、照片等進(jìn)行搜索。Excite搜索服務(wù)的個(gè)性化服務(wù)特色非常突出。,檢索效果評(píng)價(jià),檢索效果評(píng)價(jià)的指標(biāo)在檢索評(píng)價(jià)實(shí)踐中,評(píng)價(jià)檢索效果的常用指標(biāo)具體有以下幾種:查全率(Recallratio)——用R表示;查準(zhǔn)率(Precisionratio)——用P表示;漏檢率(()missionratio)一一用U表示;誤檢率(Fall—Outratio)——用F表示。其中,最常用的檢索效果評(píng)價(jià)指標(biāo)為查全率和查準(zhǔn)率。,檢索效果評(píng)價(jià),1.查全率和漏檢率是評(píng)價(jià)檢索效果最常用的兩項(xiàng)關(guān)鍵指標(biāo)。2.查準(zhǔn)率和誤檢率查準(zhǔn)率是指檢出的相關(guān)文獻(xiàn)量與檢出文獻(xiàn)總量的比率,是衡量信息檢索系統(tǒng)精確度的尺度。誤檢率是指誤檢(檢出不相關(guān))文獻(xiàn)總量的比率,是衡量信息檢索系統(tǒng)誤檢文獻(xiàn)和程度的尺度。3.檢索速度(T)、新穎率(N)與有效率(A),檢索效果的優(yōu)化,影響檢索效果的因素是多方面的,檢索效果的優(yōu)化就需要針對(duì)影響查全率、查準(zhǔn)率、檢索速度等因素從多方面進(jìn)行改進(jìn)。1.提高檢索系統(tǒng)的功能包括提高檢索系統(tǒng)的運(yùn)行速度,提供檢索手段的完備性,檢索功能的智能化,檢索界面的友好性和易用性等。這里既包括硬件設(shè)備也包括檢索程序的設(shè)計(jì)2.提高數(shù)據(jù)庫(kù)的質(zhì)量數(shù)據(jù)庫(kù)的質(zhì)量是提高檢索效率的基本因素。從數(shù)據(jù)庫(kù)整體來(lái)說(shuō),要做到相關(guān)文獻(xiàn)信息收錄完整,具有完備的索引系統(tǒng)、完備的幫助系統(tǒng),數(shù)據(jù)庫(kù)結(jié)構(gòu)科學(xué),信息記錄使用標(biāo)準(zhǔn)規(guī)范的格式等。,檢索效果的優(yōu)化,3.提高檢索人員的素質(zhì)檢索人員不僅指專門從事檢索的圖書情報(bào)工作人員,也包括普通用戶。4.優(yōu)化檢索策略檢索者利用檢索工具對(duì)查找到所需內(nèi)容的科學(xué)安排。一般可采取三方面的舉措來(lái)優(yōu)化檢索策略,從而提高檢索效果。(1)科學(xué)選擇數(shù)據(jù)庫(kù)(2)提高查全率(3)提高查準(zhǔn)率,綜合檢索實(shí)例及分析,用百度進(jìn)行檢索:(1)在百度檢索框中輸入檢索詞“城市青少年”,檢索到10,400,000條記錄;再用“價(jià)值結(jié)構(gòu)”在結(jié)果中檢索共檢索到1,370,000條記錄,其中兩條為相關(guān)記錄。從檢索情況來(lái)看,用“城市青少年”進(jìn)行檢索,檢索詞過(guò)于專指,造成很大的漏檢。(2)在百度檢索框中輸入檢索詞“青少年價(jià)值觀”擴(kuò)檢,檢索到1,620,000條記錄,很大程度上提高了檢全率。相關(guān)記錄有:青少年人生價(jià)值觀狀況分析、我國(guó)青少年價(jià)值觀發(fā)展特點(diǎn)與教育對(duì)策研究、新時(shí)期青少年價(jià)值觀的現(xiàn)狀與變化的追蹤研究、我國(guó)五城市青少年學(xué)生價(jià)值觀的調(diào)查等等。(3)在百度檢索框中輸入檢索式:“青年價(jià)值觀”+“社會(huì)教育”再次擴(kuò)檢,從檢索命中記錄來(lái)看,用“青年價(jià)值觀”+“社會(huì)教育”檢索,彌補(bǔ)了用“青少年價(jià)值觀”+“社會(huì)教育”檢索時(shí)造成的對(duì)青年價(jià)值觀的部分漏檢。用戶可以嘗試著用其它檢索詞進(jìn)行組配檢索,不斷地?cái)U(kuò)檢、縮檢以提高檢準(zhǔn)率和檢全率。另外,百度會(huì)提供相關(guān)的檢索詞供用戶參考。在檢索的過(guò)程當(dāng)中,我們可以利用檢索到的文獻(xiàn)以及其參考文獻(xiàn)為線索進(jìn)行相關(guān)文獻(xiàn)的檢索。除了百度外,Google也是最常用、檢索功能強(qiáng)大的搜索引擎,用戶可以配合一起使用。,示例,,網(wǎng)站內(nèi)容的獲取,上機(jī)作業(yè),上機(jī)內(nèi)容:題目:搜索引擎的界面和原理的進(jìn)一步理解具體內(nèi)容:對(duì)比以下四個(gè)搜索引擎界面、主要檢索方法及功能1.Google中文2.百度3.metacrawlerhttp://WWW4.Excite搜索引擎要求:對(duì)比各搜索引擎的界面、主要檢索方法和功能特色及異同,寫出你的評(píng)價(jià)。,,題目:檢索工具的初步使用具體內(nèi)容:請(qǐng)查找寫出4個(gè)或以上的國(guó)內(nèi)外搜索引擎(即網(wǎng)站)。然后分別在上述四個(gè)搜索引擎中查找并記下:1.利用關(guān)鍵字“模具設(shè)計(jì)”所檢索到的記錄的條數(shù)2.利用關(guān)鍵字“機(jī)械模具設(shè)計(jì)”所檢索到的記錄的條數(shù)3.對(duì)比各搜索引擎所檢索到的記錄條數(shù),寫出你的認(rèn)識(shí)與結(jié)論。,,檢索實(shí)例[檢索課題]“非典”對(duì)中國(guó)經(jīng)濟(jì)的影響(期刊論文)[分析課題]首先,分析課題并制定檢索策略,“非典”是“傳染性非典型肺炎”的簡(jiǎn)稱(SARS).確定將“非典”、“SARS”、“中國(guó)經(jīng)濟(jì)”、“經(jīng)濟(jì)運(yùn)行”作為檢索詞.據(jù)此,編制檢索式如下:(非典orSARS)and中國(guó)經(jīng)濟(jì)and經(jīng)濟(jì)運(yùn)行。,,檢索實(shí)例[檢索課題]電子商務(wù)對(duì)稅收征管的影響與對(duì)策[分析課題]本課題涉及到電子商務(wù)、稅收征管兩個(gè)主題,兩個(gè)主題的關(guān)系是電子商務(wù)的產(chǎn)生、存在對(duì)傳統(tǒng)的稅收征管產(chǎn)生影響,以及相應(yīng)的對(duì)策。[選擇檢索詞、編制檢索式]根據(jù)課題分析,我們選擇電子商務(wù)(相關(guān)詞:網(wǎng)絡(luò)貿(mào)易、網(wǎng)上貿(mào)易、網(wǎng)絡(luò)營(yíng)銷)、稅收征管、影響、對(duì)策作為檢索詞。初步擬定檢索式:(電子商務(wù)OR網(wǎng)絡(luò)貿(mào)易OR網(wǎng)上貿(mào)易OR網(wǎng)絡(luò)營(yíng)銷)AND稅收征管AND(影響OR對(duì)策)。[檢索步驟]首先進(jìn)入數(shù)據(jù)庫(kù)檢索的高級(jí)檢索界面,選擇“關(guān)鍵詞”作為檢索人口.在檢索詞輸入框中;輸入檢索詞:“電子商務(wù)”、“網(wǎng)絡(luò)貿(mào)易”、“網(wǎng)上貿(mào)易”、“網(wǎng)絡(luò)營(yíng)銷”,檢索詞之間用“或”連接。點(diǎn)擊“開(kāi)始檢索”,系統(tǒng)反饋命中記錄14274條。選擇“關(guān)鍵詞”作為檢索入口,進(jìn)行3次二次檢索,在檢索詞輸人框中分別輸入的檢索詞為:稅收征管、影響、對(duì)策,系統(tǒng)最終反饋命中記錄5條。[檢索結(jié)果分析]通過(guò)對(duì)上述5條記錄的分析,這些記錄都符合檢索課題要求。,,ThankYou!,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 信息 檢索 word 文字處理
鏈接地址:http://italysoccerbets.com/p-11520157.html