《網(wǎng)絡(luò)搜索引擎googl》由會員分享,可在線閱讀,更多相關(guān)《網(wǎng)絡(luò)搜索引擎googl(19頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、,第七講:,網(wǎng)絡(luò)搜索引擎,信 息 檢 索,2007.11.21,hohai university,Contents,搜索引擎的基本概念和原理,常用的幾種中、英文搜索引擎,搜索引擎檢索實例,一、,搜索引擎的基本概念和原理,概念,搜索引擎,(Search Engine),是指通過網(wǎng)絡(luò)搜索軟件或網(wǎng)站登陸等方式,將互聯(lián)網(wǎng)上大量網(wǎng)站的頁面收集到本地,經(jīng)過加工處理而建庫,從而能夠?qū)τ脩籼岢龅母鞣N查詢作出響應(yīng),提供用戶所需的信息。,組成,WWW服務(wù)器,搜索程序(如spider、robot),索引數(shù)據(jù)庫(包括成千上萬甚至上億個網(wǎng)頁),檢索程序(用來處理用戶的檢索請求,),一、,搜索引擎的基本概念和原理,Int
2、ernet搜索引擎就像信息海洋中的導(dǎo)航員,能幫助人們快速找到所需的信息。然而隨著各種信息的巨量增長,人們使用搜索引擎也遇到了許多困難,相同的搜索詞在不同的搜索引擎中得出不同的結(jié)果,在質(zhì)量和數(shù)量上都有所不同。產(chǎn)生這種現(xiàn)象是因為不同的搜索引擎采集信息的方法、標(biāo)引的內(nèi)容以及檢索功能是有所區(qū)別的,下面詳細(xì)介紹一下幾種搜索引擎。,二、中、英文搜索引擎,中、外文搜索引擎介紹,百 度,http:/,/,天網(wǎng)搜索,http:/,/,谷歌中文,http:/,/,雅 虎,http:/,/,AltaVista,http:/,/,二、中、英文搜索引擎,Google簡介,Google,是數(shù)學(xué)名詞,Googol,的諧音,
3、表示,一個,1,后面跟著,100,個零,或,10,的,100,次方,。由兩個斯坦福大學(xué)博士生,Larry Page,與,Sergey,Brin,于,1998,年,9,月發(fā)明。,目前被公認(rèn)為萬維網(wǎng)上最大的搜索引擎,它提供了簡單易用的免費服務(wù),使用戶能夠訪問一個包含超過,80,億個網(wǎng)址的索引。,Google,使用,PageRank,技術(shù)檢查整個網(wǎng)絡(luò)鏈接結(jié)構(gòu),并確定哪些網(wǎng)頁重要性最高。然后進行超文本匹配分析,以確定哪些網(wǎng)頁與正在執(zhí)行的特定搜索相關(guān)。,Google 搜索引擎,1、基本搜索技術(shù),:,(,1)布爾邏輯:,邏輯”與”:AND、+,或空格,如:墨攻+雞犬不寧。,邏輯”或”:OR,|,如:墨攻,
4、|,雞犬不寧。,邏輯”非”:-,如:張藝謀 大紅燈籠高高掛。,(注:-前面有空格,后面沒有空格),(2),短語搜索:“beijing university of technology”,(3)英文字母大小寫與通配符的用法:大小寫不敏感,通配符目前只可以用*來替代單個字符,LOGO,Google 搜索引擎,(4),忽略高頻字符以及強制搜索,Google對一些網(wǎng)絡(luò)上出現(xiàn)頻率極高的英文單詞,如“the”、“com”、“www”等,以及一些符號如“、”、“.”等作忽略處理。如果必須要使用某一常見字詞才能獲得需要的結(jié)果,您可以在該字詞前面放一個“+”號,從而將其包含在查詢字詞中。,如:搜索 www 的歷
5、史internet,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“歷史”和“internet”。這顯然不符合要求。,如果要對忽略的關(guān)鍵字進行強制搜索,則需要在該關(guān)鍵字前加上明文的“+”號(,注:在“+”號前留一空格,),。如:搜索+www+的歷史internet。,另一個強制搜索的方法是把上述的關(guān)鍵字用英文雙引號引起來。如:搜索“www的歷史”internet。,Google 搜索引擎,2、命令型搜索技術(shù):,(1),制定網(wǎng)域。要在某個特定的站點中進行搜索,可以在Google搜索框中輸入“site”。例如要查找人民網(wǎng)上的新聞,可以輸入:“新聞”。,輸入“金庸 古龍”搜索包含“金庸
6、”和“古龍”的中文新浪網(wǎng)站頁面,。,注:site后的冒號為英文字符,而且冒號后不能有空格,網(wǎng)站域名不能有“http:/”和www前綴,也不能有任何“/”的目錄后綴;網(wǎng)站頻道則只局限于“頻道名.域名”方式。而不能是“域名/頻道名”方式。,Google 搜索引擎,Google 搜索引擎,(2)搜索的關(guān)鍵字包含在URL鏈接中,“inurl:”語法返回的網(wǎng)頁鏈接中包含第一個關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁文檔中。,如:查找微軟網(wǎng)站上關(guān)于Windows2000的安全課題資料。,“inurl:security windows2000 site:”,“allinurl”語法返回的網(wǎng)頁鏈接中包含所有
7、作用的關(guān)鍵字,這個查詢的關(guān)鍵字只集中于網(wǎng)頁的鏈接字符串。,(3)按鏈接搜索:Link后面加上冒號“:”查詢所有指向該網(wǎng)址的網(wǎng)頁,如:,(4)搜索的關(guān)鍵字包含在網(wǎng)頁標(biāo)題或正文中,Intitle標(biāo)題搜索 如:intitle:休斯頓火箭隊,Intext正文檢索 如:intext:像素600萬,(5)搜索特定類型的文件“filetype:”,格式:filetype:pdf OR filetype:doc,如:搜索關(guān)于電子商務(wù)(ECOMMERCE)的PDF文檔,ecommerce filetype:pdf,(6)查看字或詞組的定義“define:”,3、智能性搜索技術(shù),(1)錯別字糾正,(2)手氣不錯:
8、按下“手氣不錯”按鈕將自動進入Google 查詢到的第一個網(wǎng)頁。,(3)類似網(wǎng)頁,(4)網(wǎng)頁快照,(5)天氣查詢,(6)郵編區(qū)號,(7)手機號碼歸屬地,(8)股票查詢,Google 搜索引擎,4、綜合性搜索技術(shù),(1)在線計算器,(2)中英文字典:“翻譯”,“fy”和“FY”任選其一,格式為:fy 檢索詞,(3)拼音轉(zhuǎn)換,Google 搜索引擎,5、Google特色功能,(1)學(xué)術(shù)論文搜索,進入Ggoogle scholar頁面后和使用Google一樣鍵入你要搜索的關(guān)鍵詞或文章名后,Google scholar會列出與之相關(guān)的結(jié)果。而且,它還列出了該文獻的引用情況以及,該文獻在網(wǎng)絡(luò)上的版本,點
9、擊版本可以查到通過維普和萬方兩個途徑獲得文獻的全文。,第一步:打開http:/;,第二步:將文獻名輸入到檢索框中,點擊“搜索”,這時候你會看到有關(guān)的信息,而且如果該文獻在網(wǎng)上有收錄的話,還會告訴你在哪個庫有收錄;,第三步:如果你運氣好一點的話,直接點擊該標(biāo)題還可以直接就得到原文。,如:在GoogleScholar中文獻“數(shù)字圖書館研究”的檢索結(jié)果,(2)圖書搜索,(3)地圖服務(wù),(4)大學(xué)搜索,(5)翻譯,Google 搜索引擎,Google檢索方式,Google提供了基本搜索、高級搜索和目錄式搜索。,1、基本搜索,2、高級搜索,3、目錄式搜索,Google 搜索引擎,舉例,某三年級小學(xué)生,想查一些關(guān)于時間的名人名言,他的查詢詞是“,小學(xué)三年級關(guān)于時間的名人名言,”。,時間名言,intitle:時間名言,主講人:朱末霞,電 話,:85191970,E-,地 點:圖書館信息服務(wù)部,312,室,