因特網信息檢索方法?
1、 網絡信息檢索方法有三種,分別是?
2 是因為每個搜索引擎都有自己的爬蟲程序,這些爬蟲程序分佈在很多的服務器上,爬蟲程序就是負責搜尋某個ip段內的主機信息,通過得到網頁首頁文件的title來分類和過濾,防止收集無用的冗餘信息,然後根據網頁中的超鏈接繼續搜索,最終將搜索到信息分門別類的存貯到搜索引擎的數據庫中,供網民搜索時提取
4 and 並且 or 或者 not 非
因特網中信息檢索的方法主要有哪幾種?
關鍵詞搜索 這是主流方法 ;目錄索引 這個已經落伍了
網絡信息的檢索方法有哪幾種
網絡信息檢索方法主要有以下四種:1、漫遊法2、直接查找法3、搜索引擎法4、網絡資源指南法。
1.漫遊法
(1)偶然發現。這是在因特網上發現、檢索信息的原始方法。即在日常的網絡閱讀、漫遊過程中,意外發現一些有用信息。這種方式的目的性不是很強,具不可預見性和偶然性。
(2)順“鏈”而行。指用戶在閱讀超文本文檔時,利用文檔中的鏈接從一網頁轉向另一相關網頁。此方法類似於傳統手工檢索中的“追溯檢索”,即根據文獻後所附的參考文獻追溯查找相關的文獻,從而不斷擴大檢索範圍。這種方法可能在較短的時間內檢出大量相關信息,也可能偏離檢索目標而一無所獲。
2.直接查找法
直接查找法是已經知道要查找的信息可能存在的地址,而直接在瀏覽器的地址欄中輸入其網址進行瀏覽查找的方法。此方法適合於經常上網漫遊的用戶。其優點是節省時間、目的性強、節省費用,缺點是信息量少。
3.搜索引穆檢索法
此方法是最為常規、普遍的網絡信息檢索方法。搜索引擎是提供給用戶進行關鍵詞、詞組或自然語言檢索的工具。用戶提出檢索要求,搜索引擎代替用戶在數據庫中進行檢索,並將檢索結果提供給用戶。它一般支持布爾檢索、詞組檢索、截詞檢索、字段檢索等功能。利用搜索引擎進行檢索的優點是:省時省力,簡單方便,檢索速度快、範圍廣,能及時獲取新增信息。
其缺點是:由於採用計算機軟件自動進行信息的加工、處理,且檢索軟件的智能性不很高,造成檢索的準確性不是很理想,與人們的檢索需求及對檢索效率的期望有一定差距。
4.網絡資源指南檢索法
此方法是利用網絡資源指南進行查找相關信息的方法。網絡資源指南類似於傳統的文獻檢索工具————書目之書目(bibliography of bibliographies),或專題書目,國外有人稱之為web of webs,webliographies,其目的是可實現對網絡信息資源的智能性查找。它們通常由專業人員在對網絡信息資源進行鑑別、選擇、評價、組織的基礎上編制而成,對於有目的的網絡信息檢索具有重要的指導作用。
其侷限性在於:由於其管理、維護跟不上網絡信息的增長速度,使得其收錄範圍不夠全面,新穎性、及時性不夠強,且用戶還要受標引者分類思想的限制。
在因特網中信息檢索的方法主要有哪三種?每種方法的優缺點是什麼?
關鍵詞搜索 這是主流方法 ;目錄索引 這個已經落伍了
網絡信息檢索的策略與技巧
策略:
1、明確檢索目標,確定檢索項分析主題、使用布爾邏輯算符等構造檢索式。
2、選擇合適的檢索系統根據檢索主題和檢索系統的特點選擇檢索系統。
3、正確對待檢索結果對漏檢、錯檢、溢檢、無檢索結果的處理方式。
4、選擇最佳上網時間選擇網速較快的時間段。 多數情況下,有一個好的搜索策略,能正確地應用布爾邏輯符,並熟悉每個搜索引擎的特性,就可得到一個好的檢索結果。除此之外,在某些情況下還可用其他的一些技巧來改善檢索結果。
技巧:
1、擴大檢索範圍、提高查全率。
2、縮小檢索範圍、提高查準率。
3、Ctrl十F用搜索引擎檢索到所需文檔並連接到相關網頁後,有時會發現所要的文件並沒有出現在當前視野中,這可能是因為文件存放在當前網頁的底部。一個快捷的方法就是按“Ctrl十F”在當前頁查找文件。
4、給檢索結果作標籤避免再重複出現。
什麼是網絡信息檢索?
主要指對利用Internet信息發佈技術,通過Internet發佈的信息進行的檢索,主要利用搜索引擎、網絡機器人和門戶站點等來完成。
因特網上有海量的數據,是信息的海洋,但在解決實際問題中,仍感到缺乏真正需要的信息,出現了數據豐富,信息貧乏的問題。如何在海量數據堆中,準確、快速的找到所需要的信息,是一個需要很好解決的重大問題。因此,網上信息檢索技術,為用戶從包含各種數據的文件堆中查找所需要的信息或知識的技術,便成為因特網應用中的一個關鍵性問題。
作為信息海洋的因特網,從瀏覽器上通過逐個網頁瀏覽尋找所要信息的方法,就像大海撈針一樣,不僅浪費大量的計算機時間和佔用網絡通道資源,也很難找到真正需要的信息,利用信息檢索技術及為其開發的軟件系統才是唯一可行的方法。
信息檢索技術是將因特網上的海量數據,通過軟件系統的檢索查詢,根據用戶提供的需求,把用戶所要的信息提取出來,經十多年發展已經取得了不少突破性的進展,發展了一大批有效、不同的信息檢索軟件,如文本信息檢索、動態網頁Web信息檢索、檢索引擎等一些重要的檢索方法和技術,特別是檢索引擎,成了Web上查找信息不可缺少的工具。
特點
由於網絡信息檢索藉助網絡通信、信息處理等技術的發展,與傳統信息檢索相比,網絡信息檢索具有如下特點:
1.檢索範圍、領域涵蓋廣。網絡信息檢索的信息來源範圍通常涵蓋全球,而信息資源類型、學科(主題)領域也幾乎無限制。
2.傳統檢索技術與網絡檢索技術相結合。傳統的信息檢索核心檢索技術如布爾邏輯檢索、截詞檢索、限定檢索等檢索技術在網絡信息檢索中被沿用。但是網絡信息檢索技術藉助網絡信息技術的發展,一些新的檢索技術也融入到網絡信息檢索中,如人工智能、數據挖掘、自然語言處理、多媒體檢索技術、多語言檢索技術等,如一些搜索引擎能將搜索結果進行自動分類。
3.用戶界面友好,容易上手。網絡信息檢索所藉助的網絡信息檢索工具均以面對非專業信息檢索的廣大網民為主,通過各種交換和智能技術,使得一般檢索基本能解決大部分問題。不需要專門的檢索技術和知識。不過,高級搜索就相對難一些。
4.信息檢索效率低。由於網絡信息資源浩如煙海,信息資源良莠不齊等特點,信息檢索結果數量雖多,但是查準率較低,儘管一些新的技術如數據挖掘技術、自然語言理解技術等的不但發展和應用,但網絡信息檢索效率低的狀況短時間內還無法改觀。
常見的網絡信息檢索的方法有哪些
1. 布爾邏輯檢索
利用布爾邏輯算符進行檢索詞或代碼的邏輯組配,是現代信息檢索系統中最常用的一種技術。常用的布爾邏輯算符有三種,分別是邏輯或“OR”、邏輯與“AND”、邏輯非“NOT”。
2. 截詞檢索
截詞檢索是計算機檢索系統中應用非常普遍的一種技術。由於西文的構詞特性,在檢索中經常會遇到名詞的單複數形式不一致;同一個意思的詞,英美拼法不一致;詞幹加上不同性質的前綴和後綴就可以派生出許多意義相近的詞等等。這是就要用到截詞檢索
3. 位置檢索
位置檢索也叫全文檢索、鄰近檢索。所謂全文檢索,就是利用記錄中的自然語言進行檢索,詞與詞之間的邏輯關係用位置算符組配,對檢索詞之間的相對位置進行限制。這是一種可以不依賴主題詞表而直接使用自由詞進行檢索的技術方法。
4. 字段限定檢索
字段限定檢索是指限定檢索詞在數據庫記錄中的一個或幾個字段範圍內查找的一種檢索方法。在檢索系統中,數據庫設置的可供檢索的字段通常有兩種:表達文獻主題內容特徵的基本字段和表達文獻外部特徵的輔助字段。
5. 加權檢索
加權檢索是某些檢索系統中提供的一種定量檢索技術。加權檢索同布爾檢索、截詞檢索等一樣,也是文獻檢索的一個基本檢索手段,但與它們不同的是,加權檢索的側重點不在於判定檢索詞或字符串是不是在數據庫中存在、與別的檢索詞或字符串是什麼關係,而是在於判定檢索詞或字符串在滿足檢索邏輯後對文獻命中與否的影響程度。
6. 聚類檢索
聚類是把沒有分類的事物,在不知道應分幾類的情況下,根據事物彼此不同的內在屬性,將屬性相似的信息劃分到同一類下面。
搜索引擎的信息檢索方法
21世紀人類社會已進入了信息化時代,作為信息化時代標誌之一的因特網在全世界以史無前例的速度和規模不斷髮展壯大,而因特網上的信息也象原子裂變一樣迅速膨脹,面對這些浩瀚無邊的信息人們已經顯得無所適從了。的確,人們要想在這信息的海洋中準確找到自己所需要的信息是一件很不容易的事情。
為了能夠克服這樣的困難,人們製作出來了搜索引擎,它通過內部的某些軟件程序把INTERNET上的信息進行分類整理,或者是通過人工組織的方式把某些數據歸類,形成一個可供查詢的大型數據庫。可以說:“搜索是一種組織和查詢信息的方式!”
一般來說,在每個搜索引擎中均提供分類目錄及關鍵詞檢索這兩種信息查詢的方法。而這些搜索引擎的基本用法是搜索引擎站點中都提供一個可以輸入關鍵詞的文本輸入框和一個“搜索”的按鈕,用戶可以在輸入框中鍵入關鍵詞,然後按“搜索”按鈕,搜索引擎就會自動地在其內部的數據庫中進行檢索,最後把與關鍵詞相符合的或者是與關鍵詞相近的網站顯示在結果頁中,接著用戶只需通過搜索引擎提供的鏈接地址,就可以訪問到相關信息。這種查詢方法的關鍵之處在於關鍵詞的選擇和表達上。
如果關鍵詞選擇不當,搜索的結果會返回大量無用的垃圾信息;或者有用的信息被淹沒在大量的冗餘的頁面之中。所以在選擇關鍵詞時,應該熟練掌握關鍵詞語法表達方式,這樣就可以少走彎路,能得到更精確的搜索結果,從而迅速找到自己所需要的信息。雖然各個搜索引擎的搜索語法不完全相同,但下面一些搜索語法還是比較通用和常見的,筆者分別舉例來說明各個語法符號的使用方法。
(1)直接鍵入關鍵字,搜索引擎就把包括關鍵字的網站和與關鍵字意義相近的網站地址一起返回給用戶。例如:鍵入“網上教學”,搜索引擎就會把“網上學習”、“遠程教學”以及“網上教學”等內容的網址一起反饋給用戶,因此這種查詢方法往往會返回大量不需要的信息。
圖1 直接搜索
(2)利用雙引號,來查詢完全符合關鍵字串的網站。例如:鍵入“電腦硬件”,會找出包含網絡資源的網站、但是會忽略過包含“電腦硬件行情”的網站;這種查詢方法要求用一對半角的雙引號來把關鍵字包括起來。
(3)加t:在關鍵字前,搜尋引擎僅會查詢網站名稱。例如:鍵入t:電腦,會找出包含電腦的網站名稱。
(4)加u:在關鍵字前,搜尋引擎僅會查詢網址(URL)。例如:鍵入u:yancheng,會找出包含yancheng的網址。
(5)利用+來限定關鍵字串一定要出現在結果中。例如:鍵入電腦+網絡,會找出包含電腦和網絡的網站。
(6)利用-來限定關鍵字串一定不要出現在結果中。 例如:鍵入電腦-網絡,會找出包含電腦但除了網絡的網站;鍵入發如雪 -html,會在發如雪的相關網頁中過濾掉後綴名為 html 網頁。
(7)利用*代替所有的字母,用來檢索那些變形的關鍵詞或者是不能確定的關鍵詞。 例如:鍵入“電*”後的查詢結果可以包含電腦、電影、電視等內容。
(8)利用()可以把多個關鍵詞作為一組,並進行優先查詢。例如:鍵入“(電腦+網絡)-(硬件+價格)”來搜索包含“電腦”與“網絡”的信息,但不包含“硬件”與“價格”的網站。
(8)利用AND(&)表示前後兩個關鍵詞是"與"的邏輯關係。 例如:鍵入關鍵詞:ENGLISH AND CHINESE,會找出將包含ENGLISH和CHINESE的網站。
圖2 高級搜索
(9)利用OR(|)表示前後兩個詞是"或"的邏輯關係。 例如:鍵入關鍵詞:ENGLISH OR CHINESE,會找出將包含ENGLISH或者......
網絡信息的檢索方式
網絡信息檢索方式指網絡信息檢索系統或數據庫在檢索首頁界面或網頁的各個不同檢索區上設置的檢索人口的總稱。檢索方式有:簡單檢索、駭合檢索、高級檢索、分類(瀏覽)檢索、導航檢索、專家檢索等。
1.簡單檢索(SimPle Search) 也有稱初級檢索、自由詞檢索、基本檢索。指在數據庫首頁的檢索詞輸入框(或稱查詢提問框)內輸入一個單詞或詞組,提交檢索工具查詢的一種檢索方式。這是最基本的檢索方式。
2.複合檢索(Combine Search) 也稱布爾邏輯組配檢索(Bo01ean Search),或簡稱組配檢索。複合檢索指在任意字段情況下在檢索式輸入框內輸入複合邏輯檢索式提交檢索工具查詢的一種檢索方式。
3.高級檢索(Advanced Search) 高級檢索指在已設定的高級檢索窗口中輸入多個檢索詞,運用邏輯組配關係,查找同時滿足多個檢索條件的數據,在高級檢索界面上一次性實現本應多次檢索的結果的一種檢索方式。
4. 目錄檢索(Category Search)(或稱分類檢索) 有些檢索工具,如雅虎、萬方,提供分類目錄檢索。目錄檢索是指目錄按類名分類,每類又分若干子類目,層層逐級展開,最後點擊末級類名,顯示網頁名鏈接和簡短內容摘要,點擊鏈接,顯示相關網頁內容(如雅虎),或顯示該類的文獻記錄(如萬方、維普)。
5.導航檢索(NaVigation Search)或稱瀏覽檢索(Browse Search) 導航檢索與目錄檢索相似,指在系統設置的導航區內按檢索樹格式逐級展開和進行瀏覽選擇的檢索方式。導航檢索有學科分類導航檢索和刊名導航檢索。分類導航檢索在選擇到分類未級時會顯示該類的全部文獻記錄。刊名導航則在按刊名分類或字順查到所需刊名時會顯示該刊年份和期號,在選定期號後即會顯示該期的目錄,以供選擇某文的題錄、文摘或全文,如維普。
6.專家檢索(Expen Search) 指系統在檢索頁面上設置一個較大的提問框供用戶輸入檢另策略。用戶可根據檢索課題的需要,調用相應的檢索技術編制比較細緻複雜的檢索提問式,以一次達到比較滿意的檢索結果。這種檢索方式適用於有豐富檢索經驗的用戶。
常用的信息檢索方法有哪些?
檢索方法是指實現檢索計劃的具體方法,檢索方式不同,方法也不一樣。常用的信息檢索方法有常規法(包括順查法、倒查法、抽查法)、追溯法、綜合法(也叫做循環法,是常規法和追溯法的綜合)、搜索引擎法、導航法等。