色天下一区二区三区,少妇精品久久久一区二区三区,中文字幕日韩高清,91精品国产91久久久久久最新毛片

首頁 > 廣東 > 陽江市 > 信息檢索的方法,常用文獻信息的檢索方法

信息檢索的方法,常用文獻信息的檢索方法

來源:整理 時間:2023-01-05 07:08:15 編輯:好學習 手機版

1,常用文獻信息的檢索方法

中文的話:中知網、維普、萬方。。。。外文:ncbi 。。。。。。
給你說一個軟件 文庫寶, 我的資料都從上面找,可以下載很好用

常用文獻信息的檢索方法

2,怎樣進行信息檢索

就是一探手到海里就撈到了針.
首先對文本進行清洗(預處理),然后進行分詞,接著建立索引,最后實施檢索……基本過程應該差不多是這樣子的,但是具體實施步驟與具體方法還看你是要檢索什么樣的數據、要達到什么目的額。

怎樣進行信息檢索

3,信息檢索有什么秘訣嗎

工作及生活都發生了變化、索引和文摘信息檢索大概可分為四個階段:初級階段的檢索工具書。在篩選過程中,限定性詞語越多,限定性越小,搜集的信息越準確,同時也越少。第三是計算機檢索階段,隨著科學技術的發展,信息檢索也在發生變革,使人們真正進入了信息社會。 在網絡檢索時代,人們大量使用網絡篩選信息,不久就被用來進行信息的存儲和檢索。第四階段是網絡檢索時代,網絡的出現,使我們的學習。1946年第一臺電子計算機誕生以后,主要是以圖書目錄為主。第二是手工檢索階段,信息檢索的真正發展是在18世紀以后。逐漸形成了完整的手工檢索工具——目錄
準確地說,不應稱為秘訣,而是技術和方法信息檢索技術和方法的確是可以分類的詳細闡述的
..0.0
你好!準確地說,不應稱為秘訣,而是技術和方法信息檢索技術和方法的確是可以分類的詳細闡述的希望對你有所幫助,望采納。

信息檢索有什么秘訣嗎

4,網絡信息檢索方式

網絡信息檢索方式指網絡信息檢索系統或數據庫在檢索首頁界面或網頁的各個不同檢索區上設置的檢索人口的總稱。檢索方式有:簡單檢索、復合檢索、高級檢索、分類(瀏覽)檢索、導航檢索、專家檢索等。 1.簡單檢索(simple search) 也有稱初級檢索、自由詞檢索、基本檢索。指在數據庫首頁的檢索詞輸入框(或稱查詢提問框)內輸入一個單詞或詞組,提交檢索工具查詢的一種檢索方式。這是最基本的檢索方式。 2.復合檢索(combine search) 也稱布爾邏輯組配檢索(bo01ean search),或簡稱組配檢索。復合檢索指在任意字段情況下在檢索式輸入框內輸入復合邏輯檢索式提交檢索工具查詢的一種檢索方式。 3.高級檢索(advanced search) 高級檢索指在已設定的高級檢索窗口中輸入多個檢索詞,運用邏輯組配關系,查找同時滿足多個檢索條件的數據,在高級檢索界面上一次性實現本應多次檢索的結果的一種檢索方式。 4. 目錄檢索(category search)(或稱分類檢索) 有些檢索工具,如雅虎、萬方,提供分類目錄檢索。目錄檢索是指目錄按類名分類,每類又分若干子類目,層層逐級展開,最后點擊末級類名,顯示網頁名鏈接和簡短內容摘要,點擊鏈接,顯示相關網頁內容(如雅虎),或顯示該類的文獻記錄(如萬方、維普)。 5.導航檢索(navigation search)或稱瀏覽檢索(browse search) 導航檢索與目錄檢索相似,指在系統設置的導航區內按檢索樹格式逐級展開和進行瀏覽選擇的檢索方式。導航檢索有學科分類導航檢索和刊名導航檢索。分類導航檢索在選擇到分類未級時會顯示該類的全部文獻記錄。刊名導航則在按刊名分類或字順查到所需刊名時會顯示該刊年份和期號,在選定期號后即會顯示該期的目錄,以供選擇某文的題錄、文摘或全文,如維普。 6.專家檢索(expen search) 指系統在檢索頁面上設置一個較大的提問框供用戶輸入檢另策略。用戶可根據檢索課題的需要,調用相應的檢索技術編制比較細致復雜的檢索提問式,以一次達到比較滿意的檢索結果。這種檢索方式適用于有豐富檢索經驗的用戶。

5,網絡信息檢索的方法有哪些分析這些方法的差異性及其各自的優勢

網絡信息檢索方法主要有以下四種:1、漫游法2、直接查找法3、搜索引擎法4、網絡資源指南法1.漫游法 (1)偶然發現。這是在因特網上發現、檢索信息的原始方法。即在日常的網絡閱讀、漫游過程中,意外發現一些有用信息。這種方式的目的性不是很強,具不可預見性和偶然性。 (2)順“鏈”而行。指用戶在閱讀超文本文檔時,利用文檔中的鏈接從一網頁轉向另一相關網頁。此方法類似于傳統手工檢索中的“追溯檢索”,即根據文獻后所附的參考文獻追溯查找相關的文獻,從而不斷擴大檢索范圍。這種方法可能在較短的時間內檢出大量相關信息,也可能偏離檢索目標而一無所獲。 2.直接查找法 直接查找法是已經知道要查找的信息可能存在的地址,而直接在瀏覽器的地址欄中輸入其網址進行瀏覽查找的方法。此方法適合于經常上網漫游的用戶。其優點是節省時間、目的性強、節省費用,缺點是信息量少。 3.搜索引穆檢索法 此方法是最為常規、普遍的網絡信息檢索方法。搜索引擎是提供給用戶進行關鍵詞、詞組或自然語言檢索的工具。用戶提出檢索要求,搜索引擎代替用戶在數據庫中進行檢索,并將檢索結果提供給用戶。它一般支持布爾檢索、詞組檢索、截詞檢索、字段檢索等功能。利用搜索引擎進行檢索的優點是:省時省力,簡單方便,檢索速度快、范圍廣,能及時獲取新增信息。其缺點是:由于采用計算機軟件自動進行信息的加工、處理,且檢索軟件的智能性不很高,造成檢索的準確性不是很理想,與人們的檢索需求及對檢索效率的期望有一定差距。 4.網絡資源指南檢索法 此方法是利用網絡資源指南進行查找相關信息的方法。 網絡資源指南類似于傳統的文獻檢索工具————書目之書目(bibliography of bibliographies),或專題書目,國外有人稱之為web of webs,webliographies,其目的是可實現對網絡信息資源的智能性查找。它們通常由專業人員在對網絡信息資源進行鑒別、選擇、評價、組織的基礎上編制而成,對于有目的的網絡信息檢索具有重要的指導作用。其局限性在于:由于其管理、維護跟不上網絡信息的增長速度,使得其收錄范圍不夠全面,新穎性、及時性不夠強,且用戶還要受標引者分類思想的限制。參考資料:過仕明主編. 信息檢索概論. 黑龍江科學技術出版社, 2005.10

6,網絡信息檢索的策略與技巧

網絡信息檢索策略設計應遵循快、準、全及低成本的原則,以實現檢索策略最優化。1、明確檢索目標,確定檢索項分析主題、使用布爾邏輯算符等構造檢索式2、選擇合適的檢索系統根據檢索主題和檢索系統的特點選擇檢索系統3、正確對待檢索結果對漏檢、錯檢、溢檢、無檢索結果的處理方式。4、選擇最佳上網時間選擇網速較快的時間段。 多數情況下,有一個好的搜索策略,能正確地應用布爾邏輯符,并熟悉每個搜索引擎的特性,就可得到一個好的檢索結果。除此之外,在某些情況下還可用其他的一些技巧來改善檢索結果。1、擴大檢索范圍、提高查全率2、縮小檢索范圍、提高查準率3、Ctrl十F 用搜索引擎檢索到所需文檔并連接到相關網頁后,有時會發現所要的文件并沒有出現在當前視野中,這可能是因為文件存放在當前網頁的底部。一個快捷的方法就是按“Ctrl十F”在當前頁查找文件。4、給檢索結果作標簽避免再重復出現。
所謂信息檢索策略就是為實現檢索沒目標而制定的全盤計劃和方案,是對整個檢索過程的謀劃和指導。 ?編輯本段制定一個良好的檢索策略。 如何制定一個良好的檢索策略,往往涉及到以下各方面的知識和技能。?l 明確檢索的內容和目的 在檢索之前,須弄清檢索主題,對所給出的檢索課題進行分析,根據它的主題結構、類型、專業范圍、性質等加以分析,使之形成若干能代表信息需求而且有檢索意義的主題概念,包括所需信息的主題概念有幾個.概念的專指度是否合適,哪些是主要的,哪些是次要的,力求分析的主題概念能準確反映檢索的需要,明確所需文獻信息的文獻數量、語種、年代范圍、類型及其他外表特征,明確檢索內容涉及的主要學科范圍等。明確檢索的內容和目的是選擇檢索工具、選擇數據庫以及其它檢索行為的第一步。 ?2 盡可能使用專題檢索工具及專業數據庫,并收集一些專題信息網址 ?專題檢索工具是專為查詢某一學科或某一主題的信息而產生的查詢工具。相對于綜合性的檢索工具來說,專題檢索工具對解決實際查詢問題十分有效,它具有更高的查準率和查全率。而選擇數據庫的原則是以專業數據庫為主,綜合數據庫為輔。 3 了解何種信息由哪些機構提供服務,并注意收集一些機構的url 了解何種檢索工具,何種參考工具能回答何種問題是信息查詢的關鍵。有時從信息提供機構搜索信息源能取得意想不到的效果,即了解從網上可以獲取哪些信息、何種信息主要由哪些機構提供服務仍是十分重要的。這就需要我們平時多注意一些機構地址的收集.以便檢索時能“隨手拈來”做到快速查詢信息的目的。 4 了解常用的搜索引擎以及檢索系統的特性與功能 搜索引擎在查詢范圍、檢索功能等方面各具特色,不同的檢索應選用不同的搜索引擎。了解常用搜索引擎的性質、功能、檢索方法等,有利于更好地使用搜索引擎。 5 掌握實用的檢索技巧 掌握一些實用的檢索技巧能讓你操作自如,得心應手,從而做到快速、準確、全面地查找信息。 1) 提高查全率的方法:降低檢索詞的專指度,用上位詞或相關詞補充到檢索式中;盡可能多地羅列同義詞;使用多個檢索途徑;取消某些過嚴的限制,盡可能在所有檢索的字段中檢索;使用截詞檢索方法:使用"or" 進行檢索:使用多元搜索引擎。 2)提高查準率的方法:提高檢索式的專指度,增加或換用下位詞和專指度較高的詞;增加概念進行限制;限制檢索詞出現的可檢字段;利用not 限制一些不相關的概念;使用"and"檢索;利用進階檢索功能(即利用前一次檢索的結果作為后一次檢索的范圍,逐步縮小檢索范圍)。 3)加快檢索速度的技巧有:利用檢索站點的特色服務快速檢索;掌握不同引擎的搜索策略,充分利用不同引擎的優點,可以獲得最佳最快的檢索結果。 4 )一般的搜索技術有:邏輯操作符的使用,包括and, not, or; +、-和通配符的使用;不要濫用空格,在輸入漢字作關鍵詞時,不要在漢字后追加不必要的空格;注意大小寫的敏感性:避免使用一個詞查詢,輸入的主題詞盡可能多而且是精確詞或詞組.有利于縮小檢索范圍"最專指面優先" 6 .機檢和手檢有機結合起來,節約檢索費用 機檢即計算機檢索,包括光盤檢索、聯機檢索、網絡檢索。手檢即手工檢索,主要是利用工具書和期刊查找資料。計算機檢索的出現為情報檢索的發展開創了嶄新的局面,它改變傳統手工檢索的方式,能迅速為檢索者查找信息資料。不過,即使機檢有再多的優點,有時也需要手檢與之配合,以達到更好的效果。 7 注意檢索策略信息動向,培養信息檢索能力
策略:1、明確檢索目標,確定檢索項分析主題、使用布爾邏輯算符等構造檢索式。2、選擇合適的檢索系統根據檢索主題和檢索系統的特點選擇檢索系統。3、正確對待檢索結果對漏檢、錯檢、溢檢、無檢索結果的處理方式。4、選擇最佳上網時間選擇網速較快的時間段。 多數情況下,有一個好的搜索策略,能正確地應用布爾邏輯符,并熟悉每個搜索引擎的特性,就可得到一個好的檢索結果。除此之外,在某些情況下還可用其他的一些技巧來改善檢索結果。技巧:1、擴大檢索范圍、提高查全率。2、縮小檢索范圍、提高查準率。3、Ctrl十F用搜索引擎檢索到所需文檔并連接到相關網頁后,有時會發現所要的文件并沒有出現在當前視野中,這可能是因為文件存放在當前網頁的底部。一個快捷的方法就是按“Ctrl十F”在當前頁查找文件。4、給檢索結果作標簽避免再重復出現。

7,如何進行計算機信息檢索

1 計算機信息檢索的基本方法 4.3.1明確檢索要求和檢索目標計算機檢索的第一步準備工作是明確檢索要求和檢索目標。明確檢索要求就是要搞清楚本課題屬于什么學科,所需文獻的類型及語種,查找文獻的年代,所需文獻的最佳篇數,允許支配的檢索費用。這些要求對選擇數據庫、構造檢索策略都是十分重要的。 確定檢索目標也是進行計算機信息檢索前應搞清楚的準備工作。例如:如果屬于開題調研,則應盡可能地檢索出與之相關的全部文獻,即要求較高的查全率;以便充分地做好開題的準備工作;如果屬于探索性、開創性的課題,則只需要查出一些啟發性的文獻,對查準率和查全率要求都不一定有很高的要求。 4.3.2課題分析1. 課題概念的分析方法分析課題就是分析出課題所涉及的主要概念,并找出能代表這些概念的若干個詞或詞組,進而分析概念之間的上、下、左、右關系。對于新學科、交叉學科和邊緣學科的課題,則要搞清楚這些概念之間的關系。概念分析的結果應以概念組為單元的詞或詞組的形式列出,以便下一步制訂檢索策略時使用。 2. 隱含概念的分析方法有些課題的實質性內容往往很難從課題的名稱上反映出來,課題所隱含的概念和相關的內容需要從課題所屬的專業角度作深入分析,才能提煉出能夠確切反映課題內容的檢索概念。例如:"社會保障"包含"養老保險"、"失業保險"、"醫療保險"和"社會救濟"等概念,如果要檢索社會保障方面的文獻,應該析出上述概念,才能保證文獻的查全率。 3. 核心概念的選取有些檢索詞中已經含有的某些概念,在概念分析中應予以排除。例如:課題"公司勞動獎勵、職工培訓和養老保險制度管理的理論和實踐",如果把"勞動獎勵","職工培訓","養老保險","公司","制度","管理"六個概念全部組配起來,則會造成大量文獻漏檢。實際上,勞動力資源管理已經包含了勞動獎勵、職工培訓和養老保險三個方面,而且,勞動力管理必然是針對該三個方面而言的。因此,本課題只須采用"勞動力資源"和"管理"這兩個本質概念即可。 為了提高文獻的檢準率,應該從相應的規范詞表中選擇所需的檢索詞。并且在確定檢索詞時,除了要考慮反映主題概念的同義詞、近義詞等相關的檢索詞外,還要注意選擇被選用檢索詞的縮寫詞和不同拼法的詞,以避免漏檢有關的文獻。 4.3.3檢索詞的擴展、選擇和處理目前的計算機信息檢索系統,還不具備智能思考的能力,還不會對所輸入的檢索詞以及涉及的所有詞進行自動、全面的檢索,因此,必須在概念分析的基礎上列出與概念有關的詞,從中做出選擇,并利用截詞等方法對檢索詞予以歸并。 1.相同概念的檢索詞的擴展 擴展相同概念的檢索詞的方法一般有同義詞方法、主題詞表方法和截詞方法(1) 同義詞方法。在同一概念的范疇內,從語言角度,選擇不同的名稱、不同的拼寫方法和單復數形式。不同的名稱包括學名和俗名、簡稱和全稱,商品名和物質或產品名,事物的代碼和事物的學名。不同的拼寫方法,以英語為例,包括英式英語和美式英語的區別。 (2)截詞方法。當某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(多數英語單詞的單復數變化和英美不同拼寫形式),可以采用截詞方法擴展檢索詞。這種方法要求在詞干后使用截詞符。截詞符一般包括"?"和"*"兩種。具體采用什么形式,各個系統都有明確的規定。例如:在DIALOG系統中,截詞符號有無限截詞算符 ("?") 和有限截詞 ("??"和"?? ?")等多種,"?"有時還用做字符屏蔽符。(3)主題詞表方法  許多數據庫都編有自己的主題詞表。在數據庫編有主題詞表的情況下,應該盡量從詞表中選擇檢索詞。使用主題詞表,不僅可以使檢索詞更加規范,提高檢索結果的準確性,而且可以從同族詞中選取更多的上位詞、下位詞、相關詞,使獲得的檢索結果更為理想。 2.檢索詞的選擇和處理 運用上述方法得到的詞,首先應加以選擇,即注意選用本專業通用的術語(應避免使用冷僻詞和根據中文術語自譯生造的詞),然后以概念為單位,構成組面(facets)。例如:課題"東西方社會保障制度比較研究"的概念組面和檢索詞為:--------------------------------------------------------------------------------2 計算機信息檢索的基本方法  概念組面1:"社會保障"social security 概念組面2:"制度研究"system? Research4.3.4數據庫的選擇不同數據庫的學科范圍不同,檢索指令不同,收費的標準也不同。所以,在檢索之前應該閱讀有關數據庫的使用介紹,以便選擇數據庫時做到心中有數。 選擇數據庫,我們一般應該遵循以下幾條原則1.按照課題的檢索要求和目的,選擇收錄文獻種類多、專業覆蓋面寬、年代跨度對口的數據庫; 2.當需要查找最新文獻信息時,選擇數據更新周期短的數據庫;3.當還需要獲取原文時,選取原文獲取較容易的數據庫; 4.在同時有多個數據庫可供選擇的情況下,應首先選擇比較熟悉的數據庫。 5.當幾個數據庫的內容交叉重復率比較高時,應選擇檢索費用比較低的數據庫。 4.3.5檢索策略構成和調整方法在實際檢索過程中,僅需一個檢索詞就能滿足檢索要求的情況并不很多。通常我們需要使用多個檢索詞構成檢索策略,以滿足由多概念組配而成的較為復雜課題的要求。 檢索策略,又稱提問邏輯,就是對多個檢索詞之間的相互關系和檢索順序作出的某種安排。構成檢索策略就是運用計算機情報檢索系統可以接受的方法,包括布爾邏輯算符、位置邏輯算符等方法,表達課題檢索要求的過程。 1.布爾邏輯算符  規定檢索詞之間的邏輯關系的算符,稱為布爾邏輯算符。布爾邏輯算符包括邏輯"或(OR)"、"與(AND)"和"非(NOT)"。 (1) 或(OR)運算符。也可用"+"代替,是用來組配具有同義或同族概念的詞,如同義詞、相關詞等。其含義是,檢出的記錄中,至少含有兩個檢索詞中的一個。OR算符的基本作用是擴大檢索范圍,增加命中文獻量,提高檢索結果的查全率,OR運算符還有一個去重的功能。在實際檢索中,同一組面中含義相同的詞,相互之間都使用OR運算符。另外,在使用截詞方法檢索具有相同詞干的檢索詞時,這些詞之間也自動地隱含了邏輯"或"的關系。 (2) 與(AND)運算符。也可用"*"代替,用來組配不同檢索概念。其含義是檢出的記錄必須同時含有所有的檢索詞。AND算符的基本作用是縮小檢索范圍,減少命中文獻量,提高檢索結果的查準率。在實際檢索中,不同概念組面之間以及同一組面內的不同含義的詞之間通常使用AND算符。 (3) 非(NOT)運算符。也可用"-"代替,但在檢索時建議使用NOT,以避免與詞間的分隔符"-"混淆,NOT算符是排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時含有其后的詞。NOT算符的基本作用是縮小檢索范圍,提高檢索結果的查準率. 2. 位置算符  位置算符又稱鄰接算符(adjacent operators),適用于兩個檢索詞以指定間隔距離或者指定的順序出現的場合,比如,以詞組形式表達的概念;彼此相鄰的兩個或兩個以上的詞;被禁用詞或特殊符號分隔的詞等。位置算符是調整檢索策略的一種重要手段。按照兩個檢索詞出現的順序和距離,可以有多種位置算符,而且對同一種位置算符,檢索系統不同,規定的位置算符也不同。例如,Compendex光盤數據庫使用的位置算符"(N)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序可以顛倒)、"(F)"(表示其兩側的檢索詞必須在同一字段(例如同在題目字段或文摘字段)中出現,兩詞的詞序可以顛倒)、"(S)"(表示其兩側的檢索詞必須在同一句子中出現,兩詞的詞序可以顛倒)和"(W)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序不可以顛倒)四種。 3.字段限制字段限制也是調整檢索策略的一種重要的手段。它是限定檢索詞必須在數據庫記錄中規定的字段范圍內出現的文獻,方為命中文獻的一種檢索方法。如果想指定在題名等字段中查找所希望的檢索詞,就需要使用字段限制。字段限制適用于在已有一定數量輸出記錄的基礎上,通過指定字段的方法,減少輸出篇數,提高檢索結果的查準率的場合。由于字段限制采用前綴和后綴的形式,因此又稱為前綴限制和后綴限制。例如Compendex光盤數據庫基本字段限制的用法是在需要指定字段的檢索詞后加上后綴運算符"/"和段碼。這個數據庫輔助字段限制的用法是在需要指定字段的檢索詞(有時檢索詞須放在雙引號內)之前加上段碼和前綴運算符"="。 --------------------------------------------------------------------------------3 計算機信息檢索的基本方法 4. 檢索策略的調整檢索策略輸入檢索系統后,系統響應的檢索結果有時不一定能滿足課題檢索的要求,例如:或者檢出的篇數過多,而且不相關文獻所占比例很大,或者檢出的文獻數量太少,有時甚至為零,這時就需要調整檢索策略。 調整檢索策略之前,首先要分析造成檢索結果不理想的原因。對于輸出篇數過多的情況,應分析是否是由下述原因造成的:①選用了多義性的檢索詞;②截詞截得過短;③輸入的檢索詞太少;④應該使用"與(AND)"的使用了"或(OR)";⑤優先運算符"()"使用錯誤。對于輸出篇數過少的情況,應分析是否是由下述原因造成的:①檢索詞拼寫錯誤;②遺漏重要的同義詞或隱含概念;③檢索詞過于冷僻具體;④沒有使用截詞算符;⑤位置算符和字段算符使用的過多;⑥使用過多的"與(AND)"算符。 針對上述原因,如果是屬于需要擴大檢索范圍,提高文獻查全率,調整檢索策略的方法有:①減少"與(AND)"算符,增加同義詞或同族相關詞使用邏輯或(OR)將它們連接起來;②在詞干相同的單詞后使用截詞符(?);③去除已有的字段限制、位置算符限制(或者改用限制程度較小的位置算符)。 如果是屬于縮小檢索范圍,提高文獻查準率的,調整檢索策略的方法有:①減少同義詞或同族相關詞;②增加限制概念,用邏輯與(AND)將它們連接起來;③使用字段限制,或者限定檢索詞在指定的基本字段,或者指定的輔助字段出現,限制檢索結果的文獻類型、語種、出版國家;④使用適當的位置算符;⑤使用"非(NOT)"算符,排除無關概念。 4.3.6輸出格式和方式的選擇所謂輸出格式的選擇是對記錄字段的選擇。所謂輸出方式的選擇是指對屏幕顯示、打印和存盤的選擇。一般情況下,如果輸出的是中間結果,屬于基本字段的題目(TI)、文摘(AB)、敘詞(DE)和識別詞(ID)字段是必須的,這些字段有利于觀察結果,對檢索策略做進一步調整。如果是最終結果,可以根據時間、經費條件選擇其中適用的格式。 輸出方式的選擇,要注意的問題是,數據庫是否只允許打印、存盤選中的記錄;在選定打印、存盤后,是否還須進一步選擇"當前記錄""全部記錄""選中記錄";另外如果是存盤,是否還有文件擴展名的限制。
1 計算機信息檢索的基本方法 4.3.1明確檢索要求和檢索目標計算機檢索的第一步準備工作是明確檢索要求和檢索目標。明確檢索要求就是要搞清楚本課題屬于什么學科,所需文獻的類型及語種,查找文獻的年代,所需文獻的最佳篇數,允許支配的檢索費用。這些要求對選擇數據庫、構造檢索策略都是十分重要的。 確定檢索目標也是進行計算機信息檢索前應搞清楚的準備工作。例如:如果屬于開題調研,則應盡可能地檢索出與之相關的全部文獻,即要求較高的查全率;以便充分地做好開題的準備工作;如果屬于探索性、開創性的課題,則只需要查出一些啟發性的文獻,對查準率和查全率要求都不一定有很高的要求。 4.3.2課題分析1. 課題概念的分析方法分析課題就是分析出課題所涉及的主要概念,并找出能代表這些概念的若干個詞或詞組,進而分析概念之間的上、下、左、右關系。對于新學科、交叉學科和邊緣學科的課題,則要搞清楚這些概念之間的關系。概念分析的結果應以概念組為單元的詞或詞組的形式列出,以便下一步制訂檢索策略時使用。 2. 隱含概念的分析方法有些課題的實質性內容往往很難從課題的名稱上反映出來,課題所隱含的概念和相關的內容需要從課題所屬的專業角度作深入分析,才能提煉出能夠確切反映課題內容的檢索概念。例如:"社會保障"包含"養老保險"、"失業保險"、"醫療保險"和"社會救濟"等概念,如果要檢索社會保障方面的文獻,應該析出上述概念,才能保證文獻的查全率。 3. 核心概念的選取有些檢索詞中已經含有的某些概念,在概念分析中應予以排除。例如:課題"公司勞動獎勵、職工培訓和養老保險制度管理的理論和實踐",如果把"勞動獎勵","職工培訓","養老保險","公司","制度","管理"六個概念全部組配起來,則會造成大量文獻漏檢。實際上,勞動力資源管理已經包含了勞動獎勵、職工培訓和養老保險三個方面,而且,勞動力管理必然是針對該三個方面而言的。因此,本課題只須采用"勞動力資源"和"管理"這兩個本質概念即可。 為了提高文獻的檢準率,應該從相應的規范詞表中選擇所需的檢索詞。并且在確定檢索詞時,除了要考慮反映主題概念的同義詞、近義詞等相關的檢索詞外,還要注意選擇被選用檢索詞的縮寫詞和不同拼法的詞,以避免漏檢有關的文獻。 4.3.3檢索詞的擴展、選擇和處理目前的計算機信息檢索系統,還不具備智能思考的能力,還不會對所輸入的檢索詞以及涉及的所有詞進行自動、全面的檢索,因此,必須在概念分析的基礎上列出與概念有關的詞,從中做出選擇,并利用截詞等方法對檢索詞予以歸并。 1.相同概念的檢索詞的擴展 擴展相同概念的檢索詞的方法一般有同義詞方法、主題詞表方法和截詞方法(1) 同義詞方法。在同一概念的范疇內,從語言角度,選擇不同的名稱、不同的拼寫方法和單復數形式。不同的名稱包括學名和俗名、簡稱和全稱,商品名和物質或產品名,事物的代碼和事物的學名。不同的拼寫方法,以英語為例,包括英式英語和美式英語的區別。 (2)截詞方法。當某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(多數英語單詞的單復數變化和英美不同拼寫形式),可以采用截詞方法擴展檢索詞。這種方法要求在詞干后使用截詞符。截詞符一般包括"?"和"*"兩種。具體采用什么形式,各個系統都有明確的規定。例如:在DIALOG系統中,截詞符號有無限截詞算符 ("?") 和有限截詞 ("??"和"?? ?")等多種,"?"有時還用做字符屏蔽符。(3)主題詞表方法  許多數據庫都編有自己的主題詞表。在數據庫編有主題詞表的情況下,應該盡量從詞表中選擇檢索詞。使用主題詞表,不僅可以使檢索詞更加規范,提高檢索結果的準確性,而且可以從同族詞中選取更多的上位詞、下位詞、相關詞,使獲得的檢索結果更為理想。 2.檢索詞的選擇和處理 運用上述方法得到的詞,首先應加以選擇,即注意選用本專業通用的術語(應避免使用冷僻詞和根據中文術語自譯生造的詞),然后以概念為單位,構成組面(facets)。例如:課題"東西方社會保障制度比較研究"的概念組面和檢索詞為:--------------------------------------------------------------------------------2 計算機信息檢索的基本方法  概念組面1:"社會保障"social security 概念組面2:"制度研究"system? Research4.3.4數據庫的選擇不同數據庫的學科范圍不同,檢索指令不同,收費的標準也不同。所以,在檢索之前應該閱讀有關數據庫的使用介紹,以便選擇數據庫時做到心中有數。 選擇數據庫,我們一般應該遵循以下幾條原則1.按照課題的檢索要求和目的,選擇收錄文獻種類多、專業覆蓋面寬、年代跨度對口的數據庫; 2.當需要查找最新文獻信息時,選擇數據更新周期短的數據庫;3.當還需要獲取原文時,選取原文獲取較容易的數據庫; 4.在同時有多個數據庫可供選擇的情況下,應首先選擇比較熟悉的數據庫。 5.當幾個數據庫的內容交叉重復率比較高時,應選擇檢索費用比較低的數據庫。 4.3.5檢索策略構成和調整方法在實際檢索過程中,僅需一個檢索詞就能滿足檢索要求的情況并不很多。通常我們需要使用多個檢索詞構成檢索策略,以滿足由多概念組配而成的較為復雜課題的要求。 檢索策略,又稱提問邏輯,就是對多個檢索詞之間的相互關系和檢索順序作出的某種安排。構成檢索策略就是運用計算機情報檢索系統可以接受的方法,包括布爾邏輯算符、位置邏輯算符等方法,表達課題檢索要求的過程。 1.布爾邏輯算符  規定檢索詞之間的邏輯關系的算符,稱為布爾邏輯算符。布爾邏輯算符包括邏輯"或(OR)"、"與(AND)"和"非(NOT)"。 (1) 或(OR)運算符。也可用"+"代替,是用來組配具有同義或同族概念的詞,如同義詞、相關詞等。其含義是,檢出的記錄中,至少含有兩個檢索詞中的一個。OR算符的基本作用是擴大檢索范圍,增加命中文獻量,提高檢索結果的查全率,OR運算符還有一個去重的功能。在實際檢索中,同一組面中含義相同的詞,相互之間都使用OR運算符。另外,在使用截詞方法檢索具有相同詞干的檢索詞時,這些詞之間也自動地隱含了邏輯"或"的關系。 (2) 與(AND)運算符。也可用"*"代替,用來組配不同檢索概念。其含義是檢出的記錄必須同時含有所有的檢索詞。AND算符的基本作用是縮小檢索范圍,減少命中文獻量,提高檢索結果的查準率。在實際檢索中,不同概念組面之間以及同一組面內的不同含義的詞之間通常使用AND算符。 (3) 非(NOT)運算符。也可用"-"代替,但在檢索時建議使用NOT,以避免與詞間的分隔符"-"混淆,NOT算符是排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時含有其后的詞。NOT算符的基本作用是縮小檢索范圍,提高檢索結果的查準率. 2. 位置算符  位置算符又稱鄰接算符(adjacent operators),適用于兩個檢索詞以指定間隔距離或者指定的順序出現的場合,比如,以詞組形式表達的概念;彼此相鄰的兩個或兩個以上的詞;被禁用詞或特殊符號分隔的詞等。位置算符是調整檢索策略的一種重要手段。按照兩個檢索詞出現的順序和距離,可以有多種位置算符,而且對同一種位置算符,檢索系統不同,規定的位置算符也不同。例如,Compendex光盤數據庫使用的位置算符"(N)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序可以顛倒)、"(F)"(表示其兩側的檢索詞必須在同一字段(例如同在題目字段或文摘字段)中出現,兩詞的詞序可以顛倒)、"(S)"(表示其兩側的檢索詞必須在同一句子中出現,兩詞的詞序可以顛倒)和"(W)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序不可以顛倒)四種。 3.字段限制字段限制也是調整檢索策略的一種重要的手段。它是限定檢索詞必須在數據庫記錄中規定的字段范圍內出現的文獻,方為命中文獻的一種檢索方法。如果想指定在題名等字段中查找所希望的檢索詞,就需要使用字段限制。字段限制適用于在已有一定數量輸出記錄的基礎上,通過指定字段的方法,減少輸出篇數,提高檢索結果的查準率的場合。由于字段限制采用前綴和后綴的形式,因此又稱為前綴限制和后綴限制。例如Compendex光盤數據庫基本字段限制的用法是在需要指定字段的檢索詞后加上后綴運算符"/"和段碼。這個數據庫輔助字段限制的用法是在需要指定字段的檢索詞(有時檢索詞須放在雙引號內)之前加上段碼和前綴運算符"="。 --------------------------------------------------------------------------------3 計算機信息檢索的基本方法 4. 檢索策略的調整檢索策略輸入檢索系統后,系統響應的檢索結果有時不一定能滿足課題檢索的要求,例如:或者檢出的篇數過多,而且不相關文獻所占比例很大,或者檢出的文獻數量太少,有時甚至為零,這時就需要調整檢索策略。 調整檢索策略之前,首先要分析造成檢索結果不理想的原因。對于輸出篇數過多的情況,應分析是否是由下述原因造成的:①選用了多義性的檢索詞;②截詞截得過短;③輸入的檢索詞太少;④應該使用"與(AND)"的使用了"或(OR)";⑤優先運算符"()"使用錯誤。對于輸出篇數過少的情況,應分析是否是由下述原因造成的:①檢索詞拼寫錯誤;②遺漏重要的同義詞或隱含概念;③檢索詞過于冷僻具體;④沒有使用截詞算符;⑤位置算符和字段算符使用的過多;⑥使用過多的"與(AND)"算符。 針對上述原因,如果是屬于需要擴大檢索范圍,提高文獻查全率,調整檢索策略的方法有:①減少"與(AND)"算符,增加同義詞或同族相關詞使用邏輯或(OR)將它們連接起來;②在詞干相同的單詞后使用截詞符(?);③去除已有的字段限制、位置算符限制(或者改用限制程度較小的位置算符)。 如果是屬于縮小檢索范圍,提高文獻查準率的,調整檢索策略的方法有:①減少同義詞或同族相關詞;②增加限制概念,用邏輯與(AND)將它們連接起來;③使用字段限制,或者限定檢索詞在指定的基本字段,或者指定的輔助字段出現,限制檢索結果的文獻類型、語種、出版國家;④使用適當的位置算符;⑤使用"非(NOT)"算符,排除無關概念。 4.3.6輸出格式和方式的選擇所謂輸出格式的選擇是對記錄字段的選擇。所謂輸出方式的選擇是指對屏幕顯示、打印和存盤的選擇。一般情況下,如果輸出的是中間結果,屬于基本字段的題目(TI)、文摘(AB)、敘詞(DE)和識別詞(ID)字段是必須的,這些字段有利于觀察結果,對檢索策略做進一步調整。如果是最終結果,可以根據時間、經費條件選擇其中適用的格式。 輸出方式的選擇,要注意的問題是,數據庫是否只允許打印、存盤選中的記錄;在選定打印、存盤后,是否還須進一步選擇"當前記錄""全部記錄""選中記錄";另外如果是存盤,是否還有文件擴展名的限制。
文章TAG:信息檢索的方法信息信息檢索檢索

最近更新

  • 早晨圖片,誰有早晨太陽剛剛升起的圖片

    誰有早晨太陽剛剛升起的圖片2,早晨最美是什么1,誰有早晨太陽剛剛升起的圖片http://image.baidu.com/i?tn=baiduimagect=201326592lm= ......

    陽江市 日期:2023-05-06

  • 得了月子病怎么辦,得了月子病怎么辦急急

    得了月子病怎么辦急急2,得了月子病咋辦1,得了月子病怎么辦急急病情分析:產后風又叫月子病,病癥類似于風濕、類風濕疾病,全身關節疼痛難忍,遇冷、遇風后,疼痛的癥狀會加重。月子病月子治 ......

    陽江市 日期:2023-05-06

  • 期初建賬,數據周期表:期初余額以上期期末余額核算

    期初余額以上期期末余額為基礎,反映上期交易結果和上期采用的會計政策,擴展的數據期初balance指的是期初的現有賬戶余額,通常期初的余額是上一個賬戶結轉到當前賬戶的余額,等于對應賬 ......

    陽江市 日期:2023-05-06

  • 我心依然,我心依然什么意思

    我心依然什么意思意思是沒有變化2,我心依然800字作文我對某某女孩子心依然堅定這題目很坑爹有歧義不過你老師應該叫你寫你想學音樂但是失敗了很多次我心依然美麗是流星的劃過,是煙花的綻放 ......

    陽江市 日期:2023-05-06

  • 親情伴我成長,作文 親情伴我成長

    作文親情伴我成長親情伴我成長感悟親情,就在生活的點點滴滴之中。自從,我在馬老師補習班學習寫作的過程當中,我就感悟到了濃濃的親情。每次,我去馬老師補習班時李老師是那么的認真,仔細講解 ......

    陽江市 日期:2023-05-06

  • 唐篩準確率,唐篩檢查的準確率有多高

    唐篩檢查的準確率有多高2,唐氏篩查準確率有多高3,唐式篩查準確率高嗎4,唐氏篩查正確率有多少1,唐篩檢查的準確率有多高關鍵字唐氏篩查準確率需要明確的是,唐篩檢查只能幫助判斷胎兒患有 ......

    陽江市 日期:2023-05-06

  • 作文四年級,跪求四年級的作文日記一則

    跪求四年級的作文日記一則日記一則今天,我們早早地吃了晚飯,趁著外面涼快,我和媽媽一起去外面shopping.“叮鈴鈴”當我們來到十字路口一邊的幾家小店旁,正要進“圣百合”面包店的時 ......

    陽江市 日期:2023-05-06

  • 繁華落幕,繁華落幕:愛而無悔

    落幕:一般表示階段結束或某事即將結束,也就是說,這個城市曾經繁華,現在卻找不到過去的感覺,不再繁華,繁華是繁華的時候,落幕意味著結束,美好的時光已經過去,什么叫愛而無悔,當然,繁華 ......

    陽江市 日期:2023-05-06

主站蜘蛛池模板: 文水县| 屯门区| 中方县| 武城县| 益阳市| 于田县| 密云县| 太湖县| 三亚市| 肥城市| 西丰县| 朝阳区| 德惠市| 八宿县| 胶州市| 凌源市| 湄潭县| 闸北区| 日土县| 上思县| 洮南市| 铜梁县| 沈阳市| 马龙县| 浙江省| 监利县| 山丹县| 白城市| 石台县| 临城县| 芦溪县| 资中县| 天镇县| 丹棱县| 禹州市| 西林县| 江源县| 贺州市| 阳原县| 佛山市| 横峰县|