2007年4月18日 星期三

Beyond Google: Exalead

Exalead

法國公司在2000年所開發的搜尋引擎,首頁底端最後一行字標示可以搜尋80億以上的網頁,可搜尋中文,所以建議先由首頁右上角的preference進入設定擬搜尋的語文。中文只有一個Chinese選項,可以同時搜正體中文和簡體中文。



搜尋結果如下圖,以三欄呈現:

  1. 最左欄是網頁縮圖,每張縮圖右下角有個PREVIEW按紐,可以直接檢視Exalead資料庫中的備份(類似Google的頁庫備份)。在PREVIEW畫面明確告訴我們目前所看網頁是那一天的備份,點選日期旁的Curren version就會連到該網頁。搜尋關鍵語會以不同顏色標示,並統計出現次數,還可以直接點選previous或 next逐一檢視關鍵字出現的前後文。Preview畫面的右上角顯示搜尋結果下一筆的網頁縮圖,可以直接點選檢視網頁備份,而不用回到搜尋結果。




  2. 第二欄是搜尋結果的說明, 可以單純文字、網頁縮圖加文字、縮圖加文字加網頁分類標示等三種型式顯示,在All results的View項下做設定。


  3. 第三欄是收斂搜尋結果,共有八種選項可以精煉搜尋結果。直接點選某個選項為限定在該選項做進一步搜尋,亦可點選選項右邊的remove 或exclude將相關內容由搜尋結果中移除。
  • Related terms
  • Site type
  • Multimedia
  • Languages
  • Directory
  • File types
  • Geographic location
  • Search within results
語言、資料類型和地理區域(國家)之相關選項後均註明百分比,供進一步搜尋之參考。


進階搜尋
Exalead 的進階搜尋真的是超user friendly的,完全是用使用者的語言做溝通。將搜尋策略分成What? Where? When?三部分,每部分都以plain English加上範例做說明。
用法是,先點選搜尋策略,如 exact phrase,接著Exalead就會在搜尋框中出現引號中間括著type phrase here,使用者只要輸入片語即可,完全不需要知道片語搜尋要加引號這類複雜的策略。依此類推,選一個國家,選一個語言,時間限定在某一天以前,某一天以後。只可惜Exalead沒有中文介面。
Exalead的設計頗符合 Don't Make Me Think的網站設計原則,對不常上網,不熟搜尋策略的使用者,可以有效提高檢索效率。

2007年4月17日 星期二

視覺化搜尋引擎

目前市場上最IN的視覺化搜尋引擎有三:
  1. Grokker
    搜尋Yahoo!、Wikipedia、Amazon Books。
    EBSCO資料庫之視覺化搜尋採用Grokker。
    請參考圖資電子報第32期的介紹。
  2. Kartoo
    是一整合式搜尋引擎,以視覺化方式呈現由14個搜尋引擎搜尋回來的結果。
  3. Touchgraph
    以視覺化方式呈現網頁與網頁之間的關係,可以支援Google, Wiki, Amazon book search等。

Kartoo

是整合式搜尋引擎,可以將Yahoo, MSN, Alltheweb, Wisenet, Hotbot, Lycos, Entireweb, Teoma, Looksmart等14家搜尋引擎的搜尋結果以視覺化方式顯示。

進入首頁後,直接在搜尋框輸入關鍵詞。可以 +、-等符號來組合關鍵詞,例如:"global warming" "green energy"



搜尋結果如下圖,首先在左邊以群組方式分類搜尋結果,在右邊則以視覺化方式展覝網頁之關係;點選分類群組,右邊的關聯圖也會一併更新」。 右下角顯示搜尋結果筆數,可點選next map檢視下一頁的關聯圖;也可以將圖寄回信箱或存檔。


將游標停在關聯圖的節點(node),會顯示出該節點與其他網頁之主要關鍵詞(下圖中的綠色字),同時在左欄上端顯示網頁的預覽圖、網頁描述和由那個搜尋引擎找到的。點選節點,則直接連結到該網頁。



TouchGraph

進入首頁後,請在右邊點選TouchGraph Google的圖示,才能進入如下圖的畫面,輸入關鍵詞或URL,然後Graph it!。


TouchGraph做的是將Google的搜尋結果網路圖顯示網頁之關連性,如下圖所示。所以在搜尋前請先確認您的電腦已安裝Java 1.5 。因為跑圖需要時間,所以請稍侯。


搜尋結果分成兩大區塊,右邊是網路圖,以不同顏色的大小圓圈來表示網站的互連性,一種顏色是一個群組(cluster)。由左下角的視窗以相對應的顏色標示各個群組,將捲軸往下拉到最後一個顏色區塊,就可知分成幾個群組。在點選每個色塊時,會在網路圖中以方塊顯示群組說明。

其實TouchGraph Google Browser是把Google資料庫中的related sites以網狀圖顯示,所以展現的是網站的互連性(connectivity);所以我們也可以在搜尋框中輸入一個網站的URL,看看這個網站的網路鄰居是那些人。我試了www.ntu.edu.tw等國內的幾所大學和www.mit.edu(有12個群組),網站的互連性也許可以反應一所大學或機構的國際化吧。



Visual Thesaurus

ThinkMap的Visual Thesaurus則是用同樣的視覺化方式來呈現單字間的關係。右上角的紅色塊下面會列出字的各種定義,預設顯示的是第一個定義的網狀圖;如果點選不同定義就開啟對應的網狀圖。

游標停在節點上,會在節點旁顯示其對應的定義,如下圖所示。

這個字典是要訂閱的,一個月才99元,因為支持她們的創新理念,所以一開始就訂了;當然可以先試用看看。


GraphScholar

有位Blogger寫了TouchGraph browser for Google Scholar,可以把GS的搜尋結果以TouchGraph的網路圖呈現。還沒有搞慬,先放著,試了再回來寫。

Open J-Gate 開放期刊入口網站

印度Informatics Ltd為提倡OAI (Open Access Initiative)在2006年2月27日成立Open J-Gate網站,提供線上免費檢索3718種open access 期刊所刊載的數百萬篇期刊文章,同時可以免費閱讀全文。

Open J-Gate是什麼?
Open J-Gate 是全球open access期刊文獻的入口網站,提供可以線上免費取得全文的三千七百多種期刊資料庫,可以超連結到出版社網站所提供的全文。所收錄期刊有半數為同儕審查期刊(peer-reviewed journals),半數為專業或商期刊,可以檢索,也可以依期刊刊名瀏覽。

進階搜尋可以依個人需求強代搜尋結果:
  1. 指定搜尋同儕審查期刊或專業期刊;
  2. 輸入關鍵詞,支援布林邏輯;
  3. 限定關鍵詞出現在文章篇名、關鍵詞、摘要或作者的服務機構(這項是一般資料庫沒有提供的檢索項目);
  4. 限制最近一週或一個月更新的內容,出版年代以及學域。

搜尋結果結構化:
  1. 首先列出搜尋關鍵詞與查得筆數;
  2. 編號條列搜尋結果,每筆結果列出文章篇名、來源和摘要;
  3. 超連結出版社網站,瀏覽文章全文;
  4. 以peer-reviewed標示取自同儕審查期刊之文章。


Open J-Gate的特色與好處

  • 免費電子期刊,對於終身學習者是莫大福音。在學時可以很方便地透過校外連線利用圖書館的各項資源,一旦畢業後,這些福利都沒了,要做研究解問題,資訊那裏來, open access 資源是重要來源。
  • 三千多種期刊,半數peer-reviewed,半數industry journals;同時滿足研究與實務需求;
  • 持續更新,每年新增30萬篇以上的新文章,而且經常檢測確保全文連結之有效性;
  • 可以瀏覽期刊目次(Table of Content, TOC);
  • 進階搜尋方便多元,強化搜尋結果。

2007年4月15日 星期日

Fisssh! 一個超新的整合式搜尋引擎

今年(2007)四月初英國威爾斯的HGi Media Systems推出fisssh!,一個為2.0現象而設計的整合式搜尋引擎(meta search engine)。 (請注意這條魚有三個S)

fisssh!是整合式搜尋引擎,所以會將我們輸入的關鍵詞彙同時丟到多個搜尋引擎進行搜尋,再將搜尋結果統整後以一致的格式呈現。只是fisssh!幫我們整合的不只是網頁搜尋結果,而是同時將web, news, blogs, videos, podcasts, info, jobs, social和shopping等不同類型搜尋到的結果,統統加以整合,然後再以很具有編輯設計的畫面呈現。



這個網站的設計者是Craig Hughes,原本是位graphic designer,同時在學校兼課教書,2004年的某天早上,一覺醒來決定要學php, mysql, xml, xslt, css, 和 xhtml,於是2007年就誕生了fisssh!網站。因為設計者有美工設計的專長,所以版面編輯有別於現有的搜尋引擎,用色鮮明,版面模組化,在搜尋結果中以使用者的語言來溝通,導引使用者做更深入的搜尋。


fisssh!是整合式搜尋引擎,web search時預設搜尋的對象是:

  • Yahoo!
  • Live Search (Microsoft)
  • Wikipedia (via Yahoo!)
  • del.icio.us (Yahoo!)
  • Yahoo! Answers
  • DMOZ Open Directory (via Yahoo!)

網頁搜尋結果可以分成左右兩個模塊(blocks),左邊模塊列出Yahoo!和Live Search的搜尋結果。首先列出十筆Yahoo!的搜尋結果,然後是 view more results from yahoo! 與RSS訂閱服務,緊接著詢問要不要搜尋videos;然後列出Live Search的十筆搜尋結果。



右邊模塊則依序列出Wikipedia、del.icio.us、Yahoo! Answers、DMOZ Open Directory的搜尋結果。每類搜尋結果先說明搜尋關鍵詞與來源,再列出搜尋結果。

如果搜尋不到相關資訊,亦會加以說明,如:No answers were found from Yahoo! Answers。

在搜尋結果的最後還會再詢問使用者有沒有興趣搜尋新聞或部落格(Could news or blogs about "search engine optimization" be interesting?...)。

如果使用者覺得Yahoo!和Microsoft Live Search的結果還不夠,fisssh!在最後會列出Googel、Mamma、Digg等75家各類搜尋引擎,供使用者選擇,只要點選所列搜尋引擎,Fisssh會自動將之前輸入的檢索詞彙丟到所選搜尋引擎進行搜尋,並開新視窗顯示搜尋結果。


因為fisssh!實在是太新了,新到網站上都用「油漆未乾」來形容自己,新到連FAQ都還沒有內容,也還不知道要提供什麼Help。大部分的blog都引用About fisssh!中 的簡短說明,也是新聞稿的內容;根據這些介紹,fisssh!是將各種主要的網站服務的搜尋結果加以整合,並以獨特的風格呈現,提供網友更豐富、更多樣化,更令人期待的既相關又正確的搜尋結果。fisssh!的設計者Craig Hughes說他的主要目的是要讓使用者 'get closer' and 'go deeper'。fisssh!的搜尋結果頁面是將資訊組合成模塊(blocks),每個模塊代表由一種類型的網站服務中搜尋回來的結果,這樣的版面安排方便使用者快速選定自己的興趣,深入探索。同時還很方便地提供RSS的超連結。

Search engines這麼多,為什麼要介紹fisssh!呢?不只是因為它「新」,更因為它很有趣,很反傳統。

  1. 有趣。網站名稱叫fisssh!上網搜尋資訊本來就很有釣魚的味道,到底是不是自己想要釣的魚會上鈎,是要精心設計的。打從google打一長串的O之後,重複某個字就變成了一種趣味,所以fisssh!有三個s,另外我想fish.com應該早就被人註冊了。
  2. 畫面簡單,首頁可以說是很Google。首頁以外的每一頁右上角都會以鮮明的桃紅色塊說明目前所在的服務項目如:搜尋網頁是web,搜尋新聞是news。
  3. 搜尋結果模塊化。將搜尋結果區分成不同的blocks,資訊組織與呈現符合資訊結構(information architecture)之理念。
  4. 以使用者慣用的語言溝通互動。在各項搜尋結果提醒使用者可以「更靠近一點」( get closer)、「更深入一點」(go deeper)。
  5. 多元搜尋。除了可以搜網頁、搜新聞外,更可以同時搜尋blog、video、Podcasts、Info、social,以及job和shop。詳細內容請參考External Web Services
  6. 網站用色很時尚。不知如何形容,顏色、版面都與以往的搜尋引擎介面完全不同,有點google,可是又很不google,只能大家自行體驗了。
  7. 目前第一個不滿意的地方是沒有feedback。例如沒有拼字檢查或related terms的建議。