開發專屬個人的搜尋引擎 - 使用Lucene & Heritrix
使用Lucene & Heritrix
• 結合理論與實務運用,除了介紹搜尋引擎系統外,也詳細說明開發過程。 • 提供完整實例,讀者可以依據自己的專案需求,稍微修改相關的內容,就可以應用在自己研發的實際項目當中。 • 針對開發時常遇到的問題進行深入探討,有效解決讀者困擾。 本書大綱 Ch01 搜尋引擎與資訊檢索 Ch02 Lucene入門實例 Ch03 索引的建立 Ch04 Lucene搜尋 Ch05 排序、過濾和分頁 Ch06 Lucene的分析器 Ch07 Word、Excel和PDF的處理 Ch08 Compass:封裝了Lucene的框架 Ch09 Lucene分散式 Ch10 無比強大的網路爬蟲Heritrix Ch11 搜尋引擎綜合實例:準備篇 Ch12 搜尋引擎綜合實例:下載篇 Ch13 使用正則運算式與HTMLParser分析網頁 Ch14 網頁內容儲存與索引 Ch15 搜尋引擎綜合實例:互動篇 Ch16 搜尋引擎綜合實例:Web篇 附錄 Lucene 2.4更新內容