跳到主要內容

發表文章

目前顯示的是 7月, 2013的文章

Lucene(一):Lucene4.3.1、Tika、IKAnalyzer中文分詞

Lucene 是一個很強大的搜尋引擎( Lucene wiki ),重點是Open Source,還有很多子專案很好用喔,這次來介紹一下 Tika 這個子專案,它是一個文件擷取內容及文件metadata的函式庫,支援的檔案格式可以參考一下 這裡 ,加上Lucene Core及中文IKAnalyzer就可以組合文件的中文全文檢索喔。 先下載 Lucene 4.3.1 Tika IKAnalyzer