Lucene 是一個很強大的搜尋引擎( Lucene wiki ),重點是Open Source,還有很多子專案很好用喔,這次來介紹一下 Tika 這個子專案,它是一個文件擷取內容及文件metadata的函式庫,支援的檔案格式可以參考一下 這裡 ,加上Lucene Core及中文IKAnalyzer就可以組合文件的中文全文檢索喔。 先下載 Lucene 4.3.1 Tika IKAnalyzer
喜歡進化金融科技架構、也愛寫程式、更愛開放源碼、愛分享技術給大家的 Louis