最近開始玩 BI的東西,而之前專案有使用到Pentaho Open Source這個好物....
Pentaho裡面很多東西,跟 Jasperreport一樣東西很多,我最先接觸到的是kettle ETL的工具,玩了一陣子,開始有空就把它寫下來,以免忘記。
Scan一個目錄下所有檔案,然後塞進去資料庫
1.先拉兩個 Input,一個Get File Names,一個是CSV file input,再拉一個 output 中的 Table output,然後把他連起來。
2.點開 Get File Names,File or directory設定你的指定目錄,Regular Expression則是輸入.*\.*$則是所有檔案,若是CSV則可.*\.torrent$這可以了,可以按一下 Preview rows看看是否正確。
3.在CSV file input則於The filename field....下拉選單選擇filename,並於下方文字檔案格式部分依序輸入該文字檔案格式。這部分就是讓前一個步驟讀取所有檔案後,將檔名自動送進來,依據固定的格式讀入。
4.最後一個Table output就是塞到DB,把相關mapping設定一下就可以了。
Pentaho實在很讚,往後陸續增加囉。
Pentaho裡面很多東西,跟 Jasperreport一樣東西很多,我最先接觸到的是kettle ETL的工具,玩了一陣子,開始有空就把它寫下來,以免忘記。
Scan一個目錄下所有檔案,然後塞進去資料庫
1.先拉兩個 Input,一個Get File Names,一個是CSV file input,再拉一個 output 中的 Table output,然後把他連起來。
2.點開 Get File Names,File or directory設定你的指定目錄,Regular Expression則是輸入.*\.*$則是所有檔案,若是CSV則可.*\.torrent$這可以了,可以按一下 Preview rows看看是否正確。
3.在CSV file input則於The filename field....下拉選單選擇filename,並於下方文字檔案格式部分依序輸入該文字檔案格式。這部分就是讓前一個步驟讀取所有檔案後,將檔名自動送進來,依據固定的格式讀入。
4.最後一個Table output就是塞到DB,把相關mapping設定一下就可以了。
Pentaho實在很讚,往後陸續增加囉。
留言
張貼留言