Tech & Science 2015.06.16 15:01 ”Talend”と”RapidMiner Studio”、2つのETLツールを比較してみた|Talend Open Studio によるビッグデータ分析(第1回) Talendはコンポーネント(機能)を追加、開発できる開発者好みのオープンソースETLツール データ分析するためには、データーベース(以下、DB)で取込める形に加工する必要があります。この加工には、高価なETLツールを使用するか、プログラ...
Tech & Science 2015.06.20 09:40 Talendのインストールと初期設定(Windows 8.1編) ~Javaのバージョンに気を付けろ~|Talend Open Studio によるビッグデータ分析(第2回) Talend 5.6は、Java SE 7(JDK7)でないと起動しない! ダウンロードするJavaに気を付けよう 前回は、Talend Open Studio(以下、Talend)とRapidMiner Studioを比較を行い、Tal...
Tech & Science 2015.07.18 10:20 フォルダ中のファイルを変換して1つにまとめる|Talend Open Studio によるビッグデータ分析(第4回) フォルダ検索(tFileList)の結果からファイル読込(tFileInputDelimited)の連携の方法を紹介 前回、Talendで簡単なジョブを作成しましたが、そのジョブに手を加え、変換処理を行うまでの手順を2回に分けて連載したい...
Tech & Science 2015.09.04 08:25 DB作成からデータインポートまで:Microsoft Azure SQL Data Warehouse を使ってみた(1) Azure SQL Data Warehouseのデータインポートには注意が必要 先日、Microsoft社から「Azure SQL Data Warehouse」のプレビュー版がリリースされました。システム構成と価格に対して、Amazo...
Tech & Science 2015.08.29 09:36 Amazon Redshiftへのデータインポートを2つのコンポーネントだけで行う ~TOSからAWSを操作~|Talend Open Studio によるビッグデータ分析(第7回) tRedshiftOutputBulkExecコンポーネントを使用すれば、Amazon Redshiftのインポート処理を一括で行える Amazon Redshift(以下、Redshift)は、ビッグデータに特化したDBとして広く知られ...
Tech & Science 2015.09.10 18:25 すばやい一時停止とパフォーマンス変更でコストを削減できる:Microsoft Azure SQL Data Warehouse を使ってみた(3) 検索が速いだけではない! Azure SQL DWの優れた機能をご紹介 前回は、Microsoft Azure SQL Data Warehouse(以下、Azure SQL DW)で13億件のデータを登録したテーブルに対して、検索と集計...
Tech & Science 2015.09.19 10:18 Talendがバッチ処理の開発方法を変える ~スマートな開発を行おう~|Talend Open Studio によるビッグデータ分析(第8回) Talendを使えば、バッチ開発者は"プログラム"ではなく"処理手順"に注力すればよい 今まで7回に渡って、Talendの使い方について解説を行ってきました。その中でTalendは、ETLツールとして、非常に簡単に、かつ、柔軟にETLジョ...
Tech & Science 2015.11.17 08:36 PolyBaseを使ったAzure SQL DWへの高速インポート ~Azure Storageにデータをアップロードする~:Microsoft Azure SQL Data Warehouse を使ってみた(4) PolyBaseの説明に入る前にインポートファイルを保存するAzure Storageを理解しよう 前回、Microsoft Azure SQL Data Warehouse(以下、SQL DW)に対して、BCPコマンドによるインポート操...
Tech & Science 2016.02.01 08:46 Azure SQL DWパフォーマンスチューニング(ハッシュ分散編):Microsoft Azure SQL Data Warehouse を使ってみた(7) 大量データのテーブル結合時はテーブル結合に最適な形に保存先を分散させることが重要 前回は、Azure SQL Data Warehouse(以下、SQL DW)のリソースクラスの変更により、並列処理ができるクエリーのパフォーマンスチューニ...
Tech & Science 2017.07.08 13:10 次のデータクレンジングのトレンドは”グリッドビュー”かもしれない ~ETLツールの新たなカタチを勝手に推測~ 先頭は Talend Data Preparation。それに追随する Google Cloud Dataprep と Tableau Project Maestro の登場でグリッドクレンジングツール戦線は激化する データ分析にとってデ...