Tech & Science 2015.11.04 08:24 データアレンジメントがビッグデータ時代の新潮流になる。|データクレンジングの限界を越えよう データを深掘るならデータアレンジメントのスキルが必要!! 「ビッグデータ」という言葉が一般的に使われるようになった近年、今まで分析できなかったデータウェアハウス(DWH)上の1TBを超えるような大量データもクラウドデータベースなどによって...
Tech & Science 2016.11.16 08:12 データベースを”倉庫”ではなく”道具”として使う発想 ~データベース上で分析データを下ごしらえする~ データベースの特性を活かすことで "誰でも"、"確実に" データ分析が行える データ分析 = データベース。こんな公式を書いて何の違和感もないほど、データベースは、データ分析のために「なくてはならない存在」です。まさに、両者は切っても切れ...
Tech & Science 2017.06.05 07:58 データレイクとクラウドサービス ~①データレイクの今までをおさらい~ データレイクはビッグデータ分析とともに常に進化している ちょうど2年前。弊社ブログで「データレイク(Data Lake)」について取り上げさせていただきました。その当時「データレイク」という言葉だけが先行し、何を使えばよいか、どんな場面で...
Tech & Science 2017.06.12 08:35 データレイクとクラウドサービス ~②クラウドサービスが支えるこれからのデータレイク~ クラウドサービス進化によってデータレイクの運命が決まる 前回、データレイクとはどういうものか、データベースと何が違うかについて触れました。今回はクラウドサービスがデータレイクにどの様に影響しているか、そして、今後、データレイクはどの様に変...
Tech & Science 2013.12.02 13:00 CRISP-DMをマーケティング領域へ適用させる|ギックスのビッグデータ分析体系 ② ギックスの分析プロセス ギックスのビックデータ分析体系の第一回では、「ぜひ企画部の皆様にビックデータ分析をしてみてほしい。テクノロジーが進歩してそういう環境が整ってきています」というお話をしました。 今回、第二回は、具体的にどのよう...
Tech & Science 2013.12.30 13:05 もう一歩踏み込みたい方は「モデリング」を学ぼう|ギックスのビッグデータ分析体系 ⑥ 分析の花形のモデリング 前回の第5回までで、「ビジネスの理解」「データの準備・理解」「2次属性の作成」「セグメントの特徴把握」というビックデータ分析を試みる際に、まず実施すべき一連の流れをご紹介しました。ここまでのプロセスは数学的にみると...
Tech & Science 2014.06.17 12:01 Microsoft Power BI 導入レポート:本格導入② ~オンプレミス環境へのSQL Serverのインストール/セットアップ~ Power BI本格導入(=SQL Server 導入)してみよう オンプレ環境にSQL Serverを導入する 前回はSQL Serverの構成について紹介しました。複雑なシステムでしたが、導入前に知っておくべきポイントは、「①RDB...
Tech & Science 2014.07.30 09:08 ”R”で実践する統計分析|回帰分析編:①単回帰分析【外部寄稿】 Rによる回帰分析の実施手順を紹介 本日からRの使い方の実践として、「回帰分析」について紹介していきます。なお、回帰分析の理論については、こちらの特集内の【寄稿】回帰分析とその応用を参照ください。 『”R”で実践する統計分析|回帰分析...
Tech & Science 2015.02.13 13:10 第5回・XMLファイル|CSV、XML、JSON…データフォーマットの変遷について考える フォーマット解説の第三弾はXMLフォーマットです 前回(第4回)は、各フォーマットを説明していく第二弾としてみなさんもよくご存知のCSVフォーマットについて説明しました。今回は第三弾としてXMLフォーマットについて説明します。XMLはイン...
Tech & Science 2017.04.24 15:26 Amazon Redshift Spectrum を使ってみた ~Redshift Spectrum は Redshift のデータレイクの入り口になる~ Amazon Redshift Spectrum によってデータ分析の業務フローが変わる 先日、サンフランシスコで開催された AWS Summit 2017(2017.4.18 - 19)で Amazon Redshift(以下、Reds...