Tech & Science 2014.03.02 10:58 ビックデータを全量分析できる時代になった|ビッグデータ分析の留意点① サンプル分析から全量分析へ 近代統計学の学問体系は、無限に近い大規模な母集団から無作為に抽出された、数百から数万のサンプルデータが持つ統計的な性質を中心に論じられてきました。たとえば、内閣府が行っている「社会意識に関する世論調査」では、1...
Tech & Science 2014.03.09 10:56 「確率がとても低い事象の分析」に全量データ分析は威力を発揮|ビッグデータ分析の留意点② 「ロングテール」に代表される確率が低い事象には全量データ分析 本日は、全量データ分析の優位性①にあたる、以下のポイントについて説明します。 優位性①:確率が低い事象を扱う場合に、サンプルデータでは得られない知見が得られるという点で、...
Tech & Science 2014.03.16 11:08 全量データで多重クロス集計を行い、擬似相関を見破り、交互作用を発見|ビッグデータ分析の留意点③ 本日は、全量分析の優位性②にあたる、以下のポイントについて説明します。 優位性②:性別、年齢、居住地、嗜好など、非常に多くの要素による多重クロス集計を行うことができる。 購買行動や意識などを分析する時、性・年代別ごとのクロス集計を取...
Tech & Science 2014.03.23 11:01 べき分布のデータには注意しよう|ビッグデータ分析の留意点④ 購買系のビッグデータには「べき分布」が多く注意が必要 (第2回)と(第3回)で全量分析の優位点について紹介しました。本日からは、全量データに注意すべき点を説明します。本日は注意点①の以下のポイントです。 注意点①:サンプルデータは中...
Tech & Science 2014.01.20 08:04 Quick Startのための分析インフラとは|ギックスのビッグデータ分析体系 ⑨ ビッグデータを分析するためのインフラ ここまで8回にわたってギックスのビッグデータ分析体系について説明してきました。今回が本連載の最終回となります。本日は「分析インフラ」についてご紹介します。ビックデータ分析体系の中では以下の赤枠の部分に...
Tech & Science 2014.04.10 12:19 Microsoft Power BI 活用レポート:Power Pivotを使ってみた② ~お手軽導入の”限界”~ 「お手軽導入」の限界を知ろう 前回は”Power Pivotがどれくらい早いか”の検証を行いました。Power BI for Office 365 + Office 365 ProPlusのお手軽導入版でも、速度的には、弊社が実施している...
Tech & Science 2014.05.14 08:55 回帰分析とその応用③ ~ロジスティック回帰分析 各種回帰分析の実施方法を解説 本連載では、回帰分析の実施方法について、5日間に渡り説明してまいります。第3回目の本日は、ロジスティック回帰分析の解説です。 ロジスティック回帰分析とは 第2回までは、被説明変数が、来店者数、ビール売上高...
Tech & Science 2014.07.23 08:52 ”R”で実践する統計分析|序:R(アール)とは?【外部寄稿】 Rの分析手法や使い方を連載形式でご紹介します(※外部寄稿) 本連載は、Yuu.Kimy氏にご寄稿頂いて、Rでの分析手法やその使い方について紹介していきます。初回である今記事は「Rの概要」について説明します。 「R(アール)」とは? 数...
Tech & Science 2015.06.17 14:58 「データレイク」のコンセプトを理解しよう|Treasure Data(トレジャーデータ)は、まさにデータレイクだ データレイクは登場したばかり。既存のサービスと比べて理解を深めよう! こんにちは、技術チームの岩谷です。前回、データレイクについての記事を執筆させていただきましたところ、何人かの方々から「それならデータレイクはトレジャーデータのソリューシ...
Tech & Science 2016.05.25 08:49 Redshiftのインポート/エクスポート権限をIAMロールに変更する|AWSを使い倒せ DBユーザーとIAMユーザーの権限を分けることでセキュリティ強化を行う AWSのビッグデータ用DBのAmazon Redshift(以下、Redshift)に大量データを登録する場合は、クラウドストレージのAmazon S3(以下、S3)...