Tech & Science 2014.03.02 10:58 ビックデータを全量分析できる時代になった|ビッグデータ分析の留意点① サンプル分析から全量分析へ 近代統計学の学問体系は、無限に近い大規模な母集団から無作為に抽出された、数百から数万のサンプルデータが持つ統計的な性質を中心に論じられてきました。たとえば、内閣府が行っている「社会意識に関する世論調査」では、1...
Tech & Science 2014.03.09 10:56 「確率がとても低い事象の分析」に全量データ分析は威力を発揮|ビッグデータ分析の留意点② 「ロングテール」に代表される確率が低い事象には全量データ分析 本日は、全量データ分析の優位性①にあたる、以下のポイントについて説明します。 優位性①:確率が低い事象を扱う場合に、サンプルデータでは得られない知見が得られるという点で、...
Tech & Science 2014.03.16 11:08 全量データで多重クロス集計を行い、擬似相関を見破り、交互作用を発見|ビッグデータ分析の留意点③ 本日は、全量分析の優位性②にあたる、以下のポイントについて説明します。 優位性②:性別、年齢、居住地、嗜好など、非常に多くの要素による多重クロス集計を行うことができる。 購買行動や意識などを分析する時、性・年代別ごとのクロス集計を取...
Tech & Science 2014.03.30 11:04 ビッグデータでは統計的検定は意味がない|ビッグデータ分析の留意点⑤ 統計的検定とは? (第2回)と(第3回)で全量分析の優位点について、(第4回)で全量データを分析する際の注意点①を紹介しました。本日は、2つ目の注意すべき点である以下について説明します・ 注意点②:標本統計を前提とした統計的検定は、ビッ...
Tech & Science 2013.12.02 13:00 CRISP-DMをマーケティング領域へ適用させる|ギックスのビッグデータ分析体系 ② ギックスの分析プロセス ギックスのビックデータ分析体系の第一回では、「ぜひ企画部の皆様にビックデータ分析をしてみてほしい。テクノロジーが進歩してそういう環境が整ってきています」というお話をしました。 今回、第二回は、具体的にどのよう...
Tech & Science 2013.12.30 13:05 もう一歩踏み込みたい方は「モデリング」を学ぼう|ギックスのビッグデータ分析体系 ⑥ 分析の花形のモデリング 前回の第5回までで、「ビジネスの理解」「データの準備・理解」「2次属性の作成」「セグメントの特徴把握」というビックデータ分析を試みる際に、まず実施すべき一連の流れをご紹介しました。ここまでのプロセスは数学的にみると...
Tech & Science 2014.06.18 12:04 Microsoft Power BI 導入レポート:本格導入③ ~クラウド環境へのSQL Serverのインストール/セットアップ~ Power BI本格導入(=SQL Server 導入)をしてみよう クラウド環境にSQL Serverを導入する 前回は、SQL Serverをオンプレ環境に構築する手順を紹介しましたが、今回はSQL Serverをクラウド環境(Mi...
Tech & Science 2014.08.07 09:02 「Tableau(タブロー)」を使ってみた|利用頻度の高いグラフ作成② ~累積日次数値の対前年同月比較 利用頻度の高いグラフを作成し、Tableauの操作チップスを紹介する こちらの記事でご紹介したとおり、Tableauは感覚的に操作でき試行錯誤しながらグラフを作れる、自由度の高いソフトです。ただ「試行錯誤でき自由度が高い」という優位性のト...
Tech & Science 2016.11.16 08:12 データベースを”倉庫”ではなく”道具”として使う発想 ~データベース上で分析データを下ごしらえする~ データベースの特性を活かすことで "誰でも"、"確実に" データ分析が行える データ分析 = データベース。こんな公式を書いて何の違和感もないほど、データベースは、データ分析のために「なくてはならない存在」です。まさに、両者は切っても切れ...
Tech & Science 2017.05.18 17:31 クラウドサーバーが、常にオンプレミスより優れているとは限らない ~スモールローカルサーバーという新たな選択肢~ クラウドサービスの空白地帯を考えたオンプレミスの導入 Amazon社がクラウドサービスの Amazon Web Services (通称、AWS)を公開して10年。新規システムならクラウドサービス内で作るのが当たり前となり、既存のオンプレ...