決定木のCARTアルゴリズム|プロ野球データで決定木(Decision Tree) with R 第2回
プロ野球データで決定木を行った結果を公開していきます 本連載では、3回にわたり、プロ野球のデータで実際に決定木を行った事例を紹介していきます。第2回目の今回は、理論編として、決定木とは何かと、決定木の代表的なアルゴリズムであるCARTアル...
プロ野球データで決定木を行った結果を公開していきます 本連載では、3回にわたり、プロ野球のデータで実際に決定木を行った事例を紹介していきます。第2回目の今回は、理論編として、決定木とは何かと、決定木の代表的なアルゴリズムであるCARTアル...
はじめに 本連載は、連載シリーズ「プロ野球データでクロス集計 with Tableau」および、「プロ野球データでロジスティック回帰の実践 with R」の続編になります。 「データで楽しむプロ野球」さんにある、2014年のプロ野球の全打...
Power BIで実践するPOSデータの事業構造分析を公開 この連載では、2013年11月に弊社CEOの網野が出版した「会社を強くするビッグデータ分析」「Part2 分析の実践」の部分を「Power BIでPOSデータを使って事業構造分析...
まずはじめはフラットフォーマットから 本連載の第1回はデータフォーマットの変遷を考える上で取り上げるデータの概要を説明しました。また第2回(前回)は、テキストデータ処理を考える上で必要となる「データを処理する際の共通的な取り決め」について...
Power BIで実践するPOSデータの事業構造分析を公開 この連載では、2013年11月に弊社CEOの網野が出版した「会社を強くするビッグデータ分析」「Part2 分析の実践」の部分を「Power BIでPOSデータを使って事業構造分析...
Power BIで実践するPOSデータの事業構造分析を公開 この連載では、2013年11月に弊社CEOの網野が出版した「会社を強くするビッグデータ分析」「Part2 分析の実践」の部分を「Power BIでPOSデータを使って事業構造分析...
プロ野球データでロジスティック回帰分析を行った結果を公開します 本稿では、プロ野球の打席データで、実際にロジスティック回帰分析を行った事例を紹介します。具体的には、その打席が「安打」か「凡打」かの確率が、ボールカウント、ストライクカウント...
データ処理には共通的な取り決めがある 前回はデータフォーマットの変遷を振り返っていく上で、取り上げるデータの概要を説明しました。今回はそれらの変遷や特徴を考える上で前提として知っておいたほうがよい「データを処理する際の共通的な取り決め」に...
2014年のプロ野球全打席データをクロス集計していきます 2014年のプロ野球の打席データを全量(約6.6万件)手元に置き、さまざまな切り口でクロス集計して、プロ野球全体の打席の傾向を見ていく「プロ野球データでクロス集計 with Tab...
2014年のプロ野球全打席データをクロス集計していきます 2014年のプロ野球の打席データを全量(約6.6万件)手元に置き、さまざまな切り口でクロス集計して、プロ野球全体の打席の傾向を見ていく「プロ野球データでクロス集計 with Tab...