Tech & Science 2014.12.22 08:55 第1回 マーケットバスケット分析とは?|POSデータでマーケットバスケット分析の実践 with R POSデータでマーケットバスケット分析をした結果を公開していきます 本連載では、4回にわたり、ある書店の実際のPOSデータをもとに、マーケットバスケット分析の事例をRで実装しながら紹介します。マーケットバスケット分析について紹介した本やW...
Tech & Science 2015.02.06 09:02 第4回・CSVファイル|CSV、XML、JSON…データフォーマットの変遷について考える フォーマット解説の第二弾はおなじみCSVフォーマットです 前回(第3回)は、各フォーマットを説明していく第一弾として「フラットフォーマット」について説明しました。今回は第二弾としてCSVフォーマットについて説明します。これまでの記事と同様...
Tech & Science 2015.04.17 09:15 文字コードや文字化けを理解しよう(その2)|いまさら訊けないビッグデータ分析 第2回は「文字化けあるある」です。 前回は文字コード関する基本的な知識をまとめてみました。第2回の今回は「じゃあ文字化けはどういった場合に起こるの?」という場面についてパターン分けして説明していきたいと思います。皆さんも心当たりがあったら...
Tech & Science 2015.04.03 09:08 カラムナー、キューブ、インメモリ…ビックデータ分析におけるデータベースのまとめ|いまさら訊けないビッグデータ分析 データベースの「タイプ」を知ってますか? こんにちは、ギックス技術チームの岩谷です。 先日とある方より「ビッグデータ分析処理で、Tableauはキューブを作成しないからシステムの運用がしやすいって聞いたんだけど、どういう事なのかな?...
Tech & Science 2015.07.25 10:04 フィルタリングと文字列置換とプログラムによる変換方法|Talend Open Studio によるビッグデータ分析(第5回) フィルタリング(tFilterRow)と文字列置換(tReplace)とプログラムによる変換(tMap)を紹介 前回、Talendでフォルダ検索を行い、フォルダ中のファイルを1つのファイルに追記する方法までのジョブを作成しました。また、コ...
Tech & Science 2016.05.05 19:24 TOSでギガ単位の適切なテストデータを作成する|Talend Open Studio によるビッグデータ分析(第11回) 手間がかかるテストデータもTOSを使えばノープログラミングで作成できる データ分析業務は、分析対象データが無いと始めることにはできません。しかし、提案段階でクライアントに分析結果イメージを提示する場合、または、分析対象データを受領してから...
Tech & Science 2017.06.19 08:43 ETL処理とELT処理の違い ~ビッグデータ処理の新トレンド~ ELT処理はクラウドデータベースだから可能になった荒業 皆さんは「ELT処理」をご存知でしょうか? 決して「Every Little Thing」ではありません。 ELT処理は、ETL(Extract/Transform/Load)...
Corporate 2020.12.06 07:39 Business Optimization Div. 紹介 この記事は GiXo アドベントカレンダー の 6 日目の記事です。昨日は、Connected Sheets を用いたビッグデータ分析(後編)でした。 Business Optimization Div. 所属の竹内です。本記事では...
Tech & Science 2020.12.15 08:58 TableauのLOD表現で注意すべきこと この記事は GiXo アドベントカレンダー の 15 日目の記事です。昨日は、トチカチを支える技術でした。 Design & Science Div.の松田です。本記事では、弊チームが利用しているBIツールの一つ「Table...
Tech & Science 2021.12.12 07:02 BigQueryスロット利用量の見積り この記事は GiXo アドベントカレンダー の 12 日目の記事です。昨日は、「プログラミング歴40年のおじさんが初めて本格的なPythonプログラム」を書いてみた でした。 本稿ではBigQueryにおいて計算...