Tech & Science 2018.01.30 22:33 Apache Airflow でタスクスケジューリングしてみた ~公式ドキュメントの読み解き方~ Airflow公式ドキュメントは難解。重要ポイントから先に読み解こう 前回、タスクスケジューラーの必要性とAirflowの概要やメリットについてご紹介しました。しかし、「とりあえず触ってみよう!」っと思ってもAirflow公式ドキュメント...
Tech & Science 2018.02.07 14:56 Apache Airflow でタスクスケジューリングしてみた ~タスク開発のポイント~ Airflowのタスク処理はPythonで開発すると便利 前回までは簡単なジョブ処理の作成・実行まででしたが、今回はちょっと応用編です。そのため、Pythonの基礎的なスキルが必要になりますが、Pythonを使うことで「やれること」も多くな...
Tech & Science 2018.02.24 13:36 Apache Airflow でタスクスケジューリングしてみた ~ログを退避させる~ 外部データベースに切り替えて負荷分散とリスク回避を行う 前回までは実際に開発した経験からAirflowのジョブ作成について説明しました。暫くしてから運用関係のご報告を...っと考えていたのですが、本番稼働してまだ1ヵ月ちょっとですが早くも...
Tech & Science 2020.02.10 09:06 Cloud Composer と GKE を活用して機械学習のワークフローを構築する GKE を効率的に使うために 弊社の機械学習基盤では、ワークフロー管理ツールとして Cloud Composer (Airflow) を利用しており、機械学習タスクは別の Google Kubernetes Engine (以下、 ...
Tech & Science 2020.04.13 08:07 機械学習基盤における Cloud Dataflow の活用 Cloud Dataflow の使い所 Cloud Dataflow は GCP で提供されているサービスの一つで、フルマネージドな環境で ETL 処理を実行することができます。バッチ処理とストリーミング処理を統一的に扱うことのでき...
Tech & Science 2013.11.25 13:00 PC上で数千万件データを手軽に扱える時代がやってきた|ギックスのビッグデータ分析体系 ① ギックスのビックデータ分析体系 ギックスはTeam CMOというサービスを提供しており、様々なお客様と顧客分析・会員分析を実施してきました。それらの経験の中から、以下の図で示すような独自の顧客データのビックデータ分析体系を持っています。こ...
Tech & Science 2014.01.31 09:00 ビッグデータ活用事例(3)情報共有による効率化/会社を強くするビッグデータ活用 この連載では「会社を強くする ビッグデータ活用入門 -基本知識から分析の実践まで-」で取り上げたビッグデータやアナリティクスの活用事例を抜粋し、ご紹介していきます。 書籍の中では大きく2つの場合で事例を区分しており、まずは4回に渡って...
Tech & Science 2014.06.16 09:08 Microsoft Power BI 導入レポート:本格導入① ~SQL Serverの構成を知ろう~ Power BI本格導入(=SQL Server 導入)してみよう Power BIの本格導入とは? これまで、Microsoft Office 365+Office 365 ProPlusをインストールするだけで使える『お手軽導入編』...
Biz 2020.06.09 08:32 お客様が”買いまわりたくなる”スタンプラリー「マイグル」 マイグルはお客様の”回遊”を促進するスタンプラリー・アプリケーションです。 英語で回遊を意味するmigrate(マイグレート)と、私(my)がグルグルとまわっていく様子をイメージして「マイグル」と名付けられました。 【...
Tech & Science 2021.12.08 09:10 Google Cloud と AWS の印象の違いについて雑感 この記事は GiXo アドベントカレンダー の 8 日目の記事です。昨日は、 データ受領で気を付けるポイント でした。 Data-Informed 事業本部 Technology Div. の川田です。私は今年 GiXo に中途入社...