㈱ギックス MLOps Div. の経営課題解決アプローチ:如何にして機械学習を徹底活用するか
f t p h l
目指すのは、MLによる経営課題の解決
ギックスは、クライアントの経営課題を解決する企業です。それにより、クライアントの競争力を強化し、企業価値を増大させることを目指しています。
ギックスにとって、機械学習(Machine Learning = 以下、ML)は、経営課題解決のためのひとつの手段に過ぎません。
MLを手段であると捉えると、MLを自社の業務の中に適切に織り込んで、その力を十二分に発揮させることが極めて大切です。MLが、特定個人の能力に依存した職人芸のままにしておいては、ごく少数のクライアントにしか、その価値をご提供できません。MLを「組織の課題解決力」として構築することが求められます。
MLOpsチームの立ち上げ
そのため、9月よりMLOps Div.(エムエルオプス ディビジョン)を立ち上げ、本格的に「MLを業務に織り込む」活動を開始しました。従来より、機械学習に取り組んできたメンバーに加え、Kaggle Masterにも新たに参画いただいて、これまで以上にMLへの取り組みを加速させていきます。(2019年9月現在、ギックスには、Kaggle Master が2名在籍しています)
関連記事:MLOpsとは
ツールの活用
この取り組みの一環として、各種技術の取り込みにも積極的に取り組んでいます。先日、NEC社よりリリースのあったdotDataの導入に加え、2017年初頭より活用中のDataRobotや、それと並行して活用しているNative Pythonでのプログラミングを必要に応じて使い分けることで、より効率的に機械学習を実装・運用する体制を整えています。
機械学習におけるモデルづくりには、大きく分けて二つのアプローチがあります。すなわち、
- 仮説に基づいて適切な特徴量を探し当てる「人的探索型アプロ―チ」
- データ上に存在する項目を網羅的に組み合わせて使える特徴量をスコアリングする「機械的積み上げアプローチ」
です。
後者は、まさに「機械的に行う」ということですので、dotDataのようなツールが得意とするアプローチだと言えます。dotData導入前から、ギックスにおいてもPythonプログラミングによって同様のアプローチを実践していましたが、効率的に作業を進めるという意味では、ツール活用の意味がある領域だと言えます。
そうしたツール活用による効率向上を受けて、ギックスのデータサイエンティストは、ビジネスの実態とモデルの関係性を見極め、業務変革につなぐことに注力したり、あるいは、Pythonを用いて、仮説ベースの特徴量抽出に時間を費やしたりします。このように、ツールにできることはツールに任せ、人間がすべきことに人的リソースを投下することは、ギックスの掲げる「考える総量の最大化」につながっています。
dotData と DataRobot の使い分け
ギックスMLOps Dev.では、dotData と DataRobot という2種類のツールを活用しています。両社の使い分けのポイントは、大まかにいうと、両者の守備範囲の違いです。端的に言えば「広いdotData」と「深いDataRobot」の使い分けです。
dotDataは、上述した機械的アプローチによる特徴量抽出から学習・推論の一連のプロセスを一貫して実施します。つまり、守備範囲が広い、と言えます。データを投入すれば、MLに求められる一連の作業を半自動的に実施してくれますので、MLに関する知識が浅い人であっても最低限のアウトプットにたどりつくことができます。当該課題領域に機械学習が適するか否かの見極めや、初学者の教育目的などに活用可能性を感じています。
一方のDataRobotは、特徴量を作り出すというような使い方は想定されていません。学習と推論に特化していると捉えていただくと良いでしょう。(※実際には、分析の前処理機能も存在してはいます。)その際、特徴量の効き方に留まらず、複数の既知のモデルをどういう風に組み合わせたモデルが最も精度が出そうかなども教えてくれますので、人間によるモデルのチューニングを考える際の材料を多く提供してくれると言えるでしょう。
ギックスにおいては、どちらの場合も「ツールを回して、それで終了」ということはありません。ツールによって得られた特徴量やモデルをベースにして、データサイエンティスト/機械学習エンジニアによるPythonでのコーディングを行い、クライアントの様々な経営課題の解決に適するよう、ビジネス実態に最適なものを作り上げていきます。これらのツールは、我々に対して「インプットを提供してくれる」という位置づけになります。
MLOps Div. でクライアントに貢献しませんか?
ギックスでは、MLOps Div. チームの人材を募集しています。
一般的な事業会社におけるMLOpsは、特定の課題に対して、より精度の高いモデルを探す、もしくは、規定されたモデルを日々運用していく中で、その精度を上げていく、というところに重きが置かれがちだと我々は認識しています。(それが、まさにML+Operation ということです)
一方、ギックスのMLOps Div.のミッションは、クライアントのデータを用い、クライアントの課題を解決することですので、一度、機械学習業務の型、学習結果活用の型を作ればお役御免というわけにはいきません。性質や粒度の異なる新しいデータを日々受け入れ、前処理から特徴量やモデルの検討をクイックに行うことが求められます。
加えて、ギックスのクライアントは運輸、金融、飲料、機械製造、各業界のトップ企業ですので、取り扱う課題に関する先行事例が存在しません。様々な業種業態のクライアントにおいて、まだ誰も解決したことがない課題に対して機械学習を適用しようとすると・・・
・何を解こうとしているのか、を把握・理解する「ビジネス課題の理解力」
・その問題を解決に導くための「機械学習を用いた分析方針の策定力」
が求められます。
データサイエンティストやコンサルタント、あるいは、クライアントが求める分析結果や予測結果を、彼らの要望に応じて柔軟に出力していくという「業務」を、効率的且つ高精度に実現する必要があるのです。
- 機械学習というツールの使い方ではなく、そもそも「何を解決したいのか」 を考えなければならない
- 日々、刺激的で先進的な課題と向き合い続けなければならない
- 常に、新しい種類・形式のインプットデータを受け入れて、機械学習モデルに投入していかねばならない
- 今あるものを改善するのではなく、常に、新たな解決策を模索し続けなければならない
ギックスのMLOps Div.の仕事は、毎日、新たな挑戦をし続ける仕事です。そんなチャレンジングで刺激的なMLOps Divの一員として参画し、多様な課題、多様なデータを取り扱う「機械学習基盤」の開発・構築に取り組んでみませんか?
弊社のMLOps Div.への採用応募は下記「お問い合わせ」ボタンより、「採用に関して」を選んでご連絡ください。
f t p h l