AI > 
【第14回】生産性向上やマーケティングへの分析活用のポイント
【第14回】生産性向上やマーケティングへの分析活用のポイント
コラムイメージ
社内DXが進むことで業務活動の様々なデータが蓄積され、その分析結果等を利用した更なる業務効率化や売り上げ予測のモデル構築を図ろうとするケースが多くなりました。

そのような場面のデータ分析支援作業で出くわすことの多い、基本的ではありますが躓きがちなポイントについて紹介します。



 

蓄積するデータを考える

この分野では「Garbage In, Garbage Out」という格言があり、これは品質の悪い入力(データ)からは意味のない出力が生まれるという意味で述べられています。 AI技術というものは機械が良しなに判断を行ってくれるようなイメージを持たれることもありますが、そのためには判断に必要な材料を用意することが必要であり、データ内で各項目の関連性を見出せるようにしなければなりません。 商品の販売予測であれば、顧客の属性やその時々の条件などによって影響を受けることが多く、そのようなデータを保持しておくことが重要となりますが、このような情報を機械が解釈しやすい状態で与えることがポイントとなります。 よくある失敗例としてはデータの入力項目を自由記述欄として、入力者によって内容がバラバラになってしまうことがあります。 このようなデータでは機械的な分析を実施するだけでは傾向の抽出が困難であり、着目する内容の取捨選択等に人手での解釈を挟むための余計なコストが必要となってしまいます。
データが大規模であるほどそのコストは大きくなってしまうため、どのような情報をどのような形式で記録するかの設計が重要となります。
上記のような例では入力して欲しい内容をカテゴリカルな値として選択肢の中から選ぶ形式とするようなデータの整備に戻って分析することが必要となります。
ただし上記のような機械がデータを解釈するための形式が整っていたとしても、データ内に判断に必要となる情報が含まれているのかは別の問題としてあり、場合によってはその要因の仮説と検証を繰り返すことによってどのような情報が重要なのかを検討し、情報の再取得やデータの蓄積のやり直しが必要となるパターンも存在します。

機械の判断基準を知る

高精度な機械学習モデルというものはブラックボックス型のモデルが多く、人間がその判断ロジックを理解することが困難であるため、その出力を信頼する事の難しさが技術の導入を阻害することもあります。
例えば営業職で成績によるインセンティブの影響が大きい場合、有望な営業先を選定するためのターゲットリストを機械学習モデルで作成するようなケースではその解釈性が非常に重要になります。
そのターゲットリストを信用するための根拠が示される意義が大きいのは言うまでもありませんが、アプローチをかける際のヒントとなる情報を得るためにもそのような情報が求められます。
ただし、前述のように必ずしもモデルの解釈性は高いわけではなく、「Explainable AI」と呼ばれるモデルの出力結果からその判断で重要視された情報を逆算して抽出し、そのような解釈情報を与えるための技術も存在します。
数値的な精度だけでなくモデルの判断の妥当性を検討するためにも、その判断基準を知ることは重要であり、ホワイトボックス型のモデルを利用できないような場合には上記のような技術を併用することが重要となります。

1度実施したら終わりではない

データの分析や機械学習モデルの利用は一度実施したら終わりではなく一定期間ごとに繰り返す事が多くありますが、そのような際に気を付けなければならない点としてモデルの陳腐化です。
これらの出力はある時点でのデータを基に作成されたものであり、時間経過による傾向の変化に対応できないことが多くあります。
特に近年ではコロナ禍による大きなビジネスやライフスタイルへの変化に伴い、関連したデータの傾向への影響も大きくなっており、このような影響を無視して出力を使い続けてしまうとそのズレによって誤った判断を下す原因となってしまいます。
また、世情の変化だけでなく新商材をリリースした場合など、大きな変化点となることもあります。
ただし、上記のようなわかりやすい要因であれば考慮は容易となりますが、実際の現場では想定外の動きをすることもあり、陳腐化が発生していないかの確認としてモデルの精度検証やデータ分布の確認は継続的に行う必要があります。
分析やモデル構築は1度実施したら終わりではなく、その都度見直しとブラッシュアップが必要となります。

さいごに

上述のように、ここでは蓄積されたデータの分析利用において躓きがちなポイント紹介しました。
データ分析は人間の感覚だけでは得ることが困難な情報の取得が可能となるなど、得られるメリットが多く存在します。
その恩恵を適切に享受するためにも、これらのようなポイントに注意しデータを上手く活用していきましょう。

執筆者

コラムニスト写真

NTTアドバンステクノロジ株式会社
デジタルAI事業本部 アドバンスデータアナリシスビジネスユニット
山下 敦宏(やました あつひろ)

略歴
機械学習や統計処理を用いたシステムの開発や業務効率化に向けた各種データの分析作業を担当。

AIデータ分析コラム

このコラムは、NTT-ATのデータサイエンティストが、独自の視点で、AIデータ分析の技術、市場、時事解説等を記事にしたものです。
 

※本コラムの著作権は執筆担当者名の表示の有無にかかわらず当社に帰属しております。

ai_column_parts02.jpg 前のコラム    コラム一覧に戻る   次のコラム ai_column_parts01.jpg

 

AIデータ分析シリーズ

※DeAnoSは日本電信電話株式会社の登録商標です。
※当社とNTTコム オンライン・マーケティング・ソリューション(株)は、TIBCO Spotfireの販売契約を締結しています。
※TIBCOおよびSpotfireは、米国およびその他の国におけるCloud Software Group, Inc.およびその子会社の商標または登録商標です。

Twitterでシェア Facebookでシェア
当サイトでは、お客さまに最適なユーザー体験をご提供するためにCookieを使用しています。当サイトをご利用いただくことにより、お客さまがCookieの使用に同意されたものとみなします。詳細は、「プライバシーポリシー」をご確認ください。