Column

コラム

AIデータ分析コラム【14】生産性向上やマーケティングへの分析活用のポイント

2024.02.06

社内DXが進むことで業務活動の様々なデータが蓄積され、その分析結果等を利用した更なる業務効率化や売り上げ予測のモデル構築を図ろうとするケースが多くなりました。

そのような場面のデータ分析支援作業で出くわすことの多い、基本的ではありますが躓きがちなポイントについて紹介します。

蓄積するデータを考える

この分野では「Garbage In, Garbage Out」という格言があり、これは品質の悪い入力(データ)からは意味のない出力が生まれるという意味で述べられています。 AI技術というものは機械が良しなに判断を行ってくれるようなイメージを持たれることもありますが、そのためには判断に必要な材料を用意することが必要であり、データ内で各項目の関連性を見出せるようにしなければなりません。 商品の販売予測であれば、顧客の属性やその時々の条件などによって影響を受けることが多く、そのようなデータを保持しておくことが重要となりますが、このような情報を機械が解釈しやすい状態で与えることがポイントとなります。 よくある失敗例としてはデータの入力項目を自由記述欄として、入力者によって内容がバラバラになってしまうことがあります。 このようなデータでは機械的な分析を実施するだけでは傾向の抽出が困難であり、着目する内容の取捨選択等に人手での解釈を挟むための余計なコストが必要となってしまいます。
データが大規模であるほどそのコストは大きくなってしまうため、どのような情報をどのような形式で記録するかの設計が重要となります。
上記のような例では入力して欲しい内容をカテゴリカルな値として選択肢の中から選ぶ形式とするようなデータの整備に戻って分析することが必要となります。
ただし上記のような機械がデータを解釈するための形式が整っていたとしても、データ内に判断に必要となる情報が含まれているのかは別の問題としてあり、場合によってはその要因の仮説と検証を繰り返すことによってどのような情報が重要なのかを検討し、情報の再取得やデータの蓄積のやり直しが必要となるパターンも存在します。

機械の判断基準を知る

高精度な機械学習モデルというものはブラックボックス型のモデルが多く、人間がその判断ロジックを理解することが困難であるため、その出力を信頼する事の難しさが技術の導入を阻害することもあります。
例えば営業職で成績によるインセンティブの影響が大きい場合、有望な営業先を選定するためのターゲットリストを機械学習モデルで作成するようなケースではその解釈性が非常に重要になります。
そのターゲットリストを信用するための根拠が示される意義が大きいのは言うまでもありませんが、アプローチをかける際のヒントとなる情報を得るためにもそのような情報が求められます。
ただし、前述のように必ずしもモデルの解釈性は高いわけではなく、「Explainable AI」と呼ばれるモデルの出力結果からその判断で重要視された情報を逆算して抽出し、そのような解釈情報を与えるための技術も存在します。
数値的な精度だけでなくモデルの判断の妥当性を検討するためにも、その判断基準を知ることは重要であり、ホワイトボックス型のモデルを利用できないような場合には上記のような技術を併用することが重要となります。

1度実施したら終わりではない

データの分析や機械学習モデルの利用は一度実施したら終わりではなく一定期間ごとに繰り返す事が多くありますが、そのような際に気を付けなければならない点としてモデルの陳腐化です。
これらの出力はある時点でのデータを基に作成されたものであり、時間経過による傾向の変化に対応できないことが多くあります。
特に近年ではコロナ禍による大きなビジネスやライフスタイルへの変化に伴い、関連したデータの傾向への影響も大きくなっており、このような影響を無視して出力を使い続けてしまうとそのズレによって誤った判断を下す原因となってしまいます。
また、世情の変化だけでなく新商材をリリースした場合など、大きな変化点となることもあります。
ただし、上記のようなわかりやすい要因であれば考慮は容易となりますが、実際の現場では想定外の動きをすることもあり、陳腐化が発生していないかの確認としてモデルの精度検証やデータ分布の確認は継続的に行う必要があります。
分析やモデル構築は1度実施したら終わりではなく、その都度見直しとブラッシュアップが必要となります。

さいごに

上述のように、ここでは蓄積されたデータの分析利用において躓きがちなポイント紹介しました。
データ分析は人間の感覚だけでは得ることが困難な情報の取得が可能となるなど、得られるメリットが多く存在します。
その恩恵を適切に享受するためにも、これらのようなポイントに注意しデータを上手く活用していきましょう。

DeAnoSは日本電信電話株式会社の登録商標です。

当社とNTTコム オンライン・マーケティング・ソリューション(株)は、Spotfireの販売契約を締結しています。

TIBCO、Spotfireは、Cloud Software Group, Inc.の商標または登録商標です。

執筆者

山下 敦宏(やました あつひろ)

NTTアドバンステクノロジ株式会社
デジタルAI事業本部 アドバンスデータアナリシスビジネスユニット

機械学習や統計処理を用いたシステムの開発や業務効率化に向けた各種データの分析作業を担当。
現職では、AIを活用したデータ分析のビジネス展開に従事。

お問い合わせ

AIデータ分析コラム

このコラムは、NTT-ATのデータサイエンティストが、独自の視点で、AIデータ分析の技術、市場、時事解説等を記事にしたものです。

本コラムの著作権は執筆担当者名の表示の有無にかかわらず当社に帰属しております。

Column 関連コラム

Products & Services 関連する商品・サービス

ナレッジ駆動型システム運用自動化ソリューション
  • 商品・サービス

ナレッジ駆動型システム運用自動化ソリューション

ナレッジ×生成AIによる障害対応の迅速化支援

  • DX
  • AI
AIデータ分析コンサルティングサービス
  • 商品・サービス

AIデータ分析コンサルティングサービス

AI技術を用いたデータ活用で、適切な現状把握やビジネス予測、意思決定をサポート

  • AI
Spotfire
  • 商品・サービス

Spotfire

製造業における国内BIシェア3年連続No.1!直感的で多彩な機能により初心者もデータサイエンティストも業務効率アップ、発見と納得を即共有できるプラットフォーム

  • AI
AI異常予兆検知ソリューション @DeAnoS
  • 商品・サービス

AI異常予兆検知ソリューション @DeAnoS

事前に異常を検知し、トラブルを速やかに回避

  • ネットワーク運用
  • AI
操業データ分析ソリューション
  • 商品・サービス

操業データ分析ソリューション

AIデータ分析で製造プロセスの最適化を実現!

  • AI
需要予測ソリューション
  • 商品・サービス

需要予測ソリューション

オーダーメイドの需要予測モデルを構築し、実績データにもとづくデータ駆動型経営へ

  • AI
電力使用量の見える化・需要予測ソリューション
  • 商品・サービス

電力使用量の見える化・需要予測ソリューション

電力使用量の見える化および予測技術を活用した電力使用の適正化でコストの削減とSDGsへ貢献しませんか?

  • AI
顧客行動分析ソリューション
  • 商品・サービス

顧客行動分析ソリューション

データドリブンマーケティングで成長戦略を

  • AI
Spotfire® Data Science
  • 商品・サービス

Spotfire® Data Science

大量かつ複雑なデータ分析・機械学習を実現する企業のデータサイエンスプラットフォーム

  • AI
Spotfire® Streaming
  • 商品・サービス

Spotfire® Streaming

ストリームエンジンがリアルタイムの分析を実現するプラットフォーム。
計測データが出力された時点で即時に分析。

  • AI
TIBCO® Data Virtualization
  • 商品・サービス

TIBCO® Data Virtualization

セキュアにすべてのデータにアクセスできるデータ仮想化基盤「TIBCO® Data Virtualization」なら、データソースのサイロ化には悩まない。

  • AI
当サイトでは、お客さまに最適なユーザー体験をご提供するためにCookieを使用しています。当サイトをご利用いただくことにより、お客さまがCookieの使用に同意されたものとみなします。詳細は、「プライバシーポリシー」をご確認ください。