ビッグデータ活用の可能性とメリット、セキュリティ面における注意点

データ保護データ管理・活用 2020.12.28
ビッグデータ活用の可能性とメリット、セキュリティ面における注意点

近年ビッグデータの重要性が様々なシーンで語られるようになりましたが、その定義は曖昧で、既存のデータ活用とどう違うのかわからない方もいるでしょう。ビッグデータとは具体的にどのようなデータを指しており、ビジネスにどのような好影響をもたらすのでしょうか。

ここでは、ビッグデータの概要と重要性、ビッグデータを活用するメリットについて説明します。また、合わせてビッグデータを扱う際の危険性についても解説しますので、すでにビッグデータの活用を検討している場合にもぜひ参考にしてください。

1. ビッグデータとは?

総務省が公表する情報通信白書では、ビッグデータは以下のように定義されています。

デジタル化の更なる進展やネットワークの高度化、またスマートフォンやセンサー等IoT関連機器の小型化・低コスト化によるIoTの進展により、スマートフォン等を通じた位置情報や行動履歴、インターネットやテレビでの視聴・消費行動等に関する情報、また小型化したセンサー等から得られる膨大なデータ

引用:総務省「平成29年版 情報通信白書」

一般的に使用されるビッグデータの定義も、おおむね「デジタル技術の普及により扱えるようになったデータ群」とされるため、本記事ではビッグデータを巨大なデータ群と定義して説明を進めていきます。

なお、巨大なデータ群としてのビッグデータがどのような情報の集合体なのか、より具体的な理解を深めるにあたっては以下の表をご参照ください。

データの種別

(データ生成の主体)

データの概要

オープンデータ

(政府)

政府や地方公共団体が保有する、オープン化が推進されている公共情報

ノウハウを構造化したデータ

(企業)

農業やインフラ管理からビジネス等にまつわる事業者が保有する産業データ

M2Mデータ

(企業)

機器間の通信(M2M)により出力された産業データ

パーソナルデータ

(個人)

個人の属性・行動・購買にまつわる情報、および特定の個人を識別できないよう加工された人流・商品情報などのデータ

参考:総務省「平成29年版 情報通信白書」

2. ビッグデータが注目される背景

かつては、膨大な情報量を持ったデータ群であるビッグデータを低コストかつスピーディーに処理しビジネスに活用する術がほとんどありませんでした。

顧客・業務にまつわる情報など、企業が管理している構造化されたデータとは違い、ビッグデータはソーシャルネットワークやWebアプリケーションから収集した「多種多様な構造化されていないデータ」が大部分を占めるからです。

それが一転し、技術の発展によってサイズの大きいデータの処理が可能となり、構造化されていない膨大なデータから新たな傾向・規則性を発見できるようになりました。データ活用を支える情報技術の高度化、低コスト化が契機になったのです。

このほか、SNSの普及により流通データ量が増加したこと、国・自治体が誰でも利用可能な官民データである「オープンデータ」の公開を始めたことも、ビッグデータ活用を後押ししています。

3. ビッグデータの活用によるメリット

技術の発展により広範囲かつ多量のデータを扱えるようになったため、未活用だったデータ同士から新たな規則性や相関関係を見出すことが可能となりました。これにより、従来の小規模なデータでは捉えられなかったファクト(事実)をビジネスの意思決定の材料として獲得できるようになってきました。

さらにそのファクトは、従来以上に深い顧客理解へつなげたり、新たな潜在ニーズの発掘によりビジネスモデルのヒントを得たりなど、事業を強化するうえでも良い影響をもたらします。具体的には「より顧客へマッチする商品・サービス」の開発が可能となるのです。

ビッグデータの活用によって高度な分析が可能となる理由は、ビッグデータが持つ「3V」と呼ばれる特性が関係しています。

ビッグデータの3V

概要

Volume(量)

多量のデータを持っている

Variety(多様性)

さまざまな種類のデータを持っている

Velocity(速度)

データの生成・更新頻度が高く、凄まじい速度で情報を生み出している

ビッグデータはただ数量が多いだけのデータ群ではありません。あらゆる場所やデバイスから生成される多様性を持った情報の集合であり、毎秒凄まじいスピードで新たな情報を生み出しています。これらの点が、従来活用していたデータでは見つけられなかった「新たな規則性」の発見を可能としているのです。

なお、場面によってビッグデータの特性は、Value(価値)を加えて4V、さらにVeracity(情報の正確性)を加えて5Vと呼ばれることもあります。

4. ビッグデータ活用に潜む危険性

ビッグデータの活用は今後その発展が大いに期待される取り組みの一つですが、以下のような危険性が潜んでいることも念頭に置いておくべきです。

  • 個人データの取り扱いによるプライバシー問題への発展
  • ビッグデータの過信による視野の狭小化
  • ビッグデータ活用における未知の脅威

ビッグデータは様々なデータの集まりであるため、個人にまつわるデータも多く含まれます。その中には、単体では個人の詳細まで識別できなかったとしても他の情報と照合することで個人の識別が可能となるかもしれないデータが存在します。これらは個人の許可なく第三者に譲渡したり、公開したりするとプライバシー侵害につながる危険性があります。

またビッグデータは、過去にデータとして現れていて、抽出できたものの集合体です。例えば顧客データは、自社の顧客のデータであって、他社の顧客の特徴を示すものではありません。新規顧客に自社を知ってもらうおうとした際に、いまあるデータに基づいて広告の企画をしてもニーズを捉えそこねて不振に終わる可能性も考えられます。

また長期的に正しい広報戦略を実施しているにも関わらず経理データに現れていないために施策を中断、同様の施策を続けたライバル企業の事業が大きくなる、というケースも考えられます。経験や勘から生まれる閃きが失われる懸念もあるのです。データになっていないものは何か、考えるクセをつけるとよいでしょう。

そして、本格的なビッグデータの活用はまだ始まったばかりであり、運用に伴ってどのようなリスクが生じるのか分からない側面もあります。知らない間にプライバシーを侵害したり、新たなセキュリティリスクが顕在化したり、予期しない問題に遭遇する可能性も念頭に置いておくべきでしょう。

5. まとめ

ビッグデータは量・多様性・速度の面で既存のデータを圧倒しており、これまで発見できなかった規則性や傾向を見出すためのカギになり得る存在です。ただし、ビッグデータはあらゆる問題をすぐに解決する「魔法」ではないことも知っておかなければなりません。従来のデータ活用と同じく、そこには地道な仮説検証や試行錯誤が求められます。

記事後半に解説した「プライバシー問題・ビッグデータの過信・未知の脅威」にも十分に注意しつつ、トラブルのないビッグデータの活用法を検討してみましょう。