ビッグデータがここ数年注目を浴びています。ビッグデータを解析することで、これまでは経験や勘に基づいていたことが合理的に行えるようになると期待されているためです。ここでは、ビッグデータの定義や、ビッグデータと関連が深いデータマイニングについて簡単に説明し、ビッグデータの解析が社会におよぼす影響を考えてみましょう。そして、エッジコンピューティングとの関わりにも言及していきます。
ビッグデータとは?
ビッグデータとは何でしょうか。一般的には「大量でかつリアルタイムに発生する構造化または非構造化データを蓄積し、それを分析・処理するための技術の総称、あるいはそのデータそのもの」を意味します。
ここでいう構造化データとは、従来データベースで管理されていたデータのことで、いわゆる整理されたデータのことです。これに対して非構造化データとは、まだ整理されていない、いわゆる生データのことを指します。
ビッグデータ解析が登場する以前は、現場からの情報は人間によって分析され、それに基づいて企業の意思決定がなされていました。そこでは人間の持つ長年の経験や勘が必要になっていたわけです。しかし、近年では情報機器の発達によって現場から自動的に収集されるデータは量も種類も加速度的に増加しており、人間の負担が大きくなっています、また、分析に必要な経験や勘は一朝一夕には身につくものではありません。つまり、分析の元データは増えているのに十分な経験や勘を持つ人材は減ってきているのです。
そこで、データの分析や意思決定を支援するためにデータマイニングという技術が発達してきました。データマイニングは、データ間の相関を見いだし、大量のデータの中から有用な関係性を発見することを支援する技術で、ビッグデータ解析と切っても切れない関係にあります。言ってみれば、これまでの分析を導き出すために使われていた人間の勘や経験といったプロセスを代行して、意思決定を行うことを支援する技術なのです。
ビッグデータを解析するデータマイニングの考え方
ビッグデータを解析するためのデータマイニングについてもう少し見ていきましょう。一般的に、ビッグデータの解析は以下のモデル(DIKWモデル)に基づいて行われることが多いです。
「データ:Data」
これは、いわゆる収集されたままの生データのことです。構造化されていないデータともいえるでしょう。大きさはテラバイトからペタパイトであることが普通です。
「情報:Information」“
これは、生データを整理したもので、基本的にデータマイニングが支援できるのはこの段階です。構造化されたデータともいえるでしょう。
「知識:Knowledge」
情報から得られた傾向・知見のことを言います。近年のデータマイニングツールは人工知能や統計解析を使用して、この段階の知識化を支援するものも出てきています。
「知恵:Wisdom」」
知識から人間が判断することを指します。
ここで注意したいのは、データマイニングツールを使うとデータから情報を生み出せますが、情報から知識・知恵を生み出すのは最終的には人間の判断にかかっているということです。
現在の技術ではデータ同士の相関は求められますが、その相関結果から実際の現象を推測するのは人間が行う必要があります。これを行うのがデータサイエンティストと呼ばれる専門職ですが、大変難易度の高い仕事です。
なぜ難易度が高いかというと、データの解析のための知識(統計解析や人工知能など)に加えて、現在の市場のトレンドや、人間の行動・心理などに熟知している必要があるからです。さらに、そのような専門性の高い知識に加えて、データの相関から現象を推測する洞察力なども必要になります。専門性と幅広い分野への知見を両立させなければならない職業だといえるのです。そして、このような人材は一朝一夕では育成できず、人材が不足しています。ビッグデータ解析の現状での問題といえるでしょう。
一方、従来の人間の経験や勘だけに頼った分析では、分析を行う人間の思い込みによって重要な知識や知恵を見落とす可能性があります。データマイニングによる客観的なビッグデータ解析によって、今までの思い込みや常識が覆されるような知見が得られる場合も多くあります。これがビッグデータ解析の大きなメリットです。
ビッグデータ解析が社会に与えるインパクト
ここまでで述べたように、一見すると何の関係もないデータからも法則性を見いだすことができるため、ビッグデータ解析によって経験や勘による失敗を減らすことが可能です。あるいは、人間の勘や経験の客観的な裏付けができます。「おむつとビール」として有名な事例があるように、ビッグデータ解析の結果から販売施策の常識・思い込みが覆された例があります。データマイニングによって新しい知見を引き出すことで、営業やマーケティング戦略の見直しにも有効です。
物流分野では、製品やカートンなどにICタグを取り付けることでデータを収集し、ビッグデータ解析を行います。どの物流経路にどれくらい製品が集中しているかなどを分析することにより、物流経路の最適化を図ることができるのです。また、物流経路の最適化を図ることは、経費の削減と輸送時間の短縮につながります。
生産分野では、製品の検査データを収集して傾向を分析することで、製品の品質向上を図ることができます。また、生産ラインの要所にセンサーを設け、収集したタクトタイムをビッグデータ解析すれば、生産ライン全体のボトルネックを発見することも可能でしょう。製造装置にセンサーを取り付けて常時監視を行い、データを収集して解析すれば、故障の予知に生かすこともできます。
このように、ビッグデータ解析で新しい知見が得られることで、業務の効率化や最適化が図れるのが最大のメリットです。今後も問題の深刻化が見込まれている労働人口の減少や、働き方改革に対応しうる有力なひとつの手段といえるでしょう。
なお、物流分野や生産分野などでは、リアルタイムに大量のデータが発生することが多く、しかもそれぞれのラインを止めてデータを収集することが困難です。そこで、ラインを止めずにビッグデータ解析をリアルタイムで行う場合には、エッジコンピューティングによるエッジAIで実現するのが有効と考えられます。
ビッグデータの解析は社会をより有意義に
以上、ビッグデータについて簡単に説明しました。データサイエンティストが不足しているという問題はありますが、これからますますビッグデータ解析の必要性は増していきます。それに応じて、人工知能やエッジコンピューティングの助けを借りながら、ビッグデータ解析の技術はどんどん発展していくでしょう。そして、それが社会を少しずつ変えていくでしょう。人間にとって有意義な変化となることが期待されています。