〈データと情報 ✕ ITエンジニア〉データ(data)と 情報(Information)の 違いを理解する | エンジニアワークス

データ(data)と情報(Information)の違いを理解する





東西冷戦下にあった1969年の米国で、軍事利用を目的として誕生したネットワーク「ARPANet」が、インターネット」の始まりといわれていますが、ARPANetとは、米国国防総省高等研究計画局(ARPA)の指揮の下、パケット交換方式による調査・研究用のコンピュータ・ネットワークのことを指します。

そもそもの目的が“軍事”だったことから、一般の人に「インターネット」が広く認知されるまでには、それから20年以上の歳月がかかることになります。世界中の人々が「インターネット」を身近に感じることになった契機は、世界各国で争奪戦が起きた「Windows95」の発売といわれ、この爆発的勢いで世界を熱狂させた出来事を境に時代はアナログからデジタルへと一気に装いを変え、インターネットは広く普及していくことに。

「Windows95」の発売からもうすぐ30年……。デジタルカラー一色に染まった現在は、1995年当時に想像ができなかったほど一人1台の携帯電話を持ち、デジタルの恩恵に授かっています。そこで今回は、身近だけど普段あまり意識することがない〈データと情報〉をテーマに、データ収集(統計学)の歴史から、「データ」と「情報」の違い、「データ」と「情報」の関係性などを解説します。

データ収集や統計学は、いつ始まった?


アナログ時代のデータ収集(調査)の歴史をたどるとその歴史は予想外に古く、日本でデータ収集が始まったのは大化の改新(645年)といわれています。国家の繁栄維持や徴兵に備えて6年に一度全国で行われた戸籍調査は、その後360年続いたと伝えられています。

さらに、世界で収集データを活用する統計学が誕生したのは、古代ローマ帝国時代だったそう。紀元前753年に建国され、紀元後1453年までの約2200年にわたって栄華をきわめた古代ローマ帝国は、広大なエリアを属州として統治していたため、国家という“集まり”を数理分析するため人口調査を行う必要があったと考えられていて、それを裏づける史料も発見されています。

ローマ帝国は、子どもの数、男女比率を把握する市民登録や、財産・所得の評価、徴兵、徴税等の項目にそって調査を行い、調査に従事する専門官の名称がラテン語でセンサー(Censere)と呼ばれていました。これが転じて「人口調査」を表す「センサス(Census)」になったとされ、ローマ帝国が基礎を作った「センサス」は17世紀に入って近代センサスと継承され、米国で1790年に初めて国勢調査が実施されることになります。

センサスの語源をたどると古代ローマまで遡ることがわかりましたが、日本の国勢調査もローマ帝国で行われた調査を原型としていて、総務省統計局は国勢調査を「人口センサス(Population Census)」と呼んでいます。



デジタル社会に突入して、わずか30年ほどなのに……


ローマ帝国から始まったデータの収集方法を土台に、20世紀終盤までは情報伝達の手段は「手書き」か「印刷」かのアナログ方法しか存在しませんでした。このアナログ方法に基づき、有名人が取り交わした日記や書簡、メモ、瓦版(新聞)医療記録、法律文書などの膨大な史料が、21世紀までの悠久の年月のなかで積み上げられてきたのです。

そして時代は変わり、21世紀の幕開けとともに世界はデジタル社会へと一変します。こうして考えると、デジタル社会が本格的にスタートしてからたったの30年ほどしか経っていないことになりますが、実はローマ帝国以降に積み上げられた世界中のデータ(史料)の量を、デジタルデータの量が一気に超えてしまったといわれているのです。今後もこのスピードでデジタルデータが増大し続ければ、人間が処理できないほどのデータ量になるといわれているのです。





“データ”と“情報”の違い、端的に答えられますか?


「データ」と「情報」はどちらも手にとって形や重さを確認できないため実体がつかみづらいのですが、実は「データ」と「情報」は厳密に意味が違うのです。みなさんは、その違いを端的に答えられるでしょうか?

【データ】
一定の形式で収集した数字、数値、記号で表される数字の羅列。
また、一定の形式によって事実を集積・統計したもの。

【情  報】
集積・統計されたデータを考察・検証することで、
数字の羅列であるデータに、価値やアクション性を与えたもの。



データ → 情報 → 知識 → 知恵 → 洞察


さらに、数字、数値、記号を羅列したデータは、以下の順で価値が上昇します。データ解析や統計では①②③④⑤のプロセスを踏みながら、データが指し示す本質や規則性を見抜き、そこから役立つ形に整えながら、実効性のあるアクショやプランを描いていくために用いられます。

プロセス① データ(Data)   ベースになる数字、数値、記号で表される数字の羅列
プロセス② 情 報(Information) データを分類・集計・分析・考察・検証したもの
プロセス③ 知 識(Knowledge)  複数の情報を統合し、情報の規則性を体系化したもの
プロセス④ 知 恵(Wisdom)     情報が示す真実や本質を理解し、役立つ形に統合・構築したもの
プロセス⑤ 洞 察(Insight)   情報に方向性を与え、全体像を明確に示したもの



日本の出生数から見る“データ”と“情報”


さらに「データ」と「情報」の違いを、わかりやすく例えましょう。厚生労働省が実施する「人口動態統計」によってまとめられた「出生数と合計特殊出生率」の推移は、下グラフのようになり、このグラフを構成する統計値(数値)がデータです。そして、このデータからはさまざまな特長や傾向を読み取ることができます。





【過去データからの集計・分類】


●1947(昭和22)年は、269万6638人の最高出生数を記録し、合計特殊出生率は4.32%になった
●1947年以降は少子化の流れが続くが、第一次ベビーブームで産まれた子どもが結婚・出産を迎え、第二次ベビーブームが起きた
●第二次ベビーブームの1974(昭和49)年までは、合計特殊出生率が2.0を上まわっていたが、第二次ベビーブーム以降に出生数が継続的に減少
●1966(昭和41)年に出生数が大きく減少した理由は、60年に一度の「ひのえうま年」の迷信により、出産を避ける女性が増えたことによる



【過去のデータ集計・分析から顕在化した問題】


●2020年を起点に、第一次ヘビーブームに生まれた団塊の世代3000万人超が、75歳(後期高齢者)にさしかかる
●団塊の世代が75歳を迎えることで、医療・福祉、年金などの社会保障費負担増、働き手不足などの問題が社会問題となり、これらを総じて「2025年問題」と呼ぶ
●現在アラフィフの団塊ジュニアと呼ばれる第二次ベビーブーム世代が、10年後に大量退職の時期を入る
●平均寿命が伸びたことによる超高齢化、あらゆる業種での人手不足などにより、社会保障制度の継続が危ぶまれる状態に陥る。これらを総じて「2040年問題」と呼ぶ



【過去のデータ集計から分析される、今後起こり得る問題】


●このまま出生数が減少し、少子化の流れが止まらない場合は、2040年には74万人となり、合計特殊出生率も1.43%まで下まわると推定
●今後の少子化傾向が続けば、数理学的に2060年には人口が約8700万人まで減少すると見込まれている
●同じく、2100年には日本の総人口は5000万人弱まで減少し、 明治末頃の人口規模になるとの予測も
●1966年と比べて干支(えと)を信じない世代が増えたが、次のひのえうま年は2026年になるため、何らかの対策を講じることが必要である





【情報が示す真実や本質を理解し、次のアクションに】


出生数の統計(= データ)を解析することによって、さまざまな「情報」を読み取ることができますが、こうした情報をもとに国は、福祉・医療・年金等の社会保障や、中長期での国づくりなどの対策や方針を打ち出しています。

情報が示す真実や本質を理解することによって、時には最悪の事態や、起こりうる確率の高い危機の想定も求められ、前述した日本の出生数のデータを例にとると、日本の人口減少(出生率低下)に歯止めがかからなかった場合は次のようなリスクの連鎖が想定されます。



【このまま、日本の人口減少(出生率低下)が続いた場合】


↓ 明治末頃の人口規模へと日本社会が縮小する
↓ 年金・保険などの社会保障制度が破綻する
↓ 高齢化率40%の「年老いた国」になる
↓ 生産年齢層(労働人口)が急激に減少する
↓ 働き手がいなくなる
↓ 財政・経済が破綻する
国家存亡の危機にさらされる


出生数の統計(= データ)から“情報”を読み解いた岸田首相は、2023年1月の年頭会見で“異次元”の少子化対策を表明しましたが、上記のリスクの連鎖の先に見えるのが「国家が存亡」であったからこそ、“異次元”という強い形容詞を用いた少子化対策には、国と国民が一丸となって国家の存亡の危機を回避しなくてはならない……という強い意志が現れていたといえます。





中小企業の約半数が、データを活用できていない?


自社で収集したデータを分析し、「経営企画」「組織改革」「製品・サービスの企画、開発」「マーケティング」などに生かしているケースを考えると、大企業では約90%がデータを有効活用できているといわれていますが、一方の中小企業となると、約半数がデータを活用できていないことが明らかになっています。

もし、現在のように日本の98%を占める中小・零細企業がデータを有効活用できない状態が続けば、日本の産業界の大きな問題である「生産年齢層(労働人口)の減少」「人手不足が顕著になる」点から、後継者・人材が確保できず、事業を継続することが困難になる企業が続出するとも懸念されているのです。

そうした事態を避けるためには、経営者や管理職に限らず、ビジネスパーソン一人ひとりに「データリテラシー(データの読み書き能力)」が必須とされますし、データをもとに行った分析によって会社の方向性や次のアクションを決定していく必要があります。

○○のデータの集合体から、最も注目すべきデータはどれか
○○のデータから、新製品の発売時期はいつにすべきか
○○のデータから、営業アプローチをどう改善すべきか
○○のデータから、どの時期に、どの商品の売上が伸びているか
○○のデータから、在庫量をはけるための販促を、どのタイミングで実施するか…… 





時代が要請するデータと情報のエキスパート・ITエンジニアの育成


長年経営に携わってきたオーナー独自の勘や手腕による経営では、これからの時代を勝ち抜くことは難しいため、日々取り扱うさまざまなデータから、従業員一人ひとりが当事者意識を持って分析できる環境を整えるため、「データと情報」に関するデジタルリテラシーを高めることが非常に重要です。その領域のエキスパートであるデータと情報技術に精通したITエンジニアの育成は時代の要請ともいえるでしょう。

——かつて、経営リソースは「ヒト」「カネ」「モノ」の3資源といわれていましたが、2000年以降にこの3つに「情報」と「時間」を加わる考え方が一般的になりました。
さらに今後は、データ分析をもとに得た「情報」なくして、「ヒト」「カネ」「モノ」「時間」の経営資源は最適化されず、企業存続が危うい状況に陥るリスクが高まると考えてよいかもしれません。

加えて「時間」そのものへの概念が変わり、10の尺度をひとつのプロセスとしていた時間のあり方が、現在は2〜3へと尺度のとらえ方が短くなったからこそ、スピード重視の時代により大きな価値を持つのが「データ」と「情報」である、と考えることができるのではないでしょうか。



日総工産ではITエンジニアのお仕事も多数掲載中!
「新たな技術フィールドで活躍したい」、「自らの可能性をもっと追求したい」、「エンジニアとしてキャリアアップを図りたい」と考えている皆さんを、全力でサポートいたします。詳しくは「エンジニアワークス」をご覧ください。

お問い合わせ

採用に関するご相談など、お気軽にお問合わせください。
受付は平日朝9時より18時までとなります。
平日18時以降、土日祝日のお問合わせは翌営業日以降にご対応致します。

engineer works(エンジニアワークス)は、日総工産のエンジニア採用ページです。日総工産には「未経験の方」も「経験を活かしたい方」も、エンジニアとして活躍できる場があります。