「構造化データ」とは|テクスタ辞書


前文
構造化データ(英語表記:Structured Data)とは、データベースに格納できるタイプのデータのことで、その名が示す通り、構造化されたデータです。これに対して、データベースに格納できないタイプのデータを非構造化データと言います。構造化されていないデータである非構造化データには、多種多様なタイプのデータがあり、量も膨大です。
従来、コンピュータ上のデータベースで扱われてきたデータの大部分が構造化データと非構造化データに分類されてきました。

構造化データと非構造化データの違い
構造化データは、汎用データベースシステムを利用すると簡単に整理することができます。たとえば、顧客データや売上データ、経理データ、在庫データ、購買データなどが構造化データに該当します。
一方、非構造化データは構造化データと比べると整理しにくい性質のデータです。一般によく使われる文書、メール、写真、画像をはじめ、ラジオ、テレビ、新聞、書物、音声などが、非構造化データにあたります。

構造化データとビッグデータについて
インターネットの普及、コンピュータの性能や無線通信技術の向上、多種多様なデバイスの普及によって、データは日々増え続け、現在では膨大な量のデータ群となって存在しています。この膨大なデータ群のことをビッグデータと言います。前述の構造化データ・非構造化データは、ともにビッグデータに含まれます。特に非構造化データは、従来から存在する音声や書物等に加えて、ブログ、SNS、映像・動画、電子書籍、GPSなど、含まれる種類と量が増えています。