非構造化データとは|テクスタ辞書


「非構造化データ」(英名:unstructured data)とは、データの種類の1つで、「構造化データ」の反対の性質を持つデータのことを指します。データベースとして、管理しにくいという特徴があります。

非構造化データの特徴

非構造化データには、さまざまな種類があり、大きく3つのタイプに分類することができますが、いずれも「データベース化しにくい」という特徴があります。

1つ目のタイプは、紙のデータです。契約書や申込書、オフィス文書などがこれに当てはまります。

2つ目は、デジタルコンテンツです。Webコンテンツがこの分野に含まれます。また、音楽、画像、映像などのデータも、デジタルコンテンツに区分されます。

3つ目は、電子化文書です。電子化文書とは、紙のデータをスキャニングなどで電子化したもののことを指します。

非構造化データの正確な量は把握されていませんが、現時点で、構造化データの4倍は存在していると予想されています。

非構造化データの管理

非構造化データは、今後も増え続けると見られています。その為、より効率的に管理できる方法として、データベースとして扱っていく必要があるとの見方が強まっています。

特に注目されているのが、「オブジェクトストレージ」を使った管理方法です。オブジェクトストレージとは、システムなどに依存せずにアクセスできるストレージのことです。サーバーのスケールアウトが可能なため拡張性があり、更に起伏がなく平らな階層構造になっていることから、簡単にデータの移動ができるという特徴があります。

この特徴をいかすことで、増加し続ける膨大な量のデータを効率的に管理できると期待されており、非構造化データの新たな管理方法として注目を浴びているのです。