Select Language : English 日本語

NTTコミュニケーションズ

法人のお客さま: English / 日本語
個人のお客さま: English / 日本語

NTT Ltd.

グローバルサイト English

オブジェクトストレージとは?特徴や用途とファイルストレージとの違いを解説

オブジェクトストレージは、データをオブジェクト単位で取り扱うストレージ(記憶装置)です。容量制限がないことやデータアクセスに関する利便性の高さが評価され、急激にシェアを伸ばしています。オブジェクトストレージに目を向けることで、「日々増大する非構造化データをどう扱うべきか」「低コストでスケールしやすいストレージを構築できないか」など、ビッグデータ時代の課題に対する解決策が生まれるでしょう。ここでは、オブジェクトストレージの概要や他のストレージとの違い、メリットや活用事例などを紹介しています。

1. オブジェクトストレージとは?

1. オブジェクトストレージとは?

近年、クラウドプラットフォーム上でのビッグデータ活用において、新しいストレージ方式「オブジェクトストレージ」を採用する企業が増えています。そこでまず、オブジェクトストレージを含む3つのストレージ方式について簡単に整理して紹介します。

1-1. ストレージの種類

ブロックストレージ
ブロックストレージは、論理ボリュームを固定長の区画に分割した「ブロック」を最小単位とするストレージ方式です。ブロックのサイズは均一であり、各ブロックには固有の番号が付与されます。一般的には「論理ボリューム名+ブロック番号」でその位置(アドレス)が表現されます。ファイルストレージよりも高速にデータを特定できるため、レスポンスが良く、高速な読み書きが可能なストレージ方式です。その一方で、データごとに属性情報を付与・共有することができないため、非構造化データの管理には不向きとされることが多いです。

ファイルストレージ
ファイルストレージは、「拡張子が付与されたファイル」を最小単位とするストレージ方式です。ファイルが格納される論理的な階層構造(フォルダー、ディレクトリ)の中で、データの具体的な場所を表現します。この場所は「パス」と呼ばれ、一般的には「論理ボリューム名+ディレクトリ名+フォルダー名+ファイル名」で具体的な格納場所が示されます。また、データごとに属性情報を付与・共有できることから、ブロックデータに比べると非構造化データを容易に取扱うことができます。ただし、使用者がパスを記憶しておく必要があるうえにディレクトリ単位での容量制限があるため、データの出し入れや保存には一定の労力が必要です。

オブジェクトストレージ
オブジェクトストレージは、前述したように「オブジェクト」を最小単位とするストレージ方式です。オブジェクトはそれぞれユニーク(一意)なIDが付与され、データの属性情報(メタデータ)と共に管理されます。容量制限や他データとの依存関係を考慮する必要がなく、柔軟でスケーラビリティに優れた方式と言えます。

1-2. オブジェクトストレージの仕組みと特徴

オブジェクトストレージは、データを任意のまとまり(オブジェクト)に分割し、それぞれに独自の識別子(ID)を付与します。また、「ファイル名」「ファイルサイズ」「日付」「コピー回数」「保管期限」「データの種類」といった属性情報も作成します。この属性情報は「メタデータ」と呼ばれ、IDを付与されたオブジェクトと共に管理されます。

オブジェクトストレージのオブジェクトは、ファイルやブロックのように、具体的な位置情報を持っていません。オブジェクトIDを用いて、ある空間の中から直接データを指定し、読み書きを行います。また、データ同士は常にフラットでお互いに依存関係を持ちません。この仕組みが、データの読み書き・取り出し・移動・複製を容易にしています。

また、オブジェクトストレージではREST(Representational State Transfer)APIによってオブジェクトを操作することができます。REST APIとは、Webシステムを操作するためのAPIの一種です。HTTPプロトコルを用いて、Webシステム上のインターフェース(ブラウザなど)から容易にデータ操作を行うことができます。REST APIを用いることで、従来型のストレージのようにサーバーを介した操作が不要になります。

2. ファイルストレージ、ブロックストレージとの違い

このようにストレージには主に3つの方式があるため、個々の特徴を踏まえたうえで選定を行うことが大切です。ここでは、オブジェクトストレージとファイルストレージ、ブロックストレージの違いを解説します。

2-1. オブジェクトストレージとファイルストレージの違い

「オブジェクト」と「ファイル」
オブジェクトストレージはデータ管理の最小単位が「オブジェクト」です。オブジェクトにはデータそのものとID情報、メタデータが含まれます。一方、ファイルストレージは「ファイル」を最小単位としています。

ファイルストレージではデータをファイルとして保存し、その保存場所(フォルダー、ディレクトリ)によってデータを区別します。また、「書類・本棚・書斎」のように物理的な空間と似たイメージでファイルを管理できることから、誰もがデータにアクセスしやすいというメリットがあります。しかし、ファイルストレージはディレクトリ単位での容量制限が厳しいため、ビッグデータ活用が当たり前になった現代の環境に対応しきれない可能性がでてきました。そこで、同じように属性情報を保持してアクセス性を向上させつつ、容量制限のないオブジェクトストレージへの需要が高まっているのです。

データ格納方法の違い
ファイルストレージは、ファイルが置かれるフォルダーと、フォルダーを格納するディレクトリでデータを格納します。つまり、「○番地、△号棟、×号室」という具合に順を追って階層的に位置を定めています。これに対してオブジェクトストレージでは順を追って位置を探るのではなく「×という部屋は何か」という考え方を採用しています。したがってオブジェクトIDをユニーク(一意)にし、さらにメタデータをセットにすることで、階層構造を利用せずともデータを特定できるのです。

2-2. オブジェクトストレージとブロックストレージの違い

「オブジェクト」と「ブロック」
オブジェクトストレージは「オブジェクト」、ブロックストレージは「ブロック」が最小単位です。オブジェクトはデータを任意の大きさに分割したものです。一方、ブロックは記憶装置の領域を一定のルールにしたがって分割したものです。つまり、オブジェクトストレージはデータが主体となって最小単位が決められ、ブロックストレージでは記憶装置が主体となっている点で、根本的な考え方の違いがあります。

また、ブロックストレージに格納されるデータには、オブジェクトストレージやファイルストレージのような「メタデータ(属性情報)」が付与されません。メタデータはストレージを操作するホスト側に保持されています。

ブロックストレージは読み書きが非常に高速であることから、トランザクションデータなど、頻繁に更新されるデータの管理に適しています。一方、更新頻度が少なく、サイズが大きい非構造化データの管理には、オブジェクトストレージが多用される傾向にあります。

3. オブジェクトストレージのメリット

3. オブジェクトストレージのメリット

オブジェクトストレージのメリットとしては、次の6つが挙げられます。

スケールアウトが容易かつ無制限

オブジェクトストレージは、「階層」や「位置」といった制限が無く、なおかつ分散してデータが書き込まれます。そのため、容量の追加が容易です。著しいデータ量の増大に対しても、サーバーを追加するだけで、スケールアウトが完了します。ただし無制限とされるのは、あくまでも「格納するデータの総量(=オブジェクトの総数)」であって、個々のオブジェクト単位で見ると制限が設けられていることが多いでしょう。一般的なオブジェクトストレージでは「オブジェクトの最大サイズは3TB」「メタデータの最大サイズは2KB」といった具合に、オブジェクト単位で容量制限を設定しています。

ロックインに陥りにくい

前述のようにオブジェクトストレージは、サーバーを介さずREST APIとHTTPプロトコルを用いて直接データを操作します。REST APIは、複数のグローバル企業が参画する標準化団体「Open API Initiative (OAI)」によって、記述の標準化が推進されています。これは、特定のベンダーやプラットフォームに依存する技術ではないことを意味します。したがって、ベンダーロックインやプラットフォームロックインに陥りにくいのです。

また、オブジェクトストレージが持つ「HTTPプロトコルによるネットワーク越しのアクセス」という特徴は、近年のクラウド環境と一致しています。したがって、クラウドプラットフォームとOSS(オープンソースソフトウェア)を組み合わせた環境構築に適していると言えるでしょう。

データ管理・運用が容易

オブジェクトストレージでは、オブジェクトに対して多種多様なメタデータ(属性情報:データの種類、保存期間やコピー回数など)を付与することができ、メタデータを活用した検索性の向上が期待できます。また、適切に設計されたオブジェクトストレージでは、データ量が増大してもメタデータの検索性能はそれほど低下しません。このことから、膨大なデータの中から非構造化データを見つけやすくなり、データ管理・運用の手間が削減されるわけです。

耐久性、可用性の向上

オブジェクトストレージでは、同一のデータを複数のサーバーに分散して書き込みます。データを分散することで、データの耐久性や可用性を高めているのです。また、分散した書込みによってデータ容量が無駄に増えてしまうことを防ぐため、データ容量を抑える技術も採用されています。これは「イレージャーコーディング」と呼ばれる技術で、日本語では「消失訂正符号技術」と翻訳されます。イレージャーコーディングでは、オリジナルデータを任意の単位で分割し、さらに誤りや消失を訂正する符号(パリティデータ)とセットで保存します。こうすることで、無駄なコピー情報の発生を抑えつつ、データの消失や誤りに対する保護性能を高めているのです。

さらにオブジェクトストレージは、ストレージを構成するサーバーのひとつが停止しても、ストレージが停止しないように設計されることが大半です。つまり、サーバーの移設や障害による停止が発生しても、オブジェクトストレージ自体は問題なく使い続けられるのです。

ストレージ管理コストの低減

オブジェクトストレージは、仮想化技術によって物理的に離れた場所にある複数のサーバーを並列化し、単一のストレージとして扱うことができます。これにより巨大なデータストレージが必要な場合でも、必要最小限のサーバーで十分な容量を確保できるのです。一般的にストレージの管理コストは物理的なストレージの台数や容量に比例して大きくなります。オブジェクトストレージは仮想化技術と並列化によって、物理的なインフラを肥大化させることなくストレージ容量のみを大きくできるため、コストパフォーマンスが高い仕組みと言えるのです。

場所の制限を受けにくい

オブジェクトストレージでは、前述したようにHTTPプロトコルによってデータを操作することができます。これは、アクセスの自由度が高いことを意味します。

従来型のファイルストレージでは、通信規格としてCIFS(Common Internet File System:Windows OSにおけるファイル共有プロトコル)やNFS(Network File System)が採用されてきました。こうしたプロトコルは、特定のOS・ネットワークを使用する環境に限定して、データアクセスを実現するものでした。そのため、「オフィス外」や「社内ネットワークの外側」からのアクセスには対応できないことが多かったのです。一方オブジェクトストレージでは、HTTPプロトコルによって、インターネットに接続する場所であればどこからでもデータへアクセスできるようになりました。

4. なぜ今オブジェクトストレージなのか

オブジェクトストレージ市場は、ここ数年の間、一貫して拡大傾向にあります。この背景には、次のような理由があると考えられます。

データ民主化の要請

ビッグデータがビジネスに活用される時代になり、データに関する専門知識を持たないビジネスパーソンであっても、ビッグデータを取り扱う機会が増えています。このことから「データの民主化」が叫ばれるようになりました。データの民主化とは、端的に言えば「一般のビジネスパーソンが自由にデータにアクセスし、加工・編集・分析してビジネスに役立てられるようになること」です。いくらユーザーフレンドリーなAI・BIツールが増えたとしても、そこへ投入するためのデータへアクセスしにくければ、ツールの恩恵を受けることは難しいでしょう。したがって、適切なアクセス権のもと、柔軟かつシームレスにデータへアクセスできる環境が望まれているのです。

このような理由から、オブジェクトストレージが持つ「Web経由でアクセスできる分散型のストレージシステム」としての側面が評価されていると考えられます。

また、オブジェクトストレージはデバイスの種類にかかわらず利用できることから、デバイスに応じた経路を構築する必要がありません。この点が、ストレージシステムの「サイロ化」と運用工数の肥大化を防ぎます。

非構造化データの増大

近年、企業内では非構造化データが増加傾向にあると言われています。総務省によれば非構造化データとは、「データ内に規則性に関する区切りがなく、データを見ただけでは、二次元の表形式に変換できないことがわかるデータ」とされています。つまり、行や列の概念がなく一定のルールや規則によって分割・加工・編集・整理がしにくいデータです。非構造化データはブロードバンド環境の普及とともに飛躍的な増加を見せており、今後も同様の傾向が続くと考えられます。

一般的には、「音声データ」「動画データ」「人間が記述したテキストデータ(自然言語)」などが該当し、近年はGPSやセンサーから得られる情報も非構造化データとして定義されています。非構造化データからは、マーケティング施策の立案や製品開発などに役立つ知見が得られやすく、年々重要性が高まっています。その反面、データサイズが急激に増大しやすく、なおかつ一定期間の保管が必要という特性を持つことから、ストレージ容量をひっ迫させやすい存在です。現代のビッグデータ活用は、これら非構造化データをいかに保存し、管理するかが課題と言えるでしょう。

オブジェクトストレージは、「容量の制限がない」「スケールアウトが容易」「データが増大してもメタデータの検索性が落ちにくい」という特徴から、非構造化データにまつわる課題への解決策として活用されています。

ビッグデータの特性を維持するため

ビッグデータには3つの特性(3V)があるとされています。3Vとは「多様性(Variety)」「データ量(Volume)」「生成速度・頻度(Velocity)」を指します。つまり、この3つの特性を維持することが、ビッグデータ活用の基礎と言えるわけです。動画やテキストなど多様な非構造化データを、容量の制限なく保管できるオブジェクトストレージは、ビッグデータの3Vを担保することに適した仕組みと言えるでしょう。

汎用性の高さ

オブジェクトストレージは、パブリッククラウドとプライベートクラウドの両方に対応する仕組みです。実際に国内外の主要なパブリッククラウド製品は、その大半がオブジェクトストレージを採用しています。また、オブジェクトストレージは自己管理が容易であることから、企業が独自に構築したプライベートクラウド環境にもマッチしやすいのです。

コスト削減

コロナ禍をきっかけに、テレワーク・リモートワークなど多様な働き方が一般的になりました。こうした働き方の多様化は、データアクセスの多様化につながっています。今、企業に求められているのは、社内外のあらゆる場所からシームレスにアクセスできる業務環境です。しかし、アクセス経路ごとにシステムを作り変えていては、セキュリティ対策費が高騰する遠因となってしまいます。オブジェクトストレージは、アクセスが容易で検索性と保護性に優れたデータストレージを素早く効率化できるため、従来型のストレージに比べてコストパフォーマンスが高い仕組みとして注目されているのです。

5. オブジェクトストレージが活用されている分野

では、実際にオブジェクトストレージが活用されている分野から、具体的な事例を紹介します。オブジェクトストレージは、原則として「更新や書き換え頻度の少ない大容量データの保管、配信」に適した仕組みです。そのため、環境データの保存や重要な研究データのアーカイブなどに活用されています。

農業用の気象、成長、環境データの保存

農業分野では、全国各地に設定されたセンサー・カメラ・ドローンから気象情報を収集し、オブジェクトストレージに保存するという事例があります。この事例では、天候・農作物の成長具合・水の供給状況に加えて、植物の遺伝子情報や外的要因(病害虫、有害な野生動物)に関するデータまでもが保存されているとのことです。また、単に保存するだけではなく、ストリーミング形式で別のオブジェクトストレージへと配信も行っています。

こうしたデータは、機械学習による分析作業に利用され、外的要因に対して耐性を持つ作物の開発に利用されています。

オブジェクトロックによるデータ保護と復旧

近年、悪意を持った第三者が発するランサムウェアが、企業内システムを不当に攻撃する事例が散見されます。ランサムウェアに対応するためには、端末の保護(エンドポイントセキュリティ)やファイアウォールを中心としたネットワークセキュリティのみでは不十分です。なぜなら、仮にデータの改ざんが発生した場合に、最もコストを要するのは「復旧」だからです。エンドポイントセキュリティやファイアウォールは、データの復旧に強みを持つソリューションとは言い難いでしょう。このことから、「仮にデータへの不正なアクセスがあったとしても、改変できない」という仕組みが求められています。

そこで、オブジェクトストレージが持つ「オブジェクトロック」機能が注目されています。オブジェクトロックは、バックアップデータに対して「一切の変更・削除を認めない」という機能で、いかなる状況下でも手つかずのクリーンなデータが保管されます。ランサムウェアの攻撃を受けてデータが改変されたとしても、オブジェクトロックによって保護されたバックアップから復旧することができるわけです。

ある保険会社では、オブジェクトロック機能を活用する企業に対して、サイバー保険の割引サービスを提供しています。

非リアルタイムなDR対策

オブジェクトストレージは一般的に、リアルタイムなレプリケーションには適さない仕組みとされます。これは、オブジェクトストレージが「同期」よりも「拡張性」を重視した設計であることに起因しています。しかし、DR対策(ディザスタリカバリ=災害復旧)という点から見れば、オブジェクトストレージも有効な選択肢のひとつになるかもしれません。なぜなら、DR対策では必ずしも「リアルタイムな同期」が必要だとは言えないからです。

実際に国内では 「準同期」によってオブジェクトストレージをレプリケーションに活用し、DR対策として活用している事例があります。この事例では、社内システムをクラウドへと移行したタイミングで、東京を稼働系とし、大阪を待機系としてDBサーバーを設置しました。また、大阪の待機系サーバーには東京の稼働系サーバーのデータが1日に1回同期されます。

DR対策に必要なのは「拠点間が物理的に離れていること」「平時は低コストで運用できること」「堅牢であること」の3点です。データの同期に関しては、それほど頻繁に行う必要がないため、オブジェクトストレージでも十分に対策が可能です。

6. おわりに

本稿では、オブジェクトストレージの概要や仕組み、他のストレージとの違い、実際の活用事例などを紹介してきました。オブジェクトストレージのユースケースは、年々多様化しており、すでに「大容量データのアーカイブ用ソリューション」という域を脱しています。ビッグデータの有効活用からDR対策まで、幅広く使用できるオブジェクトストレージは、企業のDXを支える存在と言えるでしょう。

アンケート DXーお役立ちPDFーダウンロード

アンケートにお答えください お役立ちコンテンツPDF PDFがダウンロードいただけます。

Q4

DXにむけて組織や人事評価の仕組みを変えていますか。

このページのトップへ