分散ファイルシステム(DFS)とは?

ほとんどの人は端末で行った作業や個人用ファイルを保存する時に、それがどこに保存されるのか、あるいはどこからどのようようにして再び取得され画面に表示されるのかについて、じっくり考えてみたりはしません。しかし、ファイルが破損したり行方不明になったりしてショックを受けた経験があれば、その時に、自社が使用しているファイルシステムについて改めて考えてみたのではないでしょうか。

多くの企業では現在でも、伝統的な集中管理方式のファイルシステムを使用しています。つまり、社員が保存するすべてのファイルは単一のサーバー(オフィスや部署ごとのサーバーの場合もあります)に保存され、当然の結果として、全社員が同じサーバーのファイルへアクセスすることになります。シンプルで便利なシステムであり、構成や管理が容易で、実装や保守のコストも安価です。良いこと尽くしですね。しかし、ファイルを失くしてショックを受けたことを思い返してみましょう。集中管理方式のファイルシステムを使用する場合、拡張性や可用性は制限されます。集中型のファイルシステムには単一障害点があります。サーバーが落ちたり、障害が起きたりすると、サーバー上のあらゆるファイルやデータはサーバーが復活するまで利用できません。さらに、データやファイルを保存すればするほど、システム全体に負荷がかかりすぎていき、システムの全体的な性能に影響してビジネスの速度も低下します。 

この限界があるファイルやデータの保存方式に代わる選択肢として、分散ファイルシステム(DFS)があります。その名前が示すように、分散ファイルシステムはファイルを複数のサーバーに「分散」します。次のように思われる方がいるかもしれません。「うちの会社にはもう複数のサーバーがある。各オフィスごとに1つのサーバーが。これって同じことじゃないの?」 正確にはちょっと違います。では、分散ファイルシステムの仕組みと、なぜこれが高可用性や拡張容易性につながるのかを見ていきましょう。
 

DFSの仕組みについて 

エンドユーザーにとっては、特に違いは感じられません。これまでしてきたのと同じようなやり方で、ファイルを保存し、ファイルにアクセスします。保存したりアクセスしたりする時に、その裏で起きていることがまったく異なっているのです。DFSは通常、レプリケーションまたはパーティション分割のいずれかの方法で機能します。

レプリケーション型ファイルシステム

レプリケーション型ファイルシステムでは、エンドユーザーがファイルを保存する時に、そのファイルの複数のコピーが異なるサーバーに保存されます。そのファイルが保存されるたびに、レプリケートされたすべてのコピーも更新されます。エンドユーザーがファイルにアクセスする時に、これらのファイルのうちのどれが取得されるかは、システム構成時に設定したポリシーによって決定されます(最も近い保存先にあるファイルなど)。このシステムが集中型のファイルシステムよりも優れている点には、性能の向上、耐障害性、高可用性などがあります。すべてのファイルの複数のコピーが異なるファイルサーバーに保存されているため、そのうち1つのノードで障害が起きても、他の場所にあるファイルは利用できます。

しかし、システムが機能する上で全ファイルの複数のコピーが作成されるために、実際このタイプのシステムではストレージ要件が増大し、さらにネットワークトラフィックも増大していきます。また、レプリケートされたすべてのファイルが常に間違いなく更新されていることを保証しなければいけない面倒なシステムでもあります。誰かが昨日更新したファイルを先週のバージョンで取得しても、何の役にも立ちません。

パーティション分割型(並列型)ファイルシステム

パーティション分割型ファイルシステムでは、保存ファイルをブロックと呼ばれる小さなピースに分割し、その後、ネットワーク上の複数のサーバー(またはノード)全体で共有します。それぞれのブロックは異なるノードで複数回レプリケートされるので、データ可用性と耐障害性が最大限確保されます。エンドユーザーが保存ファイルの1つにアクセスすると、分散ファイルシステムのメタデータサーバーはただちにファイルの保存場所をマップ化し、適切なノードから必要なブロックを取得して再構築し、完成ファイルとして提示します。このタイプのシステムの長所は何でしょうか。おそらく予想されているとおり、それは優れた耐障害性と高可用性です。1台(あるいは数台でも)のノードに障害が発生しても、保存ファイルに問題なくアクセスできます。ファイルの複数のピース(ブロック)が他のノードで利用できるからです。さらに、このタイプのシステムは拡張性の点でも優れています。シンプルにノードをシステムに追加することによって、容易に保存データを増やせます。パーティション分割型ファイルシステムは極めて複雑なシステムであり、高度な負荷分散と正常なシステム機能を確保するための管理が要求されます。

これらのシステムの複雑さから、Rubrikのようなクラウドデータ管理ソリューションのエキスパートが参加することで、分散ファイルシステムの整合性を保ち、社員が常に必要なファイルを必要な時にアクセスできるようにすることができます。Rubrikはゼロトラストデータセキュリティのエキスパートです。企業データのバックアップや復旧に関するお困りごとがあれば、ぜひご相談ください。