GISBoxは、OSGB/GEOTIFF/RVT などの複数の GIS フォーマットでの編集をサポートし、3DTiles/Terrain への変換や公開が可能なワンストップ 3DGIS データ編集、変換、公開プラットフォームです。
概要
HDF(Hierarchical Data Format)は、大規模な科学データセットを保存および管理するためのファイル形式です。これは多次元配列や複雑なデータ構造のコンテナであり、科学、工学、研究分野で広く使用されています。数値、画像、音声、テキストなど、さまざまな種類のデータを保存でき、階層構造をサポートしており、データセットを多層的に整理して保存およびアクセスすることができ、データの整理、検索、分析が容易になります。

データフォーマットの概要
HDF ファイルは階層的なデータ管理構造を採用しており、ディレクトリ(Directory)とデータオブジェクトセット(Collection)で構成されています。全体のディレクトリ構造を通じて、入れ子になったファイルからさまざまな情報を直接取得することができます。
長所
- 自己記述性:HDF ファイルは自己記述的な特徴を持っており、ファイル内の各データオブジェクトはそのデータに関する包括的な情報(メタデータ)を含んでいます。これにより、外部情報がなくてもアプリケーションは HDF ファイルの構造と内容を解釈することができます。
- 多様性:HDF ファイルは、ラスタ画像データ、科学データセット、情報説明データなど、さまざまな種類のデータを含むことができます。このデータ構造は、情報の抽出を便利にします。
- 柔軟性:HDF は、関連するデータオブジェクトをまとめて階層構造に配置したり、データオブジェクトに記述やタグを追加したりできます。また、科学データを複数の HDF ファイルに分けて保存することも可能です。
- 拡張性:HDF は将来的に新しいデータ形式を簡単に受け入れることができ、他の標準フォーマットとの互換性も容易です。
- 独立性:HDF はプラットフォームに依存しないファイル形式であり、異なる種類のコンピュータ間で HDF ファイルを変換せずに転送することができます。
- 標準化:HDF は一般的なデータセットの形式と記述を標準化しており、すべてのコンピュータやプログラムが標準データ形式を使用することを推奨しています。
短所
- アクセス遅延:HDF ファイルは科学データの保存および配布に優れていますが、いくつかの状況では低遅延のデータアクセスが求められるアプリケーションには適さない場合があります。
- 小さなファイルの保存:多数の小さなファイルを保存する場合、HDF は最適ではないかもしれません。なぜなら、NameNode はファイルシステムのメタデータをメモリ内に保存しており、ファイルシステムの保存能力は NameNode のメモリ容量に依存するからです。
- 書き込み制限:HDFS(Hadoop Distributed File System、分散ファイルシステム)は HDF と似ていますが、HDFS は並列書き込みやファイルのランダム変更をサポートしていないため、一部のアプリケーションに制限を与える可能性があります。ただし、これは HDF ファイル自体ではなく、HDFS に関する欠点であり、実際の運用では頻繁にデータの変更や並列書き込みが必要な場合には、他の適切なファイル形式やストレージシステムを検討する必要があります。
応用シーン
HDF は、大規模で複雑な科学データを保存および管理するために適しており、特に科学研究、データ分析、可視化などの分野で広く利用されています。例えば、天文学、地球科学、バイオメディカル、気象学などの分野で、大規模な科学データセットを保存および共有するために使用されます。
例
- HDF ファイル形式の例。

- HDF 形式の気象データ。

ファイルの開き方
- HDFView を使用して HDF ファイルを開く。

関連 GIS ファイル
NC
MBTiles
VMDS
SL3
参考
- https://ja.wikipedia.org/wiki/Hierarchical_Data_Format
- https://qiita.com/skotaro/items/873507dc8f8f967bbc03
- https://qiita.com/simonritchie/items/23db8b4cb5c590924d95