総合科目「IT革命を解き明かす」、2001年11月12日 電子・情報工学系 新城 靖 <yas@is.tsukuba.ac.jp>
このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/gen/it-2001-11-12
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/gen/
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html
印刷配布資料 http://www.hlla.is.tsukuba.ac.jp/~yas/gen/it-2001-11-12 /it-2001-11-12 .pdf
木構造(tree structure)というのは、コンピュータ・サイエン ス(計算機科学)でよく使われる用語である。分野によっては、同じものを 階層構造(hierarchical structure)という言葉で表現すること が好まれる。ドイツ語語源の、ヒエラルヒー(Hierarchie)という言葉が使われ ることもある。
木構造の例を、大学の組織を使って説明する(図1)。
図1では、筑波大学と書いてある所が木の根にあたる。根からは、何本かの 学群の枝が出ている。このように、コンピュータ・サイエンスでは、木の根を 上に書く習慣がある。第二学群の節には、日本語日本文化学類、生物学類など の子の節がある。第二学群の親は、筑波大学である。
たとえば「情報学類」、「健康・スポーツ教育主専攻」の場合、次のように記述する。
筑波大学第三学群情報学類
筑波大学体育専門学群健康・スポーツ教育主専攻
コンピュータの中で、文字列(文字の並び)で木構造上の位置を表現する時に は、節が分かりやすくために、はっきりと区切りを入れて表現することがよく 行われる。
筑波大学.第三学群.情報学類
筑波大学/第三学群/情報学類
情報学類.第三学群.筑波大学
区切り文字としては、「.」(点)や「/」(スラッシュ)がよく使われる。 並べる時に、木の根に近いほうから書く流儀と遠い方から書く流儀がある。
住所の表記も、木構造である。
日本国.茨城県.つくば市.天王台
図1に示されている木構造は、また図2のように、「領域(domain)」を分割 するような見方もできる。木構造の場合には、領域の境界線が交わることがな い。
Windows の画面や、Macintosh の Finder の表示は、この領域の分割に似て いる。
筑波大学
コンピュータでは、次のような場所で木構造が使われている。
コンピュータ以外では、次のような場所で木構造が使われている。
日本語の段落とは違う。
図3 topic sentence を根に持つパラグラフ
長い文章を斜めに読むには、パラグラフの先頭の topic sentence だけを読め ばよい。
日本語の特徴
日本語でも、文学作品をのぞいて、英語的に木構造になっていると読みやすい。
Time flies like an arrow.
図5 「Time flies like an arrow.」の木(その1)
同じ単語の並びでも、木構造を作ることもできる。
図6 「Time flies like an arrow.」の木(その2)
図7 「This is-a pen」の集合的な意味
is-a関係
図8 is-a関係の例(哺乳類 is-a 動物)
ディレクトリは、全体では
木構造(tree structure)
になっている。階層化ディレクトリ(hierarchical directory)と呼ばれるこ
ともある。
図9 ファイルとディレクトリの木
図10 自然の木
ファイルの名前の表現には、「パス名」がよくつかわれる。パス (path)とい うのは、道の意味である。パス名では、どの道を通ればよいかの道順を示すこ とでファイルの名前を表現する。
木構造では、節、または、枝(道)に名前がついている。ファイル名は、区切り 文字で区切られた、節、または、枝の名前の並びになる。ファイルの名前を表 現する時の区切り文字としては、次のものがよく使われる。
/
\
:
パス名の例:
/home6/s991001
/usr/local/bin/mnews
パス名には、 次の2種類がある。
例:相対パス名 bin/awk (カレント・ワーキング・ディレクトリが /usrの時)
たとえば、icho という名前のコンピュータで、
新城のホーム・ディレクトリは、
絶対パス名では、/home1/yshinjo/
である。
/
)から出発する。
home1
という名前の節に進む。
yshinjo
という名前の節に進む。
電子メールを送ったりWorld Wide Web のページを閲覧する時には、データの
送り先やデータを持っているコンピュータを指定する必要がある。
(ネットワークの用語では、コンピュータのことをホストと呼ぶ。)
インターネットで使われている、コンピュータの名前(ホスト名)を管理する
仕組みは、
DNS(Domain Name System)
と呼ばれている。
DNS では、膨大な数のコンピュータの名前を含む名前空間を階層的にドメイン
(領域)に分割して管理している。
図11 名前空間のドメインへの分割 図12 名前空間の木構造としての見方
host1.is.u-ust.ac.jpこのように、インターネットでのコンピュータの名前は、「
.
」
で区切られた文字列(文字の並び)である。この文字列で使える文字は、アル
ファベット(大文字も小文字も同じだが普通は小文字だけが使われる)と数字、
ハイフン(マイナス)である。
DNS で名前は、ファイルのパス名
とは逆で、右から左に向かって解釈される。上のコンピュータの名前をこれを
ファイルのパス名のように書くと、
/jp/ac/u-ust/is/host1となる。
「host1.is.u-ust.ac.jp
」を
図12で考えると、次のようになる。
jp
という節がある。
ac
という節がある。
u-ust
という節がある。
is
という節がある
host1
という節(葉)がある。
「host1.is.u-ust.ac.jp
」を
図11で考えると、次のようになる。
根の直下は、ISO (国際標準化機構, International Standardization Organization ) が定めた2文字による国別コード(country code)が使われて いる。ただし、歴史的な理由により、アメリカを中心として .com, .edu, . gov, .net, .org, .mil などが現在でも使われている。日本の国別コードは、 jp である。jp の下には、次のようなドメインがある。
注意:acやadなどの属性を持たないドメイン名も許されるようになった。 .jp と .com の競争のため。
汎用 JP ドメイン名
http://www.nic.ad.jp/dotjp/
問題
1986年、3100の公式名と6500の別名。
1990年、6400の公式名。DNS に以降。この時点で、137,000。
しかし、.com は、2001年11月ごろ 2200万。全体 3600万の60%をしめる。
(http://www.domainstats.com/
)
.jp は、43万個登録され、そのうち23万が利用されている。
JINIC/JP ドメイン名に関する統計
http://www.nic.ad.jp/jp/stat/dom/explanation.html
http://www.icann.org/tlds/
インターネットのドメイン名の根は、1つしかない。 13個のサーバにコピーが世界各地にある。
もし、別の根の情報を持つサーバがあれば、どうなるのか。
オルタネート・ルート(alternate roots)。
大量の情報を保存するには、木構造を使うしかない。 しかし、、、
図13 こうもりの分類(1)
図14 こうもりの分類(2)
木構造は、ファイルを整理するのに非常に強力な構造である。しかし、それだ けでは、ファイルを整理するには不都合が起きる。それを解消するために、次 のような名前で呼ばれる仕組みが用意されている。
図15 こうもりの分類(別名つき)
中間管理職の意味==横方向に情報が流れない。
木構造でしか情報が流れないような組織は、潰れる。木構造を補う意味で、会 社組織では、裏チャネルや同期会が重要となる。
木構造を補う方法として、ハイパーテキストと呼ばれる方法を使うことがある。
ハイパーテキスト(hypertext)とは、内部に他のテキストへの「参照 (reference)」が埋め込まれているテキスト(文書、文字だけから構成される データ)である。ハイパーテキストという仕組みを使えば、テキストのある部 分から、関連している情報を含んでいるテキストのある部分を引き出すことが 簡単になる。ハイパーテキストを拡張し、テキスト・データだけでなく、音声や画像などの データを扱えるようにしたものを、ハイパーメディア(hypermedia)という。 World Wide Web は、(木構造ではなく)ハイパーメディアに基づいて 作られている情報提示のための仕組みである。
http://www.ntt.co.jp/SQUARE/index-j.html
http
www.ntt.co.jp
/SQUARE/index-j.html
.html
は、その資源がHTML で書かれている事を表わしている。