魅力的な小説サイトをつくろう!トップへ戻る

[3]まずは設計図を書こう

覚えておいて損はないファイル名とディレクトリ名の約束ごと

 さて、ディレクトリ構造の話がでてきたので、Webサイトを運営するにあたって覚えて置いて絶対に損はしない、ファイル名、ディレクトリ名の話をしておきましょう。
 このファイル名、ディレクトリ名はWebサイトのURLとなるため、とても責任重大です。リンク集や検索エンジンなどからジャンプする場合はさほど気にならないでしょうが、例えば紙に書いたもの(書籍や雑誌、あるいは名刺など)を直接Webブラウザのアドレスバーに打ち込むこともあります。その場合、覚えやすくて打ち間違いのおそれがない、簡単な名前がいちばんです。
 プロバイダーで間借りしている場合、http://www.xxx.ne.jp/~xxx/index.htmlというURLになることがほとんどですが、実はこの「~(チルダーと呼びます)」をキーボードから入力できない人はたくさんいるんですヨ(WindowsやG4以降の黒いキーボードなら、いちばん右上のバックスペースキー<BkSpなどと書いてあります>から左へふたつ目の「〜 ^ へ」と書いてあるキーをShiftキーと一緒に押せば出てきます。G3までのMacintoshの純正キーボードではいちばん左上の「〜」をShiftキーと一緒に押せば出てきます)。さらにそこからスラッシュも入れてアルファベット小文字で入力するという場合、初心者の人にはとてもハードルが高くなります。だから、覚えやすくて短いファイル名がとても親切になるわけですね。
 余談ですが、私の場合はこの「~」つきのURLがどうにも気に入らなかったため、無謀にもサイト立ち上げ当初からレンタルサーバーを借り、独自ドメインではじめちゃいました。(^ ^;;

(1)拡張子に注意
 拡張子とは、ファイル名の末尾の「.(ピリオド)」以降に付けられている文字列のことです。Macintosh以外のOSはこの拡張子を見て、どのアプリケーションで作られたファイルかを判断します。もちろんHTMLファイルにも拡張子は必要です。
 多くのWebサーバーはUNIX系です。UNIXではHTMLファイルの拡張子は「.html」です。Windows系のサーバーなら拡張子は三文字の「.htm」です。Windowsユーザーは特に三文字の拡張子に慣れているでしょうし(Windows3.1までの環境では三文字の拡張子以外はつけることができません)、Macintoshユーザーにあたってはクリエイターと呼ばれるアプリケーションとの関連情報でファイルを管理しているので、拡張子について考えたこともないでしょう。お使いのプロバイダーから渡された資料などを元に、ファイルの拡張子はどちらにすべきかを考えてください。

(2)トップページは必ず「index」
 多くのプロバイダーは、Webサイトのトップページのファイル名を「index.html」あるいは「index.htm」のどちらかにするように推奨していることでしょう。indexは「このディレクトリのいちばん最初に表示するページですよ」ということをお知らせするものです。
 この「index」がない場合、あなたのWebサイトのディレクトリが丸見えになってしまうこともあるので注意です。
 例えば私のサイトStudio Mercuryの場合、トップページは「index.html」にしています。ですから、通常私のサイトへのURLは「http://www.studio-mercury.org/index.html」になります。しかし、index.htmlは省略可能なので「http://www.studio-mercury.org/」でかまいません。Webサーバーがディレクトリのトップページを「indexと名前のついたファイルである」ということを最初から認識しているからです。
 「/」はディレクトリを表しているので、「http://www.studio-mercury.org/」というリクエストを受け付けたWebサーバーは、index.htmlを探して自動で表示します。このindex.htmlがなかった場合、次にWebサーバーはstudio-mercury.orgのルートディレクトリの中に「index」と名前のついたファイルがあるかどうか探しに行きます。サーバーによって異なるようですが、「index」というリクエストを受けた際に表示する拡張子のプライオリティは決まっています(後述)。
 もし仮に「index.html」がなくても「index.cgi」といったファイルが見つかれば、Webサーバーはindex.cgiを表示します。ほかにindexという名前が見つからなかった場合は、Webサーバーはディレクトリの構造を示してしまいます。つまり、こういう状態でstudio-mercury.org内のファイルが一覧されてしまうわけです。格好悪いですよね。これによって隠しておきたいフォルダやファイルが一覧されてしまいますので、ディレクトリのトップページは必ずindexとつけましょう。
 なお、プロバイダーの設定によっては、このディレクトリ一覧が禁止されていることもあります。その場合、「403 Forbidden」(このディレクトリの閲覧はあなたには許可されていませんよの意味)といったページが表示されるので問題はありません。ですが、トップページは必ず「index.html」にすることを強く推奨します。
1:index.html
2:index.htm
3:index.php
4:index.php3
5:index.cgi
6:index.hdml
7:index.wml
 index.html(またはindex.htm)などのファイルが見つからなかった場合、次にどのファイルを探しに行くかはプロバイダーやレンタルサーバーの設定によって異なります。私の使っているサーバーでは、左表のような優先順位がつけられています。また、「/」で終わるURLをリクエストされた際、どのファイルを優先的に表示させるかは、「.htaccess」と呼ばれるファイルを記述することでユーザー自身で変更できることがあります。ディレクトリ一覧もこの.htaccessファイルによって禁止することが可能ですが、これについては8章で後述しましょう。
 余談ですが「/」のついたURLを打ち込んだとき、サーバーはindex.htmlを探しに行くのでちょっとロードの時間がかかることがあります。とくにindex.htmlがなくてindex.cgiとかindex.php、index.plなどといったファイルをおいている場合、それらをいちいち探してしまうので、ちょっとレスポンスが遅くなるのですね。遅くなるといっても、本当に気付かない程度ですが。

(3)ファイル名の約束ごと
 以下に、Webサイトを構築するに当たって覚えておきたいファイル名の規則を記しました。Webサイト構築だけでなく、ふだんパソコンを使うときからファイル名に自分なりの規則をつけておけば、「あのファイルはどこにいった?」「このファイルはなんだろう?」というように混乱することもありません。覚えておいて絶対に損はないと思います。

[a] ファイル名は半角英数字で
 HTMLファイルにつけるファイル名は、当然のことながら半角英数字で付けましょう。まれに日本語でファイル名を付けている人を見かけます(^ ^;;。日本語は1バイトの正規表現に変換されるので問題なく表示されることのほうが多いですが、Webブラウザによっては2バイトのURLをはじくことがあります。ファイル名は絶対に日本語をつけてはいけません。半角カタカナや機種異存文字なんてもってのほかです。

[b] 8.3しばりが理想
 8.3しばりって言葉、ご存じの方も少ないのでは? 昔、まだWindowsなんてなくてDOSというコマンドプロンプトが主流だった時代、ファイル名は8文字の半角英数字+「.(ドット)」+3文字の拡張子というように決められていました。いまでこそWindowsは半角255文字のファイル名をつけられますが、Macintoshでは半角31文字までしか表示できません。そんなに長いファイル名をつけてどうするんだって話もありますが(^ ^;;。
 CD-Rを焼いたことのある人ならご存じでしょうが、DOSやWindows向けに焼く場合は(ISO9660という規格のCD-ROMフォーマットです)いまだに8.3しばりでしかファイル名を認識しません。Jolietで焼けばWindows95以降の長いファイル名(ロングファイルネームと呼びます)を認識できますが、それと同じですね。
 WebサーバーはUNIXですが、ファイルの管理上、この8.3しばりを念頭に置いてファイル名をつけることをおすすめします。

[c] ファイル名の頭に数字はなるべく使わない
 これはあまり知られていないことのようですが、例えば001.htmlというように、頭に数字のつくファイル名はあまり好ましくないとされています。私もつい最近知ったばかりです。
 Webサーバーは何度も言っているようにUNIX系が多いです。UNIXでは頭に数字のつくファイル名はシステムが使う重要なファイルにつけられることが多いため、なるべくアルファベットでつけることをおすすめします。私の場合、index以外のファイルには「ss1_001.html」のように、頭に必ず自分で分かるようコーナー名を略したアルファベットをつけています。

[d] 通し番号は三桁が理想
 続いて連番のファイルを作る場合ですが、三桁の通し番号を振るのが理想とされています。私も勉強不足でなぜかは分からないのですが、お約束だということを覚えておくといいでしょう。私はCD-ROMを作る仕事もしていたのですが、そのときもやはりファイル名の通し番号には必ず三桁の数字を付けていました。
 二桁でもかまいませんが、頭に0がつけるだけでハードディスク上でソート(並び替え)がラクです。例えば二桁の場合、確実に99個以上ファイルが増えないというのであれば問題ないでしょうが、一桁は絶対に突破することが考えられますよね。ファイル名を「twog_1.html」にしたとします。次のファイルに「twog_2.html」のように付けた場合、そのうちに「twog_10.html」というファイルを作らなければならないこともあるでしょう。そのとき、ファイル名でソートしている場合、「twog_1.html」のあとに「twog_10.html」がきて、その次に「twog_2.html」がくる、といったように並び替えられてしまいます。
 ハードディスク内でのファイル管理の混乱を招きますので、少なくとも二桁、そうでなくても三桁の通し番号をつけることをおすすめします。私も「c1_001.html」のように三桁で統一しています。

[e]アルファベットの大文字小文字に注意
 WindowsはDOSを引き継いでいるために、基本的には大文字という概念がありません。大文字も小文字も、すべて同じファイル名だという認識をしています。このため、「profile.html」と「Profile.html」は同じファイルだということになるのです。
 ところが、WebサーバーであるUNIXは、この大文字と小文字の違いだけで、異なるファイルだと認識します。ですから、「profile.html」にリンクを貼っている場合、リンク先にあるファイルが「Profile.html」だったとしても、ファイルがないよ〜と返してしまうのです。
 この混乱を避けるために、Webサイトで使うファイル名はすべて小文字で統一することをおすすめします。混在させる場合は、リンクに注意。

[f] フォルダ名も短くわかりやすく
 フォルダ名も同様に、短くわかりやすいものを使うといいでしょう。最大8文字くらいまでが理想です。長いコーナー名は、英語に置き換えて略すなどするとわかりやすいでしょう。

[g] 使ってはいけない文字
 まず日本語は絶対に使ってはいけません。またOSによってファイル名に付けられない文字があるので、それも使ってはいけません。特にWindowsはシビアですので、ファイル名をつけようとしてはじかれた記憶があるのでは?
 「/(スラッシュ)」はもちろんつけてはいけません。「-(ハイフン)」もあまり推奨されません(最近はそうでもないようですが)。「~(チルダー)」「*(アスタリスク)」「+(プラス)」「'(シングルコーテーション)」「"(ダブルコーテーション」「?(クエスチョンマーク)」「!(エクスクラメーションマーク)」「.(ピリオド)」などなど、とにかく記号に近いものは極力避けましょう。数字とアルファベットだけでつけることをおすすめします。
 「-(ハイフン)」についてよくお問い合わせをいただきましたので追記を。WindowsとMacintoshでは問題なく使えますが、一部のUNIX系システムでは禁止されていた文字のひとつです。「-」のかわりに「_(アンダースコア)」を使うように推奨されています。
 また、前述したようにISO9660のCD-ROMでは、「-」は使用不可能です。この文字を使ってROMをトーストしてもすべて「_」に置換されてしまいます。
 いまでこそそれほどうるさく言われなくなったハイフンですが、アンダースコアで代用する癖を付けておくといいかもしれません。

Back<< | トップページへ | >>Next

このサイトと管理人について| 掲示板

(c)Studio Mercury, You-zo Hiwatashi All Rights Reserved. 1999-2003