HTML 標準が注目を集めていた古き良き時代、<p> タグを正しく終了するか、書式設定ルールをスタイル コードから分離するかは問題ではありませんでした。タグの不一致、属性の欠落、要素の入れ子が不十分であるなど、広く採用されている標準がないため、これらの間違いやその他の間違いが発生しますが、ほとんどのブラウザにはこれらの間違いを回避するためのインテリジェンスが組み込まれているため、ほとんどの開発者はそれらの存在にまったく気づきません。 。
ブラウザ自体はこれらのエラーを修正しようとしていますが、これはこれらの問題を無視してよいという意味ではありません。 Web ページがすべてのブラウザで一貫して動作するには、HTML が W3C 標準で定義されているルールと構文に完全に一致している必要があります。この要件を達成するためのツールはオンラインとオフラインの両方で多数あります。この記事では、そのうちの 1 つについて説明します。それは、非常にクールな HTML Tidy です。
HTML Tidy は、HTML コードをチェックし、W3C 公開標準に完全に準拠していない箇所を指摘するように設計された無料の HTML チェック ツールです。HTML ファイルまたは HTML ステートメントを含む文字列を分析するために使用できます。コードを関連標準に準拠させるために必要な変更を自動的に行うことができます。
インストール
HTML Tidy は無料で、Windows、Macintosh、および *NIX プラットフォームで実行できます。*NIX プラットフォームを実行している場合は、次のようにしてソース コードからコンパイルしてインストールすることをお勧めします。 do: ソース ファイルを一時フォルダーに抽出し、次のように基本的なコンパイルとインストールのプロセスを実行します。
シェル> cd /tmp/tidy/build/gmake
シェル>作る
シェル>メイクインストール
このプロセスが完了すると、コンパイル済みの Tidy バイナリ バージョンが /tmp/tidy/bin/tidy フォルダに見つかるはずです。このファイルをシステム フォルダ /usr/local/bin / にコピーすると、アクセスしやすくなります。 。これで、このツールを使用する準備が整いました。
基本的な使い方
バイナリ バージョンをインストールしたら、すぐにそれを使用して HTML コードを検証できます。リスト A に簡単な例を示します。
リストA:
シェル>tidy -e -qindex.html
行 1 列 1 - 警告: <!DOCTYPE> 宣言がありません
行 2 列 1 - 警告: 欠落している 'title' 要素を挿入しています
行 4 列 1 - 警告: <body> 独自の属性 leftmargin
行 6 列 1 - 警告: <table> 独自の属性の高さ
行 6 列 1 - 警告: <テーブル> に概要属性がありません
行 11 列 37 - 警告: <img> に alt 属性がありません
行 15 列 1 - 警告: <テーブル> に概要属性がありません
行 17 列 50 - 警告: <img> に alt 属性がありません
この例では、Tidy はファイル内で 8 つの潜在的なエラーを検出し、各エラーに対して警告を出力しました。これらのエラーは重大なエラーではなく、コードの一部があまり正しくないことを警告しているだけであることに注意してください。
コマンドラインに -m (修飾子) オプションを追加すると、元のファイルを自動的に修正できます。
シェル>tidy -m -qindex.html
大規模な Web サイトをテストする必要がある場合は、コマンド ラインでワイルドカードを使用して、フォルダー内のすべてのファイル (1 つだけではなく) をテストできます。
シェル> tiny -m -q *.html
Tidy に、(元の Web ページを上書きするのではなく) 修正した Web ページを新しいファイルに書き込むよう支援してもらいたい場合は、次の例のように、新しいファイル名を指定して -output オプションを使用します。
シェル>すっきりとした -outputindex.html.new -qindex.html
-e ("error") オプションを使用すると、後で確認できるようにすべてのエラーを別のログ ファイルに出力できます。
シェル>tidy -f error.logindex.html
また、HTML コードに PHP、ASP、または JSP コードが埋め込まれている場合、Tidy はそれらを単に無視して所定の位置に残します。つまり、サーバーサイド スクリプトで Tidy ツールを実行して、HTML コード部分をチェックすることもできます。例:
シェル> tiny -e -q プロセッサー.php
Tidy ツールを対話的に実行して、引数を追加せずにプログラム ファイルのみを呼び出すこともできます。この例では、Tidy はコンソールからの入力を待ち、エラーをチェックします。
リストB
シェル>整理整頓
<html>
行 1 列 1 - 警告: <!DOCTYPE> 宣言がありません
<頭>
<title>これはテストです
</head>
行 3 列 1 - 警告: </head> の前に </title> がありません
<body leftmargin=0>
<p>
これは不適切に終了した段落です
</body>
</html>
行 5 列 1 - 警告: <body> 独自の属性 leftmargin
情報: ドキュメントのコンテンツは独自の HTML のように見えます
警告が 3 件、エラーが 0 件見つかりました。
Tidy は、リアルタイムのエラー警告を表示するだけでなく、入力の最後に正しいバージョンのコードを出力することもできることに注意してください。
<html>
<頭>
<メタ名=ジェネレーターの内容=
HTML Tidy for Linux/x86 (2005 年 9 月 1 日版)、www.w3.org> を参照
<title>これはテストです</title>
</head>
<body leftmargin=0>
<p>これは不適切に終了した段落です</p>
</body>
</html>
高度なアプリケーション
Tidy がファイルを変更する方法を制御するには、たとえば、Tidy にコードを再インデントさせるために、 -i ("indent") オプションを追加します。
シェル> tiny -output new.html -iindex.html
<font> および CSS スタイル ルールに関連するその他の書式設定要素を置き換えるには、-c ("clear") オプションを使用できます。
シェル> tiny -output new.html -cindex.html
デフォルトでは、Tidy は HTML ファイル内のすべてのタグと属性に小文字を使用します。大文字を使用したい場合は、次の例に示すように、-u (「大文字」) オプションを追加できます。
シェル> tiny -output new.html -c -uindex.html
特定の線幅でテキストを折り返すには、次の例に示すように、指定した線幅で -w (「行の折り返し」) オプションを追加します。
シェル>すっきりとした -output new.html -w 40 Index.html
-asxhtml オプションを追加すると、HTML ドキュメントを整形式の XHTML ドキュメントに変換できます。
シェル> tiny -output new.html -asxhtmlindex.html
-ashtml オプションを使用すると、逆の操作が可能です。
シェル> tiny -output new.html -ashtmlindex.html
Tidy のデフォルト オプションを大幅に調整する必要がある場合は、プログラムを呼び出すたびに参照できるように、これらのオプションを別の構成ファイルに入れるのが最善です。リスト C は構成ファイルの例を示しています。
リストC:
bare: はい # 独自の HTML を削除します
doctype: auto # doctypeを設定します
drop-empty-paras: yes # 空の <p> タグを自動的に削除します
fix-backslash: yes # URL 内の / に置き換えます
リテラル属性: はい # 属性値の空白を保持します
lower-literals: yes # 属性値を小文字に変換します
Output-xhtml: yes # 有効な XHTML 出力を生成します
引用アンパサンド: はい # & を & に置き換えます
引用符: はい # と置き換えます
requested-attributes: keep-last # 重複した属性の最後のものを使用します
indent: yes # コードを自動的にインデントします
indent-spaces: 2 # インデントするスペースの数
Wrap-php: no # PHP タグに含まれるテキストを折り返す
char-encoding: ascii # 使用する文字エンコーディング
tiny-mark: no # 修正コード内の Tidy メタ情報を省略します
ファイルを整理するときに、コマンドラインに -config オプションを追加することで、Tidy にこれらの設定を使用するように指示できます。
シェル> tiny -output a.html -configconfig.tidyindex.html
-help-config オプションを使用すると、構成オプションのリストを取得できます。
シェル> Tidy -help-config...quote-ampersand ブール値 y/n、
はい/いいえ、t/f、true/false、1/0引用符ブール値y/n、
はい/いいえ、t/f、true/false、1/0quote-nbsp ブール値 y/n、
はい/いいえ、t/f、true/false、1/0repeat-attributesenum keep-first、
keep-lastreplace-color ブール値 y/n、yes/no、
t/f、true/false、1/0show-body-only ブール値 y/n、
はい/いいえ、t/f、true/false、1/0...
または、 -show-config オプションを使用して、現在の構成設定のスナップショットを表示します。
シェル> tiny -show-config...show-body-only
ブール値 noshow-errors 整数
6show-warnings ブール値 yesslide-style
文字列分割ブール値なし...
最後に、 -h オプションを使用すると、コマンド ラインからヘルプを表示できます。
シェル>きちんとした -h
ここまでは、Tidy が、サイトを W3C 出版標準に完全に準拠させるのに役立つ非常に有益なツールであることを理解していただき、HTML Tidy ツールを制御する方法を理解していただければ幸いです。また、このツールをより効率的に使用するのにも役立ちます。