HTML エンティティ エンコード / デコード
5 つの HTML 特殊文字をエンティティにエンコード、または名前付き・10 進・16 進エンティティをテキストにデコードします。
HTML エンティティ エンコード / デコード — HTML の予約文字 5 つ(&、<、>、"、')を安全なエンティティにエスケープしたり、名前付き・10 進・16 進エンティティをプレーンテキストに戻したりできます。「すべての非 ASCII をエンコード」を有効にすると、U+007F を超えるすべての文字を数値エンティティに変換します。デコードはブラウザ内蔵の HTML パーサーを使うため、認識できるエンティティはすべて正しく解決され、処理はすべてブラウザ内で完結します。
HTML エンティティ エンコード / デコードとは?
HTML エンティティ エンコード / デコードは、テキストと HTML エンティティを相互に変換できる無料のオンラインツールです。エンコードモードは予約された 5 つの HTML 文字——アンパサンド(&)、小なり(<)、大なり(>)、二重引用符(")、アポストロフィ(')——をエスケープし、ページを壊したり XSS の穴を作ったりせずにマークアップや属性の中へ安全に置けるようにします。デコードモードは、© や のような名前付き参照、© のような 10 進参照、© のような 16 進参照など、あらゆる形式のエンティティを解決します。Web 開発者、テクニカルライター、CMS の編集者が、コード例を HTML に貼り付けたり、ユーザー入力の文字列をサニタイズしたり、フィードやエクスポートからコピーしたエンティティだらけのスニペットをプレーンテキストとして読んだりするのに使います。セグメントトグルでエンコードとデコードを切り替え、アクセント付き文字・CJK 文字・絵文字も数値エンティティにしたいときは設定で「すべての非 ASCII をエンコード」を有効にできます。
HTML エンティティ エンコード / デコードの使い方
- 上部のセグメントトグルで Encode(エンコード)または Decode(デコード)を選びます。
- 入力ボックスにテキストを貼り付けるか入力すると、下の読み取り専用の出力ボックスに結果がリアルタイムで表示されます。
- エンコード時、U+007F を超えるすべての文字も数値の &#NNN; エンティティにしたい場合は、設定を開いて「すべての非 ASCII をエンコード」をオンにします。
- 出力フィールドのコピーボタンをクリックして、エンコードまたはデコードされた結果をコピーします。
- Swap をクリックすると出力を入力に移してモードを反転し往復チェックができます。Clear をクリックすると入力をリセットします。
使用例
予約文字 5 つをエンコード
入力
<a href="x">Tom & Jerry's</a>
出力
<a href="x">Tom & Jerry's</a>
名前付き・10 進・16 進が混在したエンティティをデコード
入力
100 % ☺ ©
出力
100 % ☺ ©
すべての非 ASCII を数値エンティティにエンコード
入力
Café & 日本
出力
Café & 日本
よくある質問
- エンコードモードはどの文字をエスケープしますか?
- 既定では HTML で特別な意味を持つ 5 文字だけをエスケープします。& は &、< は <、> は >、" は "、' は ' になります。& を最初に変換するため、生成されたエンティティが二重にエスケープされることはありません。設定で「すべての非 ASCII をエンコード」を有効にすると、U+007F を超えるすべての文字も数値の &#NNN; エンティティに変換されます。
- デコードモードはどんな種類のエンティティを解決できますか?
- 3 つの形式すべてです。&、 、©、— のような名前付き参照、© のような 10 進数値参照、© のような 16 進数値参照です。デコードはテキストをブラウザ内蔵の HTML パーサーに渡すため、ブラウザが認識するエンティティは実際のページと同じように解決されます。
- エンコードは XSS を防げますか?
- &、<、>、"、' のエスケープは、信頼できないテキストを HTML 本文や二重引用符付きの属性値に置く際の中心的な防御であり、本ツールが行うのはまさにこれです。ただし、すべての文脈(引用符なし属性、URL、インラインスクリプトなど)に対応する完全なサニタイザーではないため、標準的な HTML 出力用のエンコードと考え、完全なセキュリティ対策とは見なさないでください。
- 絵文字や基本多言語面以外の文字も扱えますか?
- はい。エンコードは Unicode コードポイント単位でテキストを走査するため、絵文字のようなサロゲートペアも壊れた 2 つの半分ではなく、1 つの正しい &#NNN; エンティティとしてエンコードされ、デコードでは数値エンティティが元の文字に戻されます。
- 私のテキストはサーバーにアップロードされますか?
- いいえ。エンコードもデコードもすべてブラウザ内で実行されます。エンコードは文字マップで、デコードはページに一切追加されない分離した textarea で行われるため、スクリプトは実行されません。何もアップロード・保存・送信されないため、非公開のコード、社内文章、未公開コンテンツにも安全に使えます。
関連ツール
Base32 / Base58 エンコード / デコード
テキストを Base32(RFC 4648)または Base58(ビットコイン用文字)にエンコードし、元に戻すこともできます(UTF-8 対応、ブラウザ内処理)。
Base64 エンコード / デコード
テキストを Base64 にエンコード、または Base64 をテキストにデコードします(UTF-8 対応)。
大文字小文字変換・カウントツール
テキストの大文字・小文字を変更し、文字数、単語数、行数をカウントします。
コード整形・圧縮ツール
HTML・CSS・JavaScript をブラウザ内で瞬時に整形または圧縮し、2スペース・4スペース・タブのインデントに対応します。