本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
目次
エスケープシーケンスは、見えないや入力できない文字を入力するための「おまじない」
CSVデータファイルを使用し、改行文字をデータベースに取込む場合や、プログラミングを使用し、改行文字をメッセージの一部として表示する場合にエスケープシーケンス(エスケープ文字)を使用します。エスケープシーケンスとは何か?どのような文字があるかを解説します。(コンピュータにおけるテキストについてはこちらを参照)
エスケープシーケンス(エスケープ文字)とは
エスケープシーケンスについて、IT用語辞典の内容を転記します。
エスケープシーケンスとは、画面上に文字を出力する際に、文字そのものを出力するのではなく、文字色の変更やカーソルの移動、文字の消去など、文字出力の制御を行う特殊な文字列のことである。
出所:IT用語辞典
OSで使用している文字の中には、人が「文字」と認識できる情報以外に、OS上の制御文字や文字編集情報などの「文字」以外の情報も文字情報として含まれています。これらの文字の事を「特殊文字」と呼ぶ場合もあります。この特殊文字は、人が文字入力してOSに伝えるためにエスケープシーケンスが存在します。
代表的なエスケープシーケンス
代表的なエスケープシーケンスとして、以下のような文字があります。(ホームページに掲載する都合上、全角で表示していますが、実際は半角で表現します)
- ¥a:ベル文字(アラート)
- ¥b:1文字分戻る
- ¥f:ページ送り(クリア)
- ¥n:改行、復帰
- ¥r:同じ行の先頭に戻る
- ¥t:水平タブ
- ¥v:垂直タブ
- ¥¥:¥を表示
- ¥?:?を表示
- ¥’:シングルクォーテーション(’)
- ¥”:ダブルクォーテーション(”)
- ¥0:ヌル
このようにエスケープシーケンスは、¥マーク(文字)とセットで表現します。そのため、¥マークを扱いたい場合は「¥¥」と表現する必要があります。また、改行文字を表現する場合、OSごとに異なり、Windowsの場合は「¥r¥n」、UNIX系(Linux/Mac OS/iOS/Android)の場合は「¥n」で表現します。例えばWindowsで改行文字を表現すると以下のようになります。
graffe(グラーフ)は、「graph(グラフ)」と「giraffe(ジラーフ=キリン)」を組み合わせた造語です。¥r¥nデータビジュアライズ(グラフ)によって、キリンのように遠くを見通せるようになろう、という意味を込めて命名されました。
↓ 実際に表示される内容
graffe(グラーフ)は、「graph(グラフ)」と「giraffe(ジラーフ=キリン)」を組み合わせた造語です。
データビジュアライズ(グラフ)によって、キリンのように遠くを見通せるようになろう、という意味を込めて命名されました。
HTML/XMLの場合のエスケープシーケンス
HTML、XMLは、データの表現方法が異なり、「タグ」と呼ばれる「<」と「>」で括られたパーツを組み合わせてデータを表現します。そのため、HTML、XMLでは、「<」や「>」などを文字として表現するための、下記のようにエスケープシーケンスが異なります。(XMLについてはこちらを参照)
- ":シングルクォーテーション(’)
- &:アンパサンド(&)
- <:小なり(<)
- >:大なり(>)
- :半角スペース
- ©:コピーライト
このようにエスケープシーケンスは、アンパサンド(&)で始まりセミコロン(;)で終わる文字列で表現します。これらの表記を行わない場合、ホームページの表示では、文字が見えなかったり、タグが正しく解釈されずに画面レイアウトが崩れる場合があります。
¥マークの扱いに注意が必要
エスケープシーケンスを意図して使用し、特殊文字を表示している場合は問題ありませんが、¥マークを何の配慮もなく、プログラム内に記載したり、DBへのデータ取込を行うテキストファイル内に含まれている場合、¥マークをエスケープシーケンスの一部とOSが解釈し、エラーが発生したり、意図しない状態でデータが登録/表示する場合があります。そのため、¥マークの扱いには十分気をつけてください。
データ分析用語:索引