文字列のバイト数計算(UTF-8 / UTF-16 / Shift_JIS)
入力した文字列のバイト数を、UTF-8・UTF-16・Shift_JISで同時に表示します。Shift_JISはJIS X 0208に基づく正確な値です。データベースの文字数制限やファイルサイズの確認に。
計算結果
- UTF-8
- 24バイト
- UTF-16
- 24バイト
- Shift_JIS
- 18バイト
- Shift_JISで表現できない文字
- 0字
- 文字数
- 12文字
Shift_JISのバイト数は JIS X 0208 + ASCII・半角カナ に基づく正確な値です。Shift_JISに存在しない文字はバイト数に含めません。文字数はコードポイント単位です。
使い方
文字列を入力すると、UTF-8・UTF-16・Shift_JISの各エンコーディングでのバイト数と文字数が表示されます。改行を含む複数行の入力にも対応しています。
データの取り扱い
すべての計算はお使いのブラウザ内で行われ、入力値がサーバに送信されることはありません。
計算式の解説
UTF-8
1文字あたり1〜4バイト。ASCII(英数字・記号)は1バイト、全角ひらがな・漢字などは3バイト、絵文字など補助面の文字は4バイトです。
UTF-16
基本多言語面(BMP)の文字は2バイト、補助面の文字(絵文字など)はサロゲートペアで4バイトです(= JS文字列のコードユニット数 × 2)。
Shift_JIS
ASCIIと半角カナを1バイト、JIS X 0208に収録される文字(全角ひらがな・カタカナ・漢字・記号など)を2バイトとして数えた正確な値です。JIS X 0208 の収録判定は Unicode が公開する対応表から生成しています。Shift_JISに存在しない文字(多くの絵文字や一部の漢字など)はバイト数に含めず、「表現できない文字」として別に数えます。
よくある質問
- Shift_JISのバイト数は正確ですか?
- はい。JIS X 0208(Unicodeの対応表から生成)に収録される文字を2バイト、ASCII・半角カナを1バイトとして数えた正確な値です。Shift_JISに変換できない文字(多くの絵文字や一部の漢字など)はバイト数に含めず、「表現できない文字」の件数として別に表示します。
- ひらがな1文字は何バイトですか?
- UTF-8では3バイト、UTF-16では2バイト、Shift_JIS(目安)では2バイトです。エンコーディングによって異なります。
- 絵文字のバイト数はどうなりますか?
- 多くの絵文字は補助面(U+10000以上)にあり、UTF-8では4バイト、UTF-16でも4バイト(サロゲートペア)になります。本ツールの文字数はコードポイント単位で数えるため、サロゲートペアは1文字として数えます。
関連ツール
- 文字数カウント(空白除く・行数・原稿用紙換算)テキストの文字数を多機能にカウントします。空白・改行・制御文字を除く/含む文字数、行数、空白数・改行数・制御文字数、全角・半角の内訳、400字詰め原稿用紙の換算枚数を表示します。
- IPアドレス・サブネット計算(CIDR)IPv4アドレスとCIDRプレフィックス長から、サブネットマスク・ネットワークアドレス・ブロードキャストアドレス・利用可能ホスト範囲とホスト数を計算します。
- UNIXタイムスタンプ変換UNIXタイムスタンプ(epoch秒・ミリ秒)を日時に変換、または日時からUNIXタイムスタンプを計算します。JST・UTC両対応。
- cron式の日本語解説・次回実行時刻5フィールドのcron式(分 時 日 月 曜日)を日本語で解説し、次回の実行時刻5件(JST)を表示します。* , */n , 数値 , 範囲(n-m), カンマ区切りに対応。