バイト 【byte】
情報量の最小の単位であるビット(bit)は2つの状態(0と1、オンとオフなど)を識別できるが、バイトはこれを8つ並べて一つの単位としたもので、各ビットの状態の組み合わせで256の状態を識別することができる。
単位として数値の後に付ける際にはアルファベット大文字の「B」が用いられるが、ビットを小文字の「b」で表すことが多いため、両者の混同を避けるために「byte」あるいは「bytes」と省略せずに(同様にビットは「bit」「bits」)記すことも多い。通信速度を表す場合は1秒あたりに伝送可能なバイト数を「バイト毎秒」という単位で表す。記号は「B/s」または「Bytes/s」を用いる。
接頭辞付きの単位
大きな量を表す場合はSI単位系に定められた接頭辞を付加し、1,000倍あるいは1,024倍ごとにキロバイト(KB:kilobyte)、メガバイト(MB:megabyte)、ギガバイト(GB:gigabyte)、テラバイト(TB:terabyte)などの単位を用いる。接頭辞は他の物理量のように1,000の累乗倍を表す場合と、情報処理の分野で切りの良い1,024(2の10乗)の累乗倍を表す場合があり、混乱が生じている。
IEC(国際電気標準会議)では1,024倍を表す場合は「KiB」(kibibyte、キビバイト)、「MiB」(mebibyte、メビバイトまたはミービバイト)、「GiB」(gibibyte、ギビバイト)、「TiB」(tebibyte、テビバイトまたはティービバイト)など専用の接頭辞を用いるよう提唱しているが、現状ではあまり定着していない。
nビットバイトとオクテット
もともと1バイトが何ビットか明確な定義はなく、機種や処理系によって都合の良いビット数が割り当てられていた。1バイトをnビットで表すことを「nビットバイト」と呼び、1980年代頃までは6ビットバイトや7ビットバイトなど、8ビット以外のバイトを単位とするコンピュータもあった。現代では歴史的な文脈以外で8ビット以外のバイトが用いられることはなくなったため、1バイトは8ビットであると説明される。
このようなバイトの定義の曖昧さを避けるため、必ず8ビットを表す単位として「オクテット」(octet)が用いられることがある。機種や処理系の違いを超えて共通して利用される文脈(通信プロトコルの仕様書など)では、古い時代の名残りで現在でもバイトと言わずにオクテットが好まれる場合がある。