高校「情報Ⅰ」単語帳 - 数研出版「高等学校 情報Ⅰ」 - コンピュータの仕組み

ハードウェア ⭐⭐⭐

コンピュータ本体や内部の装置、周辺機器などの物理的な実体を伴う装置や機器、およびその部品、部材のこと。それ自体には形がないソフトウェアと対比される。

コンピュータの場合、処理装置や記憶装置、入出力装置、電子基板、ケーブル類、筐体などの部品や部材、およびその総体として物理的実体としてのコンピュータのことをハードウェアという。「ハード」と略されることも多く、「HW」「H/W」などの略号で示されることもある。

これに対し、コンピュータプログラムやデータなど、それ自体は物理的な実体を伴わない要素のことを「ソフトウェア」(software)と総称する。ソフトウェアの記録や伝送、表示や実行には必ず何らかのハードウェアが必要となる。

コンピュータ以外の分野でも、施設や設備、機器、部品、資材といった物理的実体をハードウェアと呼ぶことがあり、付随する非物理的な要素と対比する文脈で用いられる。例えば、劇場の建物や設備をハードウェア、そこで催される公演をソフトウェアと呼んだり、教育機関の校舎や備品をハードウェア、提供される教育プログラムをソフトウェアと呼んだりすることがある。

英語の “hardware” の原義は金物、金属製品という意味で、機械や生活用品などについて、木製のものなどと対比して金属製であることを表す言葉だった。現代では金属製かどうかはあまり重視されず、工具や冶具、装置、設備、資材、軍用装備品などを広く総称する言葉として用いられることが多い。

TSS 【Time Sharing System】

コンピュータの処理時間を決まった短い時間に分割し、それぞれ異なる利用者やプログラムに順番に割り当てることで、並行して効率的にコンピュータを利用できるようにするシステム。

コンピュータが普及し始めた当初は個人用のコンピュータはなく、企業や官庁、大学などに設置された大型コンピュータを多数の利用者で共用する方式が一般的だった。

当時のコンピュータは一度に一つのプログラムしか実行できなかったため、利用者はプログラムやデータを用意してもすぐには実行できず、自分の番が回ってくるまで他の利用者の処理が終わるのを待たなければならなかった。

これに対し、タイムシェアリングシステム方式のコンピュータはCPUの実行時間を極めて短い単位に分割し、実行中のプログラムに順繰りに割り当てる。各プログラムはCPUを占有できないため処理性能は落ちるものの、利用者が使いたいときにすぐにプログラムを実行することができる。

低性能機を多数購入するより高性能機を少数購入したほうが価格性能比が高かった事情もあり、コストを極端に増やさずに利用者の利便性を向上させる手法として大型コンピュータの世界で広く普及した。

処理時間を細かく等分して複数の主体に割り当てるという手法自体は、現代のマイクロプロセッサ(MPU/CPU)やオペレーティングシステム(OS)でもマルチタスクやマルチスレッドなどとして応用され、当たり前の仕様となっている。

ハードディスク 【HDD】 ⭐⭐

コンピュータなどの代表的なストレージ(外部記憶装置)の一つで、薄くて硬い円盤(ディスク)の表面に塗布した磁性体の磁化状態を変化させてデータを記録するもの。一台あたりの容量が大きく容量あたりの単価が安いため、パソコンなどに内蔵されるストレージとして標準的な存在となっている。

構造・原理

装置内にはガラスや金属でできたプラッタ(platter)と呼ばれる円盤型の記憶媒体が数枚封入されており、表面には磁性体が塗布されている。これを回転軸で高速(毎分数千回)で回転させ、アームの先端に取り付けられた磁気ヘッドを近接させる。特定の箇所の磁化状態を変化させることでデータを書き込むことができ、状態を読み取ることでデータを読み出すことができる。

プラッタの直径は主流の製品で3.5インチ(約8.9cm)だが、小型の機器向けに2.5インチや1インチの製品も存在する。一台の装置にプラッタが1~8枚程度備え付けられ、通常はその両面を記録に用いる。内部的な制御や区画分けはプラッタごとに行われるが、外部から見た記憶領域としては全体で一つとなる。

他媒体との比較

「ハードディスク」とは硬い円盤という意味だが、これはフロッピーディスクなどのようにプラッタの素材に柔らかいプラスチックフィルムなどを用いる装置と対比した表現である。フロッピーディスクなどは記憶媒体と駆動装置(ドライブ)が分離していてディスクだけを取り外して交換したり持ち運べるが、ハードディスクはディスクとドライブが一体化しているため、「ハードディスクドライブ」(HDD:Hard Disk Drive)とも呼ばれる。

磁気ディスクや光学ディスクなどの中では最も記録密度が高く、同じ世代で比較すると装置(媒体)一台あたりの記憶容量は飛び抜けて大きい。読み書きも高速で、パソコンやサーバなどのコンピュータ製品では基幹的な記憶媒体として広く普及している。ドライブ一体型なこともあり一台あたりの価格が高いことや、振動に弱いという難点もある。

SSDへの置き換え

装置の寸法や接続仕様をハードディスクに揃え、内部の記憶媒体をフラッシュメモリに置き換えた製品はSSD(Solid State Drive)と呼ばれ、ハードディスクの代替として近年急速に浸透している。

読み書き速度が桁違いに速く衝撃にも強いという長所があるが、半導体メモリのため価格が高く一台あたりの容量も少ないという欠点があった。近年では低価格化と記憶容量の向上が劇的に進み、従来のハードディスクの用途を置き換える形で普及が加速している。

接続方式

コンピュータ本体に内蔵されるハードディスクの場合、接続インターフェースとして初期にはIDE/ATA(パソコン向け)やSCSI(サーバ・ワークステーション向け)が、2000年代以降はSATA(Serial ATA)が主に用いられている。独自の筐体を持ちケーブルでコンピュータと繋ぐ外付けの装置もあり、USBやIEEE 1394、eSATAなどの規格で接続される。

フラッシュメモリ

半導体素子を利用した記憶装置の一つで、何度も繰り返し書き込みができ、通電をやめても記憶内容が維持されるもの。近年、データを永続的に保存するストレージ(外部記憶装置)製品の記憶素子として急激に普及している。

フラッシュメモリは半導体メモリのうち、電源を落としても記録されたデータが消えない不揮発性メモリ(nonvolatile memory)に分類される。電気的に繰り返し自由に消去や再書き込みができる特徴はRAMと同じだが、技術的にはROM(の一種であるEEPROM)に由来するため「フラッシュROM」とも呼ばれる。

素子の構造や動作方式により大きくNAND型とNOR型の二種類に分かれる。最初に開発されたのはNOR型で、バイト単位で高速に読み出しができ、信頼性が高いが、後に開発されたNAND型の方が集積度を高めやすく、書き込みが高速であるという特徴の違いがある。

SLCとMLC

初期のフラッシュメモリはメモリセル(記憶素子)の電荷の有無にデジタル信号の「0」と「1」を対応付ける1ビット記録の素子(SLC:Single Level Cell/シングルレベルセル)が用いられた。後に、セルに投入した電荷量を段階的に識別することで1セルに複数ビットを保存できる素子(MLC:Multi-Level Cell/マルチレベルセル)が開発された。

初期のMLCは4段階識別・2ビット記録だったため、現在でもこれを指してMLCと呼ぶことが多いが、8段階識別・3ビット記録の「TLC」(Triple Level Cell/トリプルレベルセル)や、16段階識別・4ビット記録の「QLC」(Quad-Level Cell/クアッドレベルセル)も開発されており、MLCはこれら多値記録方式全体の総称を指すこともある。

特徴と用途

フラッシュメモリは磁気ディスクや光学ディスクなどに比べ、半導体素子に電気的にアクセスするためデータの読み書き速度が桁違いに速く、ドライブ装置に可動部がないため動作音もなく衝撃や振動にも強い。

ただし、素子の構造上劣化の進みが速く、初期には数百回程度、近年でも数万回程度の再書き込みによって素子が破損することが知られている。この点をカバーするため、制御回路により書き込み回数を各素子に均等に分散させる「ウェアレベリング」(wear leveling)と呼ばれる処理が行われる。

他方式のメディアに比べ価格も桁違いに高く小容量の製品しかなかったが、2000年代半ば頃からは量産効果や技術の進歩により飛躍的に低コスト化され、磁気ディスクなどの用途を奪う形で普及が拡大している。

主な用途としては、スマートフォンなどの携帯情報端末の内蔵ストレージや、数cm角の薄いプラスチックケースに収めたカード型の記憶媒体である「メモリーカード」、指先大の短い棒型や角型のケースに収めUSB端子でコンピュータに接続する「USBメモリ」などがある。

レジスタ ⭐⭐

マイクロプロセッサ(MPU/CPU)内部にある、演算や実行状態の保持に用いる記憶素子。最も高速な記憶装置だが、一般的なCPU製品で数個から数十個(容量に換算して数十バイト程度)と数が限られる。GPUなど特殊なプロセッサでは数万個(数百キロバイト)のレジスタを内蔵するものもある。

演算などの処理を行うためのデータをメインメモリ(RAM)やキャッシュメモリから読み出して置いたり、計算結果や途中経過などを保持したり、読み込みや書き出しを行うメモリ上のアドレス(番地)などを指し示したりするために用いられる。メモリ内の記憶素子のように番地によって識別されるのではなく、それぞれ個別の識別名が与えられている。

命令によって役割が決まっているものを専用レジスタ、特定の役割が割り当てられておらずプログラムの都合で様々な用途に使い回せるものを汎用レジスタという。プログラムからアクセスできずプロセッサ自身が内部的に使用するための特殊なレジスタ(内部レジスタ)を持つ製品もある。

専用レジスタの種類や役割はプロセッサの仕様により異なるが、多くの製品に共通するものとして、アキュムレータ、データレジスタ、アドレスレジスタ、インデックスレジスタ、ベースレジスタ、スタックポインタ、ステータスレジスタ(フラグレジスタ)、プログラムカウンタなどがある。

ビット ⭐⭐⭐

情報量の最小単位で、二つの選択肢から一つを特定する情報の量。コンピュータなどでは0と1のいずれかを取る二進数の一桁として表される。

語源は “binary digit” (二進法の数字)を繋げて省略した表現と言われる。情報をすべてビット列に置き換えて扱うことを「デジタル」(digital)という。1ビットのデータが表す情報量は、投げたコインの表裏のように、二つの状態のいずれであるかを示すことができる。

複数のビットを連ねて一つのデータとすることで、2ビットなら4状態(22)、3ビットなら8状態(23)といったように、より多い選択肢を識別できる。一般に、nビットのデータは2のn乗個までの選択肢からなる情報を表現することができる。

例えば、大文字のラテンアルファベットは「A」から「Z」の26文字であるため、これを識別するのには4ビット(16値)では足りず、5ビット(32値)が必要となる。小文字を加えると52文字であるため、6ビット(64値)が必要となる。

派生単位

データの読み書きや伝送を行う場合、その速さを表す単位として1秒あたりの伝送ビット数であるビット毎秒(bps:bit per second)という派生単位が用いられる。

また、実用上はビットでは値が大きくなりすぎて不便なことも多いため、8ビットをまとめて一つのデータとした「バイト」(byte)という単位を用いる場面も多い。かつて何ビットを1バイトとするか機種により様々に分かれていた(7ビットバイトや9ビットバイトなどが存在した)名残りで、8ビットの集まりを「オクテット」(octet)とも呼ぶ。

倍量単位

大きな量を表す際には、SI単位系に則って接頭辞を付した倍量単位を用いる場合がある。

  • 1000ビットを「キロビット」(kbit:kilobit)
  • 100万ビットを「メガビット」(Mbit:megabit)
  • 10億ビットを「ギガビット」(Gbit:gigabit)
  • 1兆ビットを「テラビット」(Tbit:terabit)
  • 1000兆ビットを「ペタビット」(Pbit:petabit)
  • 100京ビットを「エクサビット」(Ebit:exabit)

という。また、コンピュータでは2の冪乗を区切りとするのが都合が良いことが多いため、独自の接頭辞を付した倍量単位が用いられることもある。

  • 210(1024)ビットを「キビビット」(Kibit:kibibit)
  • 220(約104万)ビットを「メビビット」あるいは「ミービビット」(Mibit:mebibit)
  • 230(約10億7千万)ビットを「ギビビット」(Gibit:gibibit)
  • 240(約1兆1千億)ビットを「テビビット」あるいは「ティービビット」(Tibit:tebibit)
  • 250(約1126兆)ビットを「ペビビット」あるいは「ピービビット」(Pibit:pebibit)
  • 260(約115京)ビットを「エクスビビット」あるいは「イクシビビット」(Eibit:exibibit)

という。この2進専用の接頭辞はIEC(国際電気標準会議)が標準化しており、一般にはあまり馴染みがないが記憶容量の表記などで用いられることがある。

2の補数

ある自然数を2進数(2進法)で表現した時に、足し合わせるとちょうど桁が一つ増える最小の数のこと。コンピュータにおける負の整数の表現や数値演算などに応用される。

2進数における「基数の補数」と呼ばれる数で、ある数に足し合わせることで桁が一つ増え、最上位桁(値は「1」となる)以外はすべて「0」となるような数を指す。例えば、8桁の2進数「10010110」に対する2の補数は「1101010」であり、両者を足し合わせるとちょうど9桁の「100000000」となる。

これに対し、元の数に足し合わせると桁上りせず最も大きな数(「1111…」とすべての桁が1になる)となる補数は「1の補数」(2進数における減基数の補数)と呼ばれる。コンピュータでは1の補数はビット反転(NOT演算)によって求めることができ、これに1を加えると2の補数となる。

なお、2進数に限定せず2の補数という場合は、3進数における減基数の補数を指す場合もある。元の数に足し合わせると桁上りせず「2222…」とすべての桁が2になる数のことである。

浮動小数点数 ⭐⭐

コンピュータにおける数値の表現形式の一つで、数値を桁の並びを表す仮数部と小数点の位置を表す指数部に分割して表現する方式。小数点以下の値を含む数値の表現法として最も広く利用されている。

一つの数値を符号部(正負)、仮数部、指数部の3つのデータの組み合わせで表現(データ形式としては符号-指数-仮数の順に格納することが多い)する。仮数に基数(通常は2)を指数乗した値を乗じ、符号を付け加えたものが表現する数値となる。

例えば、「-4.375」は2進数では「-100.011」であり、仮数と指数に分離すると「-1.00011×1010」(値はすべて2進表記)となる。符号は正を0、負を1とすることが多いため、符号部の値は「1」、仮数部の値は「100011」、指数部の値は「10」となる。数値が0の場合は符号と指数は不定となるが、便宜上各部をすべて0としたもの(+0.0×100)を0の表現として扱うことが多い。

IEEE 754形式

浮動小数点数は全体のデータ長や仮数部と指数部のビット数の配分などで様々な形式が存在するが、広く普及している標準規格としてIEEE 754形式が知られる。

全体で16ビット(符号1+指数5+仮数10)の「半精度浮動小数点数」、32ビット(符号1+指数8+仮数23)の「単精度浮動小数点数」、64ビット(符号1+指数11+仮数52)の「倍精度浮動小数点数」、128ビット(符号1+指数15+仮数112)の「四倍精度浮動小数点数」の4つの形式が定められており、それぞれ表現できる数値の幅の異なる。実用上は単精度と倍精度がよく用いられ、プログラミング言語や論理回路などでもこの2つに標準で対応しているものが多い。

仮数の2進数表現は先頭が必ず1になる(2以上の数字は使わない)ため、これを省略して代わりに下位の桁の表現に回す手法(俗にケチ表現という)が用いられる。また、指数部を符号なし整数とするため、本来の値に最大値の半分-1を足した表現(俗にゲタ履き表現という)を用いる。例えば指数部が8ビットの場合は127を加え、128が1を、126が-1を表す。

単精度浮動小数点数 (single precision floating point number)

数値を仮数部と指数部に分けて表現する浮動小数点数の形式の一つで、一つの数値を32ビットのデータで表現する方式のこと。多くのプログラミング言語などでは単に浮動小数点といえば単精度を意味し、“float” などの名称で表されるデータ型が用意されている。

IEEE 754標準で規定された形式では32ビットのうち先頭1ビットが正負の符号部(0が正、1が負)、続く7ビットが指数部(基数は2)、残り24ビットが仮数部となる。表現できる値の大きさの範囲は十進表記で約1.2×10-38~約3.4×1038であり、精度は十進7桁程度となる。

倍精度浮動小数点数 (double precision floating point number)

数値を仮数部と指数部に分けて表現する浮動小数点数の形式の一つで、一つの数値を64ビットのデータで表現する方式のこと。多くのプログラミング言語などが高精度な数値計算のために組み込みデータ型として用意しており、 “double” などの名称で表される。

IEEE 754標準で規定された形式では64ビットのうち先頭1ビットが正負の符号部(0が正、1が負)、続く11ビットが指数部(基数は2)、残り52ビットが仮数部となる。表現できる値の大きさの範囲は十進表記で約2.2×10-308~約1.8×10308であり、精度は十進16桁程度となる。

アンダーフロー

コンピュータで実数の計算をした結果、絶対値が小さすぎて正確に表現・計算できなくなってしまうこと。

コンピュータでは実数を浮動小数点数という形式で表すが、一つの値を表すためのデータ長が決まっており、表現できる値の範囲も限られている。計算結果の絶対値が表現可能な最小の値より小さくなってしまうことをアンダーフローという。

例えば、一つの値を32ビットのデータで表す単精度浮動小数点数(float型)では、表現できる値の範囲は十進表記で約1.2×10-38~約3.4×1038であるため、指数部が10-39を下回る場合には正しく値を表現できなくなる。

実際にアンダーフローが生じた際の動作はプログラミング言語や処理系によっても異なるが、仮数部を規定(通常は仮数の先頭が1になるよう正規化される)よりも小さくすることで表現できる範囲では、指数部を下限値にしたまま仮数部の先頭から0を詰めていく処理が行われる場合がある。

さらに値が小さくなっていき、仮数部の桁を使い切ってしまうと、どうやってもそのような値は表現することができないため、値が完全に0になってしまうことが多い。除算を組み合わせた計算の途中でアンダーフローが起きると、意図せずゼロ除算が生じて実行時エラーとなってしまう場合があるため注意が必要である。

負数のオーバーフロー

よく勘違いされるが、負の数が表現可能な下限を超え、正しく値を表現できなくなるのは「オーバーフロー」(桁あふれ)の一種である。絶対値が表現可能な上限を超えることによって発生し、下限より小さくなるアンダーフローとは区別される。

オーバーフロー 【桁あふれ】

あふれ(る)、あふれ出たもの、という意味の英単語。ITの分野では、数値の計算結果がその格納領域に収まる範囲を超えること(算術オーバーフロー/桁あふれ)や、与えられたデータが多すぎて指定の領域に収まりきらないこと(バッファオーバーフローなど)を指す。

算術オーバーフロー

コンピュータ内部で一般的な数値データを格納するメインメモリ上の領域やCPU内部のレジスタは、一つの数値を決まったデータ量で表すようにできており、取り扱える数値の大きさや桁数に上限がある。

数値を計算した結果がこの上限を超え、正しく格納・表現できなくなってしまうことを「オーバーフロー」という。例えば、1バイトの符号なし整数型は0から255までの整数を表現できるため、「150×2」という計算の結果を格納しようとすると上限を超えてしまいオーバーフローとなる。

オーバーフローが発生した際の対処方法として、例外を引き起こして例外処理ルーチンによって何らかの対処を行う場合、実行時エラーを出力してプログラムを停止する場合、表現可能な上限値を設定する場合、上限を超えたことを示す特殊な値を格納する場合、単に無視する場合などがある。

オーバーフローを無視してそのまま処理を続行した場合、あふれた上位の桁が消滅して奇妙な値が計算結果となったり、メモリ領域上の隣接する無関係の区画にあふれた数値データの一部を書き込んで内容を破損させてしまうといった事象が起きる場合もある。

負数や浮動小数点数の場合

オーバーフローが起きるかどうかは桁の大きさの問題であるため、符号付き整数の場合には負数の値が下限を超えた場合(絶対値の桁数が上限を超えた場合)にも発生する。また、浮動小数点の場合には指数部の大きさが上限値よりも大きくなった場合にそれ以上大きな値を表すことができずオーバーフローとなる。

アンダーフロー(underflow)

浮動小数点数において、値の絶対値が小さくなりすぎ(小数点以下の0の桁数が長くなりすぎ)て正しく値を表現できなくなる現象を「アンダーフロー」(underflow)という。指数部が下限値より小さくなることで発生し、0に置き換えられてしまうことで除算や乗算の結果が大きく狂うといったことが起きる。

メモリ領域のオーバーフロー

外部からデータを受け取ってメモリ上の領域に保存するようなプログラムで、指定された領域のサイズを超えてデータを受け取ってしまい、隣接する別の区画にデータをあふれさせてしまうことを「オーバーフロー」あるいは「オーバーラン」(overrun)ということがある。

無関係の領域にデータを書き込んでしまうことにより、処理が停止したり、予期しない動作が発生することがある。バッファ領域について発生するものを「バッファオーバーフロー」、スタック領域について発生するものを「スタックオーバーフロー」という。

ネットワークを通じて外部からコンピュータを乗っ取る攻撃手法の一つとして、不正なデータを送りつけて受信プログラムにわざとオーバーフローを発生させ、攻撃用のプログラムコードを実行するよう仕向ける手法があり、「バッファオーバーフロー攻撃」と呼ばれる。

端数処理 【丸め処理】

長い桁の数から、特定の短い桁の概数を求めること。「丸め処理」「丸め」とも言う。規定の桁数を超える部分をどう扱うかによっていくつかの方法がある。

例えば、「123.45」という数値を整数に丸める場合、整数部分だけを残して「123」とする処理を「切り捨て」、小数部分を「1」とみなして「124」とする処理を「切り上げ」という。また、小数部分が0.5以上なら切り上げ、0.5未満なら切り捨てる処理を「四捨五入」という。

負数を丸める場合、「-1.5の切り捨て」を絶対値の小数部分を切り捨てて「-1」とするか、正数と同じ方向に値を減らして「-2」とするか考え方が分かれる。通常は前者を採用するが、正確に伝えたい場合は前者を「0への丸め」、後者を「負の無限大への丸め」と呼ぶことがある。

切り上げについても、絶対値に着目して「-1.5」を「-2」とする考え方を「無限大への丸め」、値の増減に着目して「-1.5」を「-1」とする考え方を「正の無限大への丸め」という。四捨五入は正数と同じく最も近い値に丸めるのが原則だが、コンピュータでは端数がちょうど0.5の場合の処理が処理系によって異なる場合がある。

切り上げ、切り捨て、四捨五入の他にも、四捨五入で端数がちょうど0.5の場合は結果が偶数になるように丸める「偶数への丸め」、端数が0.5の場合に奇数になるように丸める「奇数への丸め」、端数0.5までは切り捨てて0.5よりも大きければ切り上げる「50捨51入」などもある。

プログラミング言語や表計算ソフトなどでは、四捨五入を表す関数名やメソッド名には「round」が、切り上げには「ceil」(「天井」の意)または「roundup」が、切り捨てには「floor」(「床」の意)あるいは「rounddown」が用いられることが多い。

ソフトウェア ⭐⭐⭐

コンピュータを動作させる命令の集まりであるコンピュータプログラムを組み合わせ、何らかの機能や目的を果たすようまとめたもの。プログラムが動作するのに必要なデータも含まれる。

コンピュータを構成する電子回路や装置などの物理的実体を「ハードウェア」(hardware)と呼ぶのに対し、それ自体は形を持たないプログラムや付随するデータなどをソフトウェアという。物理的には記憶装置(ストレージやメモリなど)の記録媒体における電気的あるいは磁気的、光学的な信号として存在する。

ソフトウェアはその役割により、ハードウェアの制御や他のソフトウェアへの基盤的な機能の提供、利用者への基本的な操作手段の提供などを行なう「オペレーティングシステム」(OS:Operating System/基本ソフト)と、特定の個別的な機能や目的のために作られた「アプリケーションソフト」(application software/応用ソフト)に大別される。

これらに加え、ハードウェアに組み込まれ基本的な制御を行う「ファームウェア」(firmware)や、OSとアプリケーションソフトの中間で特定分野の基本機能や共通機能を提供する「ミドルウェア」(middleware)などの分類が用いられることもある。

日本語の外来語としては慣用的に「ソフト」と略称することが多いが、英語の “soft” は「柔らかい」という形容詞の意味しかなく、組織名や製品名のネーミングなどで接頭辞や接尾辞のように用いられる場合などを除き、省略せず “software” と綴る。「SW」「S/W」などの略号で示されることもある。

プログラム以外の用例

コンピュータプログラムは含まないが、何らかの機器を介して内容の再生や鑑賞を行う記録物のことをソフトウェアと呼ぶ場合がある。例えば、音楽CDのような音声の記録物を「音楽ソフト」、DVD-Videoのような動画の記録物を「映像ソフト」のように呼ぶ。

IT関連以外の分野でも、施設や設備、機器、道具などの物理的実体と対比して、組織や業務、事業、催し、知識、技能、情報、記録といった人間の活動に属する無形の事柄をソフトウェアと呼ぶ場合がある。

記録物やイベントなどの用法については「コンテンツ」(content)もほぼ同義語であり、20世紀にはソフトと呼ぶことが多かった分野や業界でも現在ではコンテンツと呼ぶ方が一般的な場合が多い。

OS 【Operating System】 ⭐⭐⭐

ソフトウェアの種類の一つで、機器の基本的な管理や制御のための機能や、多くのソフトウェアが共通して利用する基本的な機能などを実装した、システム全体を管理するソフトウェア。

CPU(MPU/マイクロプロセッサ)や主記憶装置(メインメモリ)、外部記憶装置(ストレージ)、入出力装置などコンピュータのハードウェア資源の管理、外部の別の装置やネットワークとのデータ通信の制御などが主な役割で、コンピュータに電源が投入されると最初に起動し、電源が落とされるまで動作し続ける。

利用者に対するコンピュータの基本的な操作手段も提供し、入力装置による操作の受け付けや出力装置への情報の提示、オペレーティングシステム自体が備える様々な機能の実行、記憶装置内に格納されたプログラムの起動や終了、ストレージに格納されたファイルやディレクトリの操作などを行うことができる。

アプリケーションソフトとの関係

オペレーティングシステムの機能を利用し、OSの上で動作するソフトウェアを「アプリケーションソフト」(application software/応用ソフト)という。アプリケーションの開発者は、呼び出し規約(API:Application Programming Interface)に基づいてオペレーティングシステムの提供する機能を利用することができ、開発の手間を省き操作性を統一することができる。

また、ハードウェアの仕様の細かな違いはオペレーティングシステムが吸収してくれるため、あるオペレーティングシステム向けに開発されたアプリケーションは、基本的にはそのオペレーティングシステムが動作する他のコンピュータでも使用できる。ただし、CPUの種類が異なるなど根本的な仕様が異なる場合は、同じOSでも機種ごとに調整されたプログラムが必要となる。

OSの種類

OSは動作する機器の種類や目的などに応じていくつかの異なるタイプに分かれる。最も一般的なのはパソコンやサーバなどの汎用コンピュータ向けの汎用OSで、サーバコンピュータの運用に特化した「サーバOS」、利用者が操作する端末での利用を想定した「クライアントOS」などに分かれる。

汎用OS以外にも、デジタル家電や産業機械などに制御用として組み込まれた特定目的の専用コンピュータの制御に特化した「組み込みOS」がある。中でも、乗り物の駆動装置の制御など、リアルタイム性の高い制御プログラムの実行に特化した設計のOSは「リアルタイムOS」と呼ばれる。

パソコン向けのOSとして広く利用されているものには米マイクロソフト(Microsoft)社の「Windows」シリーズや米アップル(Apple)社の「macOS」(旧Mac OS X)シリーズなどがある。サーバ向けのOSとしては「Linux」などのいわゆるUNIX系OSや、サーバ向けWindowsである「Windows Server」シリーズなどがよく知られる。スマートフォンやタブレット端末などのモバイル機器では米グーグル(Google)社の「Android」とApple社の「iOS」(iPad OS/watchOS)が市場を二分する。

ファイル ⭐⭐

コンピュータにおけるデータの管理単位の一つで、ストレージ装置(外部記憶装置)などにデータを記録する際に利用者やオペレーティングシステム(OS)から見て最小の記録単位となるデータのまとまり。

利用者がコンピュータを用いて記憶媒体にデータを保存、読み込み、移動、削除などする際に一つのまとまりとして取り扱うデータの集合を表し、OSの一部であるファイルシステム(file system)によって管理される。

ハードディスクやSSD、USBメモリ、光学ディスク(CD/DVD/Blu-ray Disc)などの記憶装置・記憶媒体を利用する際に用いられるほか、コンピュータと周辺機器の間やコンピュータ間の通信においてもデータの送受信単位として利用される。

ディレクトリとパス

ファイルシステムは記憶媒体内でファイルの作成や削除、上書き、移動、複製などを管理する仕組みで、複数のファイルをまとめて一つの集まりとして扱う「ディレクトリ」(directory)や「フォルダ」(folder)などの入れ物(領域)を作成することもできる。

ディレクトリやフォルダの中に別のディレクトリやフォルダを作成し、入れ子状にすることもでき、記憶媒体全体を階層構造に整理して管理する。装置内でのファイルの位置は、「C:¥Windows¥System32¥cmd.exe」のように最上位から順にディレクトリ名を繋げた「パス」(path)という記法で表される。

ファイル名

ファイルにはそれぞれ固有のファイル名が付けられ、これを用いて識別・指定される。多くのOSではファイル名の末尾にファイルの種類や形式を表す「拡張子」(extension)と呼ばれる数文字の英数字の符号が付与される。

コンピュータの操作画面ではファイルは記憶媒体内での位置(パス)やファイル名で表示され、キーボードなどからパスやファイル名を指定して操作する。グラフィック表示を用いるGUI(Graphical User Interface)を備えたOSでは、ファイルは種類によって異なるアイコン(絵文字)とファイル名によって表示され、マウス操作やタッチ操作でアイコンを指し示して操作を行う。

ファイル属性

ファイルはファイルシステムに記録される際に様々な属性や付加情報(メタデータ)と共に記録される。作成日時や最終更新日時、最終アクセス日時、作成者(所有者)、各利用者やグループのアクセス権限などが記録、設定される。

また、多くのOSではファイルに「読み取り専用」属性を付与でき、解除されるまで削除や上書きができなくなる。「隠しファイル」に設定されたファイルは通常の動作モードではファイル一覧画面などに表示されなくなる(ファイル名を直に指定すれば操作はできる)。

ファイル形式

ファイルに記録されるデータの形式や書式(ファイルフォーマット)は作成したソフトウェアによって様々だが、大きく分類すると「バイナリファイル」(binary file)と「テキストファイル」(text file)に分かれる。

バイナリファイルは特に制約なくあらゆるビットパターンを記録できる自由な形式で、その形式に対応したソフトウェアでなければ何が記録されているか知ることができない。テキストファイルはデータを文字情報として記録したファイルで、文字コード規格で規定されたコードに従ってデータを文字列に置き換えて記録する。対応ソフトがなくてもどのような文字が記録されているかは見ることができる。

ディレクトリ ⭐⭐

電話帳(phone~)、住所録、名鑑、要覧、指導書、規則集などの意味を持つ英単語。IT関連では、多数の対象をその所在などの情報と共に一覧できるよう整理したものを意味することが多い。

ファイルシステムのディレクトリ

ストレージ(外部記憶装置)のファイルシステムなどで、複数のファイルを格納し、ファイルを分類・整理することができる保管場所のことをディレクトリということがある。OSによっては同様の仕組みを「フォルダ」(folder)ということもある。

ストレージ内部を論理的に区切って名前をつけて区別する仕組みで、ディレクトリ名によって識別される。ディレクトリ内には任意のファイルを置くことができるほか、別のディレクトリを作成して入れ子状にすることができる。ディレクトリ内に作られたディレクトリは「サブディレクトリ」(subdirectory)あるいは「子ディレクトリ」などと呼ばれる。

ディレクトリの入れ子関係は、システムやストレージ領域の全体を表すディレクトリを頂点とする階層構造(あるいは木構造)として表すことができ、これを根本から先端に向かって枝分かれする樹木の形になぞらえて「ディレクトリツリー」と呼ぶことがある。

UNIX系OSでは、ストレージや他のシステム資源全体を包含する「ルートディレクトリ」(root directory)を頂点として、Windowsでは各ドライブごとにその内部を包含する「ドライブルート」(drive root)を頂点として、それぞれディレクトリの位置を指し示す。

ストレージ内でのディレクトリやファイルの所在は、「/foo/var/hoge.txt」のようにルートからの経路を順に並べた「パス」(path)によって表す。UNIX系OSでは区切り文字として「/」(スラッシュ)を用いるが、Windowsでは「C:\foo\var\hoge.txt」のように「\」(バックスラッシュ)を用いる。日本語版では同じ文字コードを共有している円マーク(¥)になる。

ディレクトリサービス (directory service)

情報システムの一種で、ネットワーク上に存在する機器やサービスについての情報や、利用者の識別や権限に関する情報を一元管理する仕組みのことを「ディレクトリサービス」(directory service)あるいは単にディレクトリという。

原義の電話帳に近い役割をコンピュータネットワーク上で果たすシステムで、登録利用者のアカウント情報(ユーザー名やパスワード、各種の権限など)、ネットワーク上のサーバコンピュータが提供する機能、共有データ(共有ファイル、共有ディレクトリなど)、プリンタなどの周辺機器についての情報を集めて単一のデータベースに登録して管理する。

利用者はディレクトリにアクセスすることでネットワーク上の資源の所在を知ることができ、個々の資源に対して権限の確認をしなくても、一度のログイン操作で許可された資源を自由に利用できるようになる。米マイクロソフト(Microsoft)社がWindows Serverなどで提供しているActive Directory(アクティブディレクトリ)が特に有名である。

拡張子

ファイル名の末尾で「.」(ドット/ピリオド)の後ろにある英数字1~4文字程度の符号。ファイルの種類やデータ形式を表している。

一般的なコンピュータのストレージ(外部記憶装置)では、データを「ファイル」というかたまりに分けて保管している。各ファイルはシステムや利用者が命名した「ファイル名」によって識別されるが、その末尾にある「.」より後の部分を拡張子という。例えば、「新しいテキスト ドキュメント.txt」というファイル名の拡張子は「.txt」(あるいは「txt」)である。

拡張子はファイルの種類や形式を表すために付与されるもので、慣例として1~4文字程度の半角英数字の組み合わせが用いられることが多い。現代のほとんどのファイルシステムには文字数や文字種の制限はないが、かつてパソコン用OSとして普及していた「MS-DOSエムエスドス」には半角3文字(3バイト)までの制約があったため、後継のWindowsや他のシステムでも習慣的に(ピリオドを除いて)3文字の拡張子が多い。

複数のファイル形式が複合的に用いられている場合には「backup.tar.gz」のように二重に拡張子を付与することがある。この例の場合、複数のファイルをtar形式で一つにまとめ(アーカイブ)、gzip形式で圧縮したファイルという意味になる。ファイル形式自体は最後尾(.gz)の拡張子が表している。

拡張子の機能

Windowsではファイルを指定して開くよう指示すると拡張子を元に関連付けられたアプリケーションソフトを自動的に起動するようになっている。このため、システムが内部で使用する特殊なファイルなどを除き、原則としてすべてのファイルに拡張子が付与されている。

LinuxなどのUNIX系OSでは、ファイル名を見ただけで形式が分かるよう利用者にとっての便宜のために付けられるだけで、システム上の動作を指定するような働きはない。macOS(Mac OS X)ではファイルの種類の判別に独自の仕様を用いるが、一部のバージョンでは拡張子も用いる。

OS以外でも、例えばWebサーバやWebブラウザがファイルを送受信する際、データの種類を指定するMIMEタイプが不明な場合などにファイル名の拡張子を頼りにファイル形式を判断するといった用途に用いられている。システムが拡張子を利用しないUNIX系OSでも、ソフトウェアによっては拡張子を見てファイル形式を判断する動作を行うものがある。

拡張子の表示・変更

OSのデスクトップ画面やエクスプローラーなどのファイル管理システムでファイルやフォルダの一覧を表示すると、アイコン画像と共にファイル名が表示される。近年のWindowsやmacOSでは既定(デフォルト)の動作が拡張子非表示となっており、設定を変更しないと表示されるようにならない。

拡張子はファイル名本体と同じで利用者が自由に変更できるが、みだりに変更すると正しいソフトウェアで開けなくなる場合がある。実際のファイル形式と一致しているかチェックする仕組みなどはないため、拡張子を誤読させて利用者に実行させる(内容を閲覧するつもりでプログラムとして実行してしまう)手口を用いるコンピュータウイルスなども存在する。

プログラム ⭐⭐⭐

予定(表)、計画(表)、課程、式次第などの意味を持つ英単語。ITの分野では、コンピュータに行わせる処理を記述したコンピュータプログラムのことを略して単にプログラムということが多い。

コンピュータプログラム (computer program)

コンピュータが行うべき処理を順序立てて記述したもの。広義の「ソフトウェア」の一部であるが、実用上はプログラムとソフトウェアはほとんど同義のように扱われることが多い。

現代のコンピュータではプログラムは一定の形式に従ってデータとして表現され、記憶装置(メインメモリ)に格納される。実行時にはCPU(中央処理装置)がプログラムに記述された命令を順番に読み出して解釈・実行していく。

プログラムを作成する作業や工程を「プログラミング」(programming)、これを行う人や職種のことを「プログラマ」(programmer)という。人間がプログラムを記述する際には、人間が理解しやすい人工言語である「プログラミング言語」(programming language)を使うことが多い。プログラミング言語で記述されたプログラムを「ソースコード」(source code)という。

ソースコードはコンピュータが解釈・実行することができないため、コンパイラなどの変換ソフトによってコンピュータが解釈・実行できる機械語(マシン語)などで構成された「オブジェクトコード」(object code)に変換されてから実行される。スクリプト言語のように、この変換処理を開発時には行わず、実行時にインタプリタなどのソフトウェアによって動的に行う場合もある。

ソースコード 【ソースプログラム】 ⭐⭐

プログラミング言語などの人間が理解・記述しやすい言語やデータ形式を用いて書き記されたコンピュータプログラムのこと。プログラムに限らず、人工言語や一定の規約・形式に基いて記述された複雑なデータ構造の定義・宣言などのこともソースコードと呼ぶ場合がある。

コンピュータへの指示や一連の処理手順などをプログラミング言語によって文字データの羅列として表記したもので、そのままではコンピュータ(のCPU)では実行できないため、CPUが直に解釈できる命令コードの体系である機械語(マシン語)によるプログラムに変換されて実行される。

変換後の機械語による実行可能プログラムを「オブジェクトコード」(object code)、「オブジェクトプログラム」(object program)、「ネイティブコード」(native code)、「ネイティブプログラム」(native program)、「バイナリコード」(binary code)などと呼ぶ。

実行可能形式への変換

ソースコードからオブジェクトコードへの変換はソフトウェアによって自動的に行うのが一般的となっている。アセンブリ言語で記述されたソースコードを変換することを「アセンブル」(assemble)、そのようなソフトウェアを「アセンブラ」(assembler)という。

アセンブリ言語以外の高水準言語で記述されたソースコードを一括して変換することは「コンパイル」(compile)と言い、そのようなソフトウェアを「コンパイラ」(compiler)という。実行時に少しずつ変換しながら並行して実行するソフトウェアもあり、「インタプリタ」(interpreter)と呼ばれる。

開発時にソースコードから直接オブジェクトコードへ変換せずに、特定の機種やオペレーティングシステム(OS)の仕様・実装に依存しない機械語風の独自言語による表現(中間コード)に変換して配布し、実行時に中間コードからCPU固有の機械語に変換するという二段階の変換方式を用いる言語や処理系もある。

ソースコードの作成

ソースコードは多くの場合、人間がキーボードなどを操作して文字を入力して記述する。この作業・工程を「コーディング」(coding)という。ソースコードはテキストデータの一種であるため文書編集ソフトで作成することはできず、テキストエディタや統合開発環境(IDE)に付属する専用のコードエディタなどを用いることが多い。

必ずしも人間が記述するとは限らず、何らかの元になるデータや入力からソフトウェアによって生成したり、別の言語で記述されたソースコードを変換して生成したり、オブジェクトコードを逆変換してソースコードに戻したりといった方法で、ソフトウェアが自動的・機械的に作成する場合もある。

ソースコードの公開・非公開

日本を含む多くの国でソースコードは著作物の一種として著作権で保護されている。販売される商用ソフトウェア製品の多くは、ソースコードを企業秘密として非公開とし、人間に可読でない中間コードやオブジェクトコードによる実行プログラムのみを利用者に提供している。

一方、ソースコードを公開し、誰でも自由に入手、利用、改変、再配布、販売などができるようにしている場合もある。そのようなソフトウェアを、ソースコードがオープンになっているという意味で「オープンソースソフトウェア」(OSS:Open Source Software)という。ボランティアのプログラマが個人あるいは共同で開発しているソフトウェアに多いが、企業がOSSを開発・公開している例も多く見られる。

TRON 【The Real-time Operating system Nucleus】

あらゆる機器、施設、設備にコンピュータが内蔵され、それらが相互に通信して連携動作する社会の到来を想定し、その中核となるコンピュータやソフトウェアのアーキテクチャ(基本設計)を構築することを目指すプロジェクト。1984年に当時東京大学助手だった坂村健氏が開始した。

人間を取り巻く様々なモノにICチップやコンピュータシステムが組み込まれ、それらがネットワークで接続され協調動作することで社会インフラとして機能するシステムを「HFDS」(Highly Functionally Distributed System:超機能分散システム)と呼び、その実現に向けて各種技術のオープンな仕様の策定を推進した。特に、電子機器に組み込まれてその制御を司るリアルタイムOSの共通仕様の策定・普及で大きな役割を果たした。

TRONでは主にデータ形式やインターフェース仕様、利用者の操作体系(HMI:Human Machine Interface)などの仕様を策定し、ソフトウェアやハードウェアそのものの仕様や実装はほとんど規定していない。これは、システムを構成する要素間の互換性や接続性が確保されていれば、個々の製品の仕様は開発者が自由に決定すべきとする基本方針による。

TRONプロジェクト全体はいくつかのサブプロジェクトに分かれており、

  • CPU仕様を策定する「TRONCHIP」(TRON仕様チップ)
  • 組込み機器用リアルタイムOSの仕様を策定する「ITRON」(Industrial TRON)
  • パソコンなどの人間が直接操作するコンピュータの装置やOSの仕様を策定する「BTRON」(Business TRON)
  • 通信機器のOSやネットワークシステムの技術基盤を確立する「CTRON」(Communication and Central TRON)
  • HFDSの構成要素を有機的に結びつけ連携させるOSの実現を目指す「MTRON」(Macro TRON)

などの研究・開発プロジェクトが置かれた。最も広く産業応用が進んだのはITRONで、後にITRONを核として「μITRON」や「JTRON」「eTRON」「T-Engine」などの派生プロジェクトが誕生した。

μITRON (micro ITRON)

TRONプロジェクトが策定している、産業機器などへの組み込みシステムに搭載するリアルタイムOSの標準仕様をμITRON(マイクロアイトロン)という。同仕様を策定するTRONプロジェクトのサブプロジェクトの名称でもある。

産業機器や輸送機械、家電製品、情報・通信機器などに組み込むコンピュータシステムを制御するためのOSの標準仕様を定めたもので、この仕様に準拠したOSを企業などが開発している。μITRON準拠のOSは様々な機器・プロセッサ向けに数十種類が存在すると言われる。

組み込みシステムの事情に即し、詳細で厳密な標準化やハードウェアの抽象化を避け、個々のOSの実装によりハードウェアの性能や機能を発揮できるようになっているが、μITRON準拠OS間の互換性が低く、ソフトウェアの移植性や再利用性が低いという問題もある。

最初のITRON仕様は1987年に発表され、1989年に後継のフルセット規格ITRON2と、小規模システム向けに仕様を絞り込んだμITRON2が発表された。その後、μITRONの方が広く普及したため、バージョン3.0からはμITRONが規格名称となり、仕様の縮小に関する規約も仕様本体に取り込まれた

ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる