読み方 : ジージーエムエル

GGML【Georgi Gerganov Machine Learning】

GGMLとは?

大規模言語モデルLLM)をGPUのない一般的なパソコンで動かすことを目的に開発された、C言語で書かれたオープンソースライブラリ。また、同ライブラリで作られたモデルを保存するためのファイル形式。ブルガリア出身の著名なソフトウェア開発者ゲオルギ・ゲルガノフ(Georgi Gerganov)が開発した。
GGMLのイメージ画像

通常、最新の大規模言語モデルLLM)を動かすには高性能なGPUと大容量のメモリが必要であり、一般の利用者が手軽に試せる環境ではなかった。GGMLはこの障壁を下げるため、「量子化」と呼ばれる圧縮技術を採用し、必要な計算資源を劇的に削減する。

AIモデルにおける量子化とは、モデルのパラメータを通常の32ビットや16ビット浮動小数点数から4ビットや8ビットの整数へと落とし込む処理で、ファイルサイズとメモリ使用量を大幅に削減できる。精度はわずかに低下するものの、会話や文章生成といった一般的な用途では実用上の支障はほとんどない。

内部構造としては、計算グラフをあらかじめ構築して順に実行する方式が採用されており、CPUSIMD命令を活かした行列演算やベクトル演算の最適化が施されている。外部の深層学習フレームワークに依存しない単純な構成のため、WindowsやmacOS、Linuxをはじめ、スマートフォンや組み込み機器など幅広い環境で動作する。依存関係の管理が少なく済む点も、広く普及した一因である。

GGMLが一躍注目を集めたのは、同氏が開発した「llama.cpp」がきっかけである。米メタ(Meta Platforms)社の「LLaMA」モデルをGGML形式に変換し、一般的なパソコン上での動作に成功したこのプロジェクトは、公開直後から世界中の開発者の注目を集めた。これを機に、Hugging Faceなどのプラットフォームには量子化済みモデルが多数公開され、専用ハードウェアを持たない利用者でもローカルLLMを試せる環境が広がった。

2023年にはファイル形式としてGGMLの後継として「GGUF」形式が登場した。メタデータの扱いや拡張性が改善されており、llama.cppをはじめOllamaLM StudioといったローカルLLM実行ツールがGGUFを標準として採用するようになっている。GGML形式が直接使われる場面は減りつつあるが、その設計思想はGGUFに引き継がれ、クラウドに頼らず手元の端末でAIを動かすという実践の基盤となっている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。