DeepSeek【深度求索】ディープシーク
DeepSeekとは?

大規模言語モデルとは膨大なテキストデータを学習した深層ニューラルネットワークで、入力された文脈に続く言葉を確率的に推定して応答を生成することができる。世界的にはこれを応用したChatGPTやClaude、GeminiなどのチャットAIサービスがよく知られるが、DeepSeekもクラウド上で動作するサービスとして提供されている。
Webブラウザから同社サイトにアクセスして対話的に文章生成、翻訳、要約、コード生成など行うことができるほか、APIを通して外部のアプリケーションや業務システムからも利用できる。汎用の対話モデルのほか、コード生成に特化したものや、計算資源の少ない環境でも動作する軽量モデルも公開されている。
DeepSeekが広く注目された最大の理由は、開発コストの低さである。従来、高性能なAIモデルの構築には数百億円規模の計算資源が必要とされてきた。DeepSeekは、入力内容に応じてモデル内の特定部分だけを稼働させる「混合専門家モデル」(MoE:Mixture of Experts)と呼ばれる構造を採用することで、処理の無駄を省き、米国による高性能半導体の対中輸出規制という制約下でも、競合モデルに匹敵する性能を低コストで実現した。
性能面では、数学やプログラミングといった論理的思考を要する分野に強みを持つ。回答を即座に出力するのではなく、思考の過程を段階的に示しながら結論を導く設計を採用しており、複雑な問いに対しても解答の道筋を可視化できる点が高く評価されている。最先端モデルで米大手三社が他国の企業を大きく引き離してリードする中、遜色ない性能のモデルをリリースし続けていることも世界的に驚きを与えている。
米国勢を含め多くのAI企業がモデルの内部構造を非公開とする中、DeepSeekは学習済みのモデル内部のパラメータ群(ウェイト)や技術仕様を公開している。開発者は無償で入手することができ、手元でモデルを構築して使用したり、独自データで追加学習を行ったり、社内環境で閉じた運用をしたりすることが可能である。日本を含む世界中でDeepSeekを活用した研究やサービスの開発が広がっている。
一方、他の大規模言語モデルと同様に、事実と異なる情報をそれらしく出力することがある点には注意が必要である。また、開発元が中国企業であることから、入力データの管理や情報の安全性をめぐって各国政府や企業が慎重な姿勢を示しており、業務での使用を制限する動きも一部で見られる。