2025年2月14日、AI研究機関のNous Researchは、新たな大規模言語モデル(LLM)「DeepHermes-3 Preview」を公開した。このモデルは、ユーザーが詳細な推論プロセスと高速な直感的応答を自由に切り替えられる「トグル式推論モード」を搭載している。
DeepHermes-3は、MetaのLlama 3を基盤としたHermes 3の80億パラメータ版であり、約3億9千万トークンの多分野データセットで学習されている。ユーザーは、Hugging Faceからモデルをダウンロードでき、一般的なPCでも効率的に動作する。Nous Researchは、このモデルがユーザーに柔軟なAI活用を提供すると期待している。
AI推論モデルの進化とDeepHermes-3の位置づけ

AIの言語モデルは、単なるテキスト生成から「推論」を重視する方向へ進化している。従来の大規模言語モデル(LLM)は、膨大なデータから最も確率の高い単語列を生成するものだったが、近年は「チェーン・オブ・ソート(CoT)」と呼ばれる段階的な推論機能を組み込んだモデルが登場している。これは、AIが一連の思考プロセスを模倣し、答えを出す前に自らの論理を確認する技術である。
Nous Researchの新モデル「DeepHermes-3」は、こうした推論能力に加え、ユーザーが直感的な応答と深い推論の間を切り替えられる「トグル式推論モード」を採用している。この機能により、計算リソースの制約がある環境でも、必要に応じて詳細な推論を行える柔軟性を持つ。これまでのモデルは、推論を行うか否かが事前に決められていたが、DeepHermes-3はユーザー側で制御できる点が革新的だ。
また、Nous ResearchはMetaのLlamaシリーズやMistralのオープンソースモデルをベースに、独自のデータセットで再訓練を行っている。これにより、単なるオープンモデルの拡張ではなく、推論能力を特化させた調整が施されている点が特徴的である。この進化により、DeepHermes-3は数学的推論や多ターン会話といった高度なタスクにも対応できると期待されている。
DeepHermes-3のデータセットと学習アプローチ
DeepHermes-3は、多岐にわたるデータセットで学習されており、Hermes 3技術レポートによると約3億9千万トークンが使用されている。これらは一般的な指示応答、数学的推論、専門分野の知識、ストーリーテリング、プログラミングなどのカテゴリに分かれており、特定の用途に偏らずバランスの取れたデータ構成となっている。
特に注目すべき点は、「非CoT出力100万件」と「CoT出力15万件」を組み合わせた訓練方法である。非CoTデータは従来のAIチャットモデルのように迅速な応答を可能にし、CoTデータは論理的思考プロセスを強化する。この2つのデータを組み合わせることで、直感的な回答と精密な推論の両方を実現する仕組みとなっている。
さらに、Nous ResearchはGGUF(GPT生成統一フォーマット)に量子化されたバージョンを提供しており、消費者向けPCやクラウド環境での推論処理が可能になっている。例えば、AppleのM4 Maxチップを搭載したMacBook Proでは、毎秒28.98トークンの処理速度を記録しており、ローカル環境でも実用的なAI推論が行える。これにより、大規模なクラウドインフラを持たない開発者や企業でも手軽に高度なAI機能を活用できるようになった。
AI推論モデルの未来と市場への影響
DeepHermes-3の登場は、今後のAI推論モデルの方向性を示唆している。現在、多くのAI開発企業が推論機能の強化に取り組んでおり、MetaのLlamaシリーズやDeepSeekの新モデルもこの流れに沿ったものとなっている。特に、推論プロセスの制御が可能なLLMは、ビジネスの意思決定や専門的な情報分析において価値が高まると考えられる。
一方で、この分野にはいくつかの課題も存在する。例えば、CoTを活用した推論モデルは計算コストが高く、エネルギー消費も増大する可能性がある。Nous Researchはユーザーが推論モードを切り替えられる設計を導入しているが、実際の運用においてはどの程度の精度と速度を両立できるかが鍵となるだろう。
また、ライセンスの制約も重要なポイントである。DeepHermes-3はMetaのLlama 3をベースにしており、Meta Llama 3 Community Licenseの下で提供されている。このライセンスでは、大手企業(7億MAU以上)が利用する場合、Metaの承認が必要となる。今後、この種の制約がAI開発の自由度にどのような影響を及ぼすかも注目されるべき点だ。
Nous Researchは、次世代モデル「Hermes 4」の開発を進めており、より高度な推論機能と対話能力を目指している。AIが単なる情報生成ツールから、論理的な判断を支援する知的パートナーへと進化する中で、DeepHermes-3のようなモデルが市場に与える影響は大きい。
Source:VentureBeat