Chain of Thoughtとは？効くケースと向かないケース

ーこの記事の要旨ー

Chain of Thought(CoT)とは、AIに答えだけでなく思考の途中経過を段階的に出力させる手法で、複雑な推論を伴うタスクで効果を発揮します。
本記事では、CoTの仕組みやFew-shot/Zero-shotの違いを整理したうえで、「いつ使い、いつ使わないか」の判断軸を解説します。
あわせて、説得力のある誤答や誤りの伝播といった実務上の失敗パターンを紹介し、業務での使いどころを判断できる状態を目指します。

Chain of Thoughtは「思考の過程ごと出力させる」プロンプト技術
1. この記事で扱う範囲
CoTの仕組み:答えを出す前に「途中の考え」を書かせる
CoTを使うケースと使わないケースの判断軸
実務でCoTがうまくいかない3つの失敗パターン
推論モデル時代にCoTプロンプトは今も必要か
CoTと関連手法の違い:思考を「どう動かすか」で分かれる
1. CoT・ReAct・Tree of Thoughtsの関係
2. Self-Consistencyとの組み合わせ
よくある質問(FAQ)
まとめ
1. 思考プロセスの設計で迷うあなたに読んでほしい記事

Chain of Thoughtは「思考の過程ごと出力させる」プロンプト技術

Chain of Thought(CoT)とは、AIに答えだけでなく答えに至る思考過程を段階的に出力させ、複雑な推論の精度を高めるプロンプト手法です。多段階の推論を要するケースで効き、単純で定型的なケースではかえって冗長になり向きません。

この記事を読み進める前に、結論を先にお伝えします。CoTは「とりあえず付けておけば賢くなる魔法の呪文」ではありません。効くタスクと効かない、むしろ逆効果になるタスクがはっきり分かれます。仕組みや具体例を順に確認したい方はこのまま、「結局いつ使えばいいのか」を急ぎたい方は「CoTを使うケースと使わないケースの判断軸」の見出しまで読み進めると、使いどころの判断軸と実務でつまずく失敗パターンにたどり着きます。

この記事で扱う範囲

CoTという言葉は、研究論文の文脈では「推論の精度を上げる技術」全般を指し、実務の文脈では「ChatGPTなどに段階的に考えさせるプロンプトの書き方」を指すことが多く、両者は少し意味の幅が違います。この記事は後者、つまりビジネスの現場でAIに指示を出す人が「どう書けば、どんなときに効くのか」を判断できることを目的に解説します。エンジニア向けの実装詳細ではなく、企画・分析・意思決定といった日常業務での使い分けに重心を置きます。

なお、CoTのようにAIへ思考を促す手法を使いこなすほど、どの作業をAIに任せ、どこを自分で考えるかの線引きが問われます。その全体像は、関連記事『AI時代の思考力』で詳しく解説しています。

CoTの仕組み:答えを出す前に「途中の考え」を書かせる

CoTの仕組みは、AIに最終回答を出させる前に、そこへ至る中間ステップを順番に言語化させる点にあります。

通常のプロンプトでは、AIは問いに対していきなり答えを返します。これに対してCoTでは、「順を追って考えてから答えてください」と指示することで、AIが結論の前に推論の道筋を出力します。人間が暗算でいきなり答えを出すのではなく、紙に途中式を書きながら解くのと似た構図です。

なぜこれで精度が上がるのか。理由は、複雑な問題を一気に解こうとすると途中の判断が飛ばされやすいのに対し、ステップに分解すると一つひとつの推論が前のステップを足場にできるからです。中間ステップが次のステップの入力になるため、いきなり結論へ飛ぶより誤りが入り込みにくくなります。

同じ問いでも出力はこう変わる

CoTのあり/なしで出力がどう変わるかを、簡単な例で見てみましょう。

「ある商品の今月の売上が前月より落ちた。原因は何か」とAIに尋ねたとします。CoTなしのプロンプトでは、「価格が高いからではないか」といった単一の答えがいきなり返ってきがちです。これに対してCoTを使うと、「まず売上を客数と客単価に分解すると、客数が減っている。次に客数の減少を新規とリピートに分けると、リピートが落ちている。よって原因はリピート率の低下にある可能性が高い」というように、分解と推論の道筋を経て結論にたどり着きます。

後者は、どのステップで何を根拠にしたかが見えるため、人間が「客単価の分解は妥当か」と途中を検証できます。結論だけが返る前者では、この検証ができません。これがCoTの「途中を書かせる」価値です。

Few-shot CoTとZero-shot CoT

CoTには、お手本を見せるか見せないかで大きく2つのやり方があります。両者は「例示あり/なし」という対比で理解すると整理しやすくなります。

Few-shot CoTは、「こういう問題には、こう順を追って考えて、こう答える」という解答例をいくつか先に見せてから本題を解かせる方式です。AIが手本の推論パターンを真似するため、出力の形式や思考の進め方を細かくそろえたいときに向きます。

Zero-shot CoTは、例を見せず「ステップバイステップで考えてください」といった一文を添えるだけの方式です。手軽さが利点で、プロンプトに例を用意する手間がかかりません。日常業務でまず試すなら、こちらから入るのが現実的です。

なお、Few-shot CoTとZero-shot CoTは、同じCoTという考え方を共有しつつも、研究上は別系統として発展してきた手法です。両者を「同じ一つの流れ」とひとくくりにせず、例示の有無で使い分ける2つのやり方として捉えておくとよいでしょう。

CoTを支えた研究の背景

CoTは、Googleの研究チームによるWeiらの論文(2022年)で広く知られるようになった手法です。大規模言語モデルに中間推論ステップを生成させると、算数の文章題などで正答率が向上することが報告されました。

ここで一点、誤解を避けるために補足します。CoTが出力する「途中の考え」は、AIが人間のように内部で本当にそう考えた過程を正確に写したものとは限りません。あくまで「もっともらしい推論の筋道」を文章として生成しているという理解が、後半の失敗パターンを読むうえでの土台になります。

CoTを使うケースと使わないケースの判断軸

CoTを使うかどうかは、タスクが「多段階の推論を必要とするか」で判断します。これがこの記事の中心的な問いです。

多くの解説記事はCoTを「精度が上がる便利な技術」として一様に勧めますが、実務で大事なのは「どんなときに効いて、どんなときに無駄になるか」の線引きです。まず下の表で、向くタスクと向かないタスクを対比して全体像をつかんでください。

向くタスク(多段階の推論)	向かないタスク(一段で答えが出る)
原因の切り分けが必要な分析	用語の定義を答えるだけ
条件が絡む論理判断・比較	単純な分類
複数の手順を踏む計画立案	決まった形式への変換
多段階の計算	答えが一意に決まる事実確認

左右を分ける基準は一つで、「その問題を自分が解くとき、頭の中で複数のステップを踏むか」です。以下、それぞれを詳しく見ていきます。

なお、CoTで「答えに至る過程」を設計する前に、そもそも何を解かせるべきかという問いの設定がずれていると、丁寧な推論でも的外れな結論になります。解くべき問いの見極め方は、関連記事『論点思考とは？』で詳しく解説しています。また、CoTがプロンプトの「考えさせ方」の設計だとすれば、AIに渡す情報そのものの設計を扱うのが関連記事『コンテキストエンジニアリングとは？』です。指示の出し方とあわせて押さえると、AI活用の精度が一段上がります。

CoTが効くケース:考える手順が複数あるとき

CoTが効くのは、答えにたどり着くまでに複数の判断や計算を経由するタスクです。

たとえば「複数部署の予算案を制約条件のもとで配分する」「複数の原因候補から問題の根本原因を絞り込む」といった、途中の判断が次の判断に影響する場面です。こうしたタスクでは、AIに途中の考えを書かせることで、どのステップで何を根拠にしたかが見えるようになり、結論の妥当性を人間が検証しやすくなります。出力された推論の筋道そのものが、レビューや引き継ぎの材料にもなります。

原因の絞り込みでAIに筋の良い当たりをつけさせたいときの考え方は、関連記事『仮説思考とは？』にまとめています。

CoTが向かないケース:単純・定型のタスク

一方、答えが一段で出るタスクにCoTを使うと、出力が無駄に長くなるだけで精度上の利点はほとんどありません。

「この単語の意味は」「この文章を箇条書きにして」といった単純なタスクでは、途中の考えを書かせても結論は変わらず、読む手間と待ち時間だけが増えます。むしろ冗長な前置きが本題を埋もれさせ、使いにくくなることもあります。定型業務との相性は良くないと考えておくのが無難です。

判断に迷ったときの基準

迷ったときは、「その問題を自分が解くとき、頭の中でいくつステップを踏むか」を基準にしてみてください。

暗算レベルで即答できる問いなら、CoTはおそらく不要です。紙に書き出して順番に詰めたくなる問いなら、CoTが効く可能性が高いといえます。さらに、出力の長さがコストやレイテンシ(応答までの時間)に響く業務では、効果と冗長化のトレードオフも考慮に入れる必要があります。トークン課金のあるツールを大量に回す場合、不要なCoTはコスト増に直結します。

実務でCoTがうまくいかない3つの失敗パターン

CoTは万能ではなく、現場では特有のつまずき方をします。ここがこの記事で最も伝えたい部分です。多くの解説記事が「精度が上がる」とだけ述べて触れない、3つの失敗パターンを整理します。

失敗1:説得力のある誤答に引きずられる

最も注意すべきなのが、AIが筋の通った推論を書きながら、結論は間違っているケースです。

CoTの出力は途中の考えが整然と並ぶため、読み手は「ここまで丁寧に考えているなら正しいだろう」と感じやすくなります。ところが、途中のステップに事実誤認や論理の飛躍があっても、文章としては滑らかに続いてしまいます。結果として、説得力のある誤答が生まれ、人間がチェックを甘くしてしまう。これは見栄えの良い推論ほど危険という、CoT特有の落とし穴です。対策は、結論だけでなく途中のステップを一つずつ事実と照らして確認することです。

失敗2:途中の誤りが後段に伝播する

CoTは前のステップを足場に次を考える構造のため、序盤の判断を一つ間違えると、その誤りが連鎖して最終結論まで波及します。

人間の作業なら途中で「何かおかしい」と立ち止まれますが、AIは誤った前提のまま推論を進めてしまうことがあります。長い推論ほど、どこで道を間違えたかが見えにくくなります。対策としては、推論を一度に長く走らせず、重要な分岐点で出力を区切り、人間が中間結論を確認してから次へ進ませる方法が有効です。

失敗3:プロンプトが崩れて形式が安定しない

実務でCoTを使い込むと、出力のフォーマットが指示通りにそろわない、という地味だが厄介な問題に直面します。

「ステップごとに分けて」と指示しても、あるときは番号付き、あるときは長い段落、というように出力が揺れることがあります。これを社内ナレッジや定型レポートに組み込もうとすると、毎回の手直しが負担になります。対策は、Few-shot CoTで望ましい出力形式の例を具体的に示し、出力フォーマットをプロンプト側で固定しておくことです。

推論モデル時代にCoTプロンプトは今も必要か

近年、初めから内部で段階的に推論するよう設計された「推論モデル」が普及し、「明示的にCoTを指示する必要はもうないのでは」という疑問が生まれています。

結論からいえば、推論モデルに対しては「ステップバイステップで考えて」という指示の重要性は下がりつつあります。モデル側が内部で推論過程を踏むようになったため、ユーザーが毎回明示的に促さなくても、複雑なタスクで一定の精度が出るようになっているからです。

ただし、これはCoTという考え方が不要になったことを意味しません。「どんな手順で考えてほしいか」「どの観点を踏まえて判断してほしいか」を具体的に伝える価値は残ります。プロンプトに含めるべきは「ステップで考えて」という汎用の呪文ではなく、「この判断ではコストと納期の両方を考慮して」といった、思考の中身を方向づける指示へと比重が移っていると捉えるとよいでしょう。

どこまでをAIに任せ、どこから自分で考えるべきか。この境界の引き方こそが、AIを使っても思考の質を保つ土台になります。

CoTと関連手法の違い:思考を「どう動かすか」で分かれる

CoTを正しく位置づけるには、よく並べて語られる関連手法との違いを押さえておくと理解が深まります。それぞれ思考の動かし方が異なります。

CoT・ReAct・Tree of Thoughtsの関係

CoTは思考を一本道で進める手法です。これに対し、ReActは「考える」と「行動する(外部ツールで調べるなど)」を交互に繰り返す手法で、思考と行動を連携させる点が異なります。Tree of Thoughts(思考の木)は、複数の推論の枝を同時に展開して比較・選択する手法で、一本道ではなく枝分かれ探索を行う点が特徴です。

実務でまず使うのはCoTで十分なことがほとんどです。一本道の推論では足りず、途中で情報収集が必要ならReAct的な発想を、複数の解法を比べたいならToT的な発想を取り入れる、という順で広げていくと混乱しません。

Self-Consistencyとの組み合わせ

Self-Consistency(自己整合性)は、CoTで複数回推論させ、最も多く出た結論を採用する考え方です。一度の推論では誤答に引きずられるリスクがあるため、複数の推論パスの多数決で安定させる狙いがあります。失敗パターン1で触れた「説得力のある誤答」への対策としても理解できます。

よくある質問(FAQ)

CoTを使うと必ず精度は上がりますか

いいえ、タスク次第です。多段階の推論を要する複雑なタスクでは精度向上が期待できますが、単純・定型のタスクでは効果がほとんどなく、出力が冗長になる分むしろ使いにくくなることがあります。「複雑な問題には効き、単純な問題には不要」が実務上の目安です。

「ステップバイステップで考えて」と書くだけでいいですか

簡単なタスクではそれで足ります。ただし出力形式をそろえたい場合や、特定の観点を踏まえてほしい場合は、Few-shot CoTで解答例を示すか、考えてほしい観点を具体的に指示するほうが安定します。汎用の一文だけでは出力が揺れやすい点に注意してください。

CoTの途中の説明は信用してよいですか

途中の説明は「もっともらしい推論の筋道」であり、AIの内部処理を正確に写したものとは限りません。説明が整然としていても結論が誤っていることがあるため、重要な判断では途中のステップを事実と照らして検証する姿勢が必要です。

推論モデルを使う場合もCoTの指示は必要ですか

内部で段階的に推論する推論モデルでは、「ステップバイステップで」という明示指示の重要性は下がります。一方で、どの観点を踏まえて判断してほしいかを具体的に伝える価値は残ります。汎用の呪文より、思考の中身を方向づける指示に比重を移すのが現実的です。

業務でCoTを使うとコストが増えませんか

増える場合があります。CoTは出力が長くなるため、トークン課金のあるツールでは費用が、応答時間ではレイテンシが増えます。単純なタスクにまで一律でCoTを使うとコストだけがかさむため、効くタスクに絞って使うのが費用対効果の高い運用です。

まとめ

CoTは、AIに答えだけでなく答えに至る思考過程を段階的に出力させる手法で、複雑な多段階タスクで精度を高める一方、単純なタスクには向かない、使いどころを選ぶ技術です。

明日から試すなら、まず手元の業務を「自分が解くとき頭の中で複数ステップを踏むか」で仕分けしてみてください。複数ステップを踏むタスクにだけ「順を追って考えてから答えて」と添え、出力された途中のステップを一つずつ確かめる。この2点を意識するだけで、説得力のある誤答に引きずられるリスクを下げながら、CoTの利点を取り出せます。

CoTを使いこなすほど、どこまでAIに考えさせ、どこから自分で判断するかの線引きが重要になります。とりわけ失敗1で触れた「説得力のある誤答」を見抜くには、AIの出力を鵜呑みにせず評価する力が欠かせません。その基本は、関連記事『AIリテラシーとは？』で詳しく解説しています。AIを使っても思考が空洞化しないための土台として、あわせて押さえておくとよいでしょう。