「ChatGPTに聞いてみたけど、なんか微妙だったからやめた」——Xでもよく見かけるし、僕の周りの大学院生も同じことを言う。でもこれ、AIの性能の問題じゃなくて、フィードバックの設計が抜けているだけかもしれない。

実は2026年のプロンプトエンジニアリング調査によると、AI対話の38.5%が「やり直し」を含む反復的なやりとりになっている。つまり、一発で完璧な回答が出ないのはあなただけじゃない。むしろ「普通」だ。ただし、構造化されたフィードバック手法を使うと、このやり直し率は11%まで下がるという報告もある。

プロンプトは思考の鏡だと僕は思っていて、最初の出力が微妙なのは、自分の頭の中がまだ整理されていない証拠でもある。だからこそ「微妙な出力」は捨てるんじゃなくて、磨く材料にする。その方法を3ステップで整理してみた。

なぜ「もっと良くして」では良くならないのか

AIに「もっと良くして」「わかりやすくして」と返す人は多い。でもこれ、AIにとっては情報量ゼロに近い。MIT Sloan Management Reviewの2025年の研究では、AIを効果的に使える人とそうでない人の差はメタ認知能力——つまり「自分が何をわかっていないかを認識する力」にあるとされている。

「なんか微妙」で止まってしまう人は、何が・どう・微妙なのかを言語化できていない。逆に言えば、そこを言語化するスキルさえ身につければ、AIの出力品質は劇的に変わる。

ステップ1:「微妙ポイント」を3つに分類する

最初の出力を見て「微妙だな」と思ったら、まず不満を次の3カテゴリに仕分けする。

  • 粒度の問題:抽象的すぎる/具体的すぎる
  • 方向性の問題:聞きたかったことと論点がずれている
  • 形式の問題:長すぎる/構造がわかりにくい/トーンが合わない

たとえば「AIの教育活用について教えて」と聞いて、一般論ばかり返ってきたなら、それは粒度の問題。「小学校3年生の国語の授業で使う前提で」と補足すれば、一気に出力が絞られる。

僕が小学校でAI授業のワークショップをやったとき、子どもたちは「AIの答え、つまんない」と平気で言い放って、そこから勝手に質問を変え始めた。大人より子どもの方が「微妙」を素直にフィードバックできる。大人は遠慮しすぎなのかもしれない。

ステップ2:「差分指示」で出力を磨く

分類ができたら、次は差分だけを具体的に指示する。全部やり直させるのではなく、ピンポイントで修正を求める。

NeurIPS 2023で発表されたSelf-Refine(Madaan et al.)という研究では、LLMに対して「何がどう問題か」を構造的にフィードバックするだけで、出力品質が平均20ポイント改善したことが示されている。これは人間がAIに指示する場合も同じ原理だ。

具体的なフィードバックのテンプレートはこうなる:

「上の回答の【第2段落】が【抽象的すぎる】ので、【〇〇の具体例を1つ入れて】書き直してください。それ以外はそのままで。」

ポイントは3つ:①場所を指定する ②問題を名づける ③修正の方向を示す。「全部やり直して」ではなく「ここだけ直して」が、AIにとっても人間にとっても効率がいい。

ステップ3:「3ターンルール」で対話を設計する

最後に、AIとの対話を最低3ターン前提で設計する習慣をつけよう。

  1. 1ターン目:ざっくり聞いて、AIの「解釈の癖」を観察する
  2. 2ターン目:ステップ1・2を使って差分フィードバックを入れる
  3. 3ターン目:出力を自分の言葉でまとめ直す指示を出す

AIに丸投げしないというのは、「自分の手を動かせ」という精神論じゃない。対話の設計を自分が握るということだ。1ターンで完成を求めるのは、下書きなしにいきなり清書するようなもの。まず実装して、挙動を観察して、理論で説明する——僕がふだん研究で使っている思考プロセスは、AI対話にもそのまま使える。

「微妙」を「使える」に変えた実例

僕自身、修士論文の先行研究レビューをChatGPTに丸投げして1週間無駄にした経験がある。出力は「なんか微妙」どころか、存在しない論文を堂々と引用していた。そこから学んだのは、AIの出力は素材であって完成品じゃないということ。

今は先行研究を調べるとき、まず「この分野の主要なキーワード5つを挙げて」と粒度を絞り、次に「そのうち2025年以降の論文に絞って」と方向を修正し、最後に「各論文の主張を1文でまとめて」と形式を指定する。3ターンで、「なんか微妙」が「使える下調べ」に変わる。

まとめ:遊びながら学ぶ、AIとの対話術

AIの回答が微妙なとき、多くの人は「AIはまだダメだ」と結論づけて閉じてしまう。でも本当は、フィードバックの出し方を知らないだけのことが多い。

  1. 不満を「粒度・方向性・形式」に分類する
  2. 差分指示でピンポイント修正する
  3. 3ターン前提で対話を設計する

この3ステップは、実はAIに限った話じゃない。人にフィードバックを出すときも、研究で論文を改稿するときも、同じ構造が使える。遊びながら学ぶ感覚で、まずは今日のAI対話で「なんか微妙」と思ったら、ステップ1の分類から試してみてほしい。

よくある質問(FAQ)

Q1. 毎回3ターンもやるのは面倒では?

最初はそう感じるかもしれません。でも「なんか微妙」な出力をそのまま使うか、捨てて自分で全部やるかの二択よりは、2〜3ターンの修正のほうがトータルで速いです。慣れると1ターン目の質問の質も上がるので、必要な修正ターン数は自然と減っていきます。

Q2. どのAIツールでも同じ方法が使えますか?

はい、基本的な考え方はChatGPT、Claude、Geminiなど主要なLLMすべてに共通です。ただし、ツールによって得意分野や応答スタイルが異なるので、1ターン目で「このAIの癖」を把握する意識を持つとさらに効果的です。

Q3. 差分指示を出すとき、プロンプトのテンプレートを暗記する必要がありますか?

暗記は不要です。大事なのは「場所・問題・方向」の3要素を入れること。この型さえ覚えておけば、自分の言葉で自然にフィードバックできます。テンプレートに縛られるより、自分の「微妙ポイント」を素直に伝える練習をする方が実践的です。

Q4. 仕事の専門分野でも使えますか?

むしろ専門分野ほど効果が大きいです。専門用語や前提条件を補足するだけで出力の精度が跳ね上がります。「IT業界の中小企業向け」「看護師の夜勤シフトを前提に」など、あなたの専門知識がそのままフィードバックの武器になります。

参考文献

  • Madaan, A., et al. (2023). "Self-Refine: Iterative Refinement with Self-Feedback." Proceedings of NeurIPS 2023. — LLMの反復的フィードバックによる出力改善(平均20ポイント向上)を実証。
  • MIT Sloan Management Review (2025). "Audit Yourself to Get More From GenAI." — メタ認知能力がAI活用の成果を分ける決定的要因であることを報告。
  • UCStrategies (2026). "Prompt Engineering Best Practices in 2026." — AI対話の38.5%が反復的修正を含み、構造化手法で11%に低減できることを報告。