「共通テストをChatGPTに解かせたら、9科目で満点だった」というニュースを見て、思わず検索した方は多いはずです。いちばん気になるのは、「どの科目が満点だったのか」「逆にどんな問題で落としたのか」、そして「じゃあ人間の受験勉強は意味があるのか」という点ではないでしょうか。
結論から言うと、現時点の生成AIは“正解が決まっていて手順が安定する問題”に非常に強い一方で、文章の根拠をどこに置くか、図や地図をどう読み取るか、出題意図をどう解釈するかといった場面でズレが出やすいことが、LifePrompt(ライフプロンプト)の検証レポートから見えてきます。(note(ノート):【満点9科目!】共通テスト2026を最新版AIに解かせてみた(Chatgpt、Gemini、Claude))
この記事では、ニュースをなぞるだけで終わらせず、「AIが満点を取れる領域」と「それでも人間が伸ばすべき領域」を、根拠を示しながら整理します。読み終わる頃には、「AI時代の受験の勝ち筋(何を伸ばすか)」が具体的に見えるはずです。
結論:AIは“正解が決まってる問題”に強く、ズレるのは「根拠探し」と「読み取り」
AIが共通テストで高得点を出すのは、もはや珍しい話ではなくなりつつあります。今回話題になったのは、AIスタートアップのLifePromptが、2026年1月実施の大学入学共通テストを生成AIに解かせたところ、ChatGPTが「15科目の得点率97%」「9科目で満点」だったと公表した点です。(TBS NEWS DIG:チャットGPTが大学入学共通テストで9科目満点 15科目の得点率は97% AI性能向上で)
ただし、この結果は「AIが何でも完璧」という意味ではありません。LifePromptのレポートでは、AIが間違えた問題の傾向として、図・地図・色の濃淡など“視覚情報の読み取り”や、国語小説の心情理解など“文脈の細いズレ”が挙げられています。
ここから先は、「満点科目はどれ?」「満点じゃない科目で何が起きた?」を入口に、読者のモヤモヤを一つずつ解消していきます。
満点になった科目はどれ?
まず「9科目満点」の内訳ですが、報道では「数学」「化学」「公共、政治・経済」などが満点科目として触れられています。 一方で、9科目すべての“科目名一覧”が記事本文で完全に列挙されているわけではありません(少なくとも、主要報道の範囲では「など」という表現で省略されています)。この点は、現時点では未公表・未確認部分が残るため、憶測で埋めないのが安全です。(テレ朝NEWS:ChatGPT 大学入学共通テスト9科目で満点 国内最難関・東大文科1類科目の正答率は97%)
とはいえ、なぜ数学・理科・公民・情報といった科目で満点が出やすいのかは説明できます。共通テストは原則マーク式で、条件が明確に与えられ、選択肢から最も整合するものを選ぶ設計です。特に数学や理科は、手順が定まりやすく、途中の計算や論理展開が安定すると得点が伸びやすい領域です。
また、「情報I」が2025年度から教科として本格導入されたことも、今回の話題と相性が良い点です。共通テストは2025年度から「情報」が加わり、7教科21科目の体系になっています(マナビジョン:2026年度大学入学共通テストの仕組み)。 ルールが明確な処理・手順・読解(仕様の読み取り)系の問いは、AIの得意領域と重なりやすい、という見立てが成り立ちます。
満点じゃない科目で何が起きた?
「AIが9科目満点」と聞くと、“全科目ほぼ完全”の印象を持ちがちですが、重要なのは「満点ではない科目で何が起きたか」です。LifePromptは、AIが間違えた問題を分析するパートを設け、共通して誤答した設問の特徴を具体例つきで述べています。
特に注目されやすいのが国語です。国語は「本文のどこを根拠にするか」「選択肢の言い換えがどこでズレるか」など、細い差を拾う力が得点を左右します。LifePromptの分析でも、国語(小説)で“人間の割り切れない感情”の読み違いが起きた例が示されており、AIが一般論(道徳的な解釈)に引っ張られて誤答した、という趣旨が説明されています。
この「ズレ方」にはヒントがあります。AIは文章を要約するのは得意でも、設問が求める“根拠の置き場所”や、“その場面の微妙な心情の揺れ”を、試験の採点基準どおりに一発で合わせるのはまだ難しいケースがある、ということです。
なぜ急に得点率が跳ねた?(66%→91%→97%の“伸び方”が異常)
今回のニュースでもう一つ大きいのが、「伸び方」です。報道では、東大文科一類の受験生が多く選択する科目に絞った得点率が、2024年66%→2025年91%→2026年97%と推移したことが紹介されています。
この数値のインパクトは、「AIが賢くなった」だけでは片づけにくいほど急です。背景には、モデルの性能向上だけでなく、試験形式との相性、入力・採点の仕組み、ミスの発生源がどこにあるか、といった複合要因があります。ここを整理すると、受験生側が“何を真似して、何を真似しないか”が見えてきます。
「勉強した」じゃなく「解き方の精度が上がった」
AIの得点が伸びるとき、人間のように「暗記量が増えた」というより、「解き方の再現性が上がった」と捉える方が現実に近いです。LifePromptは、問題PDFを分割し、API経由で複数モデルに出題し、回答を採点可能な形式に変換するなど、手作業の揺れを減らす設計を説明しています。
つまり、AIの“実力”に加えて、入力のぶれ(コピペミス等)や採点の揺れを抑えた仕組みが、より正確に性能を引き出した可能性があります。ここは受験生にとっても重要で、「自分の解法が毎回ブレない」ほど得点が安定する、という学習の原則と重なります。
また、共通テストはマーク式で、最後は選択肢に落とし込みます。解法の流れが安定し、条件処理が正確であれば、高得点に到達しやすい設計です。ここにAIの強みが噛み合った、と考えるのが自然です。
ミスしない・時間に焦らない・手順が崩れない…人間との決定的差
人間が共通テストで崩れる典型は、「難しい問題に当たって動揺し、後ろに影響が出る」ことです。実際、2026年の共通テストについても、自己採点の現場取材では「情報が一番難しかった」「意味が分からない問題が出た」といった受験生コメントが報じられ、河合塾仙台校での自己採点を踏まえた予想として、6教科合計の平均点が文系592点・理系608点(いずれも1000点満点)とする見立ても紹介されています。
AIには、この“動揺”が基本的にありません。さらに、計算・処理・条件分岐のようなタスクは、疲労や焦りの影響を受けにくい設計です。ここが、人間が短期間で埋めにくい差になります。
ただし逆に言うと、人間が伸ばすべきは「AIと同じ土俵での処理速度」ではなく、次章のような“AIがズレやすい場所”を強化することだ、という戦略が立てられます。
AIが苦手になりやすい“落とし穴”はここ
「AIは万能ではない」と言っても抽象的になりがちですが、今回の検証レポートは、苦手が出やすいパターンを具体例で示している点に価値があります。LifePromptの分析パートでは、複数モデルが共通して間違えた設問として、イラスト問題、国語小説の心情、地理の濃淡図などが挙げられています。
この“落とし穴”を言語化できると、受験生は「AIを使うほど伸びる勉強」と「AIに任せるほど危ない勉強」を分けられます。
国語で起きる「それっぽいけど根拠がズレる」現象
国語は、答えそのものよりも「本文のどこを根拠にしたか」が勝負になります。AIはもっともらしい説明を作れますが、採点基準は“本文根拠の一致”に寄るため、根拠の置き場所がズレると、説明が立派でも失点します。
LifePromptは国語(小説)について、主人公の心情を「現状への妥協(割り切れない思い)」と読むのが正解の場面で、AIが「過去の過ちへの反省」を選びやすかった、という趣旨の分析を載せています。AIが一般論(反省して成長するはず)に引っ張られ、人間の矛盾した感情の読み取りで外した、という説明です。
ここから導ける学習方針はシンプルです。国語で点を伸ばすなら、「答えっぽい言葉」を探すのではなく、本文の該当箇所を特定して、選択肢の言い換えが一致しているかを確認する癖が重要になります。AIを使うなら、AIの要約を読むより、「根拠となる一文をどこに置いたか」を必ず言わせる使い方が効果的です。
図表・地図・複数情報を結びつける問題で落ちやすい理由
共通テストは、資料読解や図表読み取りが多い試験です。AIはテキスト処理に強い一方で、図の微妙な差や、色の濃淡の読み取りなどで躓くケースがあることが、LifePromptの分析で示されています。たとえば、英語リスニングのイラスト選択で、手順の理解はできていても「どの絵が該当か」を選べず誤答した例や、地理の濃淡(ヒートマップ)で色の違いを識別できずに誤答した例が挙げられています。
このタイプの問題は、人間でも「グラフの軸を読み落とす」「地図の凡例を見ない」などのケアレスミスが起きます。つまり、AIの弱点は、そのまま人間の得点源にもなり得る、ということです。
対策は、派手なテクニックではなく、次のような地味な確認の徹底になります(ここは本当に効くので、あえて短く箇条書きにします)。
- 図表問題は最初に「凡例(色・記号の意味)」「軸(単位・目盛り)」「期間(いつのデータか)」を確認する
- 文章と図を行き来して、「この文の根拠が図のどこか」を指で追う
- 選択肢は“本文一致”ではなく“図一致”で評価する(図が根拠の設問では特に)
これらは、AIに質問する前に自分でできると強いですし、AIを使う場合も「図の根拠をどこに置いたか」を説明させれば、思考のズレを早期に発見できます。
「出題意図を読む」系で点が落ちるのはなぜ?
出題意図とは、かみ砕くと「この設問が何を確かめたいのか」です。共通テストでは、単なる知識の暗記ではなく、条件整理・資料読解・複数情報の統合を問う設問が増えています。出題意図を取り違えると、知識があっても誤答します。
AIも同様で、「文章は読めるが、問われ方の意図(どの観点で選ぶか)」を外すと失点します。LifePromptの分析が示す“図は読めない”“色の濃淡が見えない”“心情の機微が一般論に吸われる”といった現象は、裏返すと「設問の狙いがどこにあるか」を外したときに起きやすいミスです。
人間側の勝ち筋は、まさにここです。知識量ではAIに勝ちにくいとしても、「この問題は、何を根拠に、どの観点で選べばいいのか」を掴む力は、訓練で伸びます。
じゃあ人間の受験は終わり?→“勝ち筋”は残る
「AIが満点を取れるなら、受験勉強は無意味では?」という疑問は自然です。ただ、共通テストの仕組み自体、大学入試全体の一部であり、国公立大では個別試験(記述・論述等)がセットです。共通テストと一般選抜(個別試験)の違いとして、共通テストがマーク式中心である一方、国公立大の個別試験は記述式が多いことが整理されています。
つまり、AIの得意領域(マーク式の手順問題)が伸びるほど、入試全体で“人間が評価される要素”の重要性は相対的に上がりやすい、という構図になります。ここで焦って「AIと同じ速度で処理しよう」とするより、勝ち筋のある能力に投資する方が合理的です。
AIの答えを“検証”できる人が強い(根拠の場所を言える)
AI時代に強い受験生の条件は、「AIが出した答えを正しく疑える」ことです。これは言い換えると、根拠を特定し、選択肢のズレを説明できる力です。
たとえば国語なら、「この選択肢が本文のどこに対応するか」を示せる人が強いです。地理や理科でも、「図表のこの部分が根拠だから、この選択肢は不適切」と言える人が最後に伸びます。AIを使うときも同じで、答えだけもらうのではなく、根拠の提示を必須にする運用が重要になります。
ここは学習法としては古典的ですが、AIが普及するほど価値が上がる領域です。AIが高速に“候補”を出せるなら、人間は“検証”に時間を使った方が合格可能性が上がります。
二次試験・記述・面接で効く「自分の言葉」の作り方
国公立の二次試験や、私大でも小論文・面接を課す入試では、「自分の言葉で説明できるか」が問われます。AIに書かせた文章は整っていても、面接で深掘りされると詰まる、というリスクが出ます。
ここでのポイントは、文章の上手さではなく「プロセスの言語化」です。どう考え、どの根拠で結論に至ったかを説明できるようにする必要があります。具体的には、次の3点を自分の言葉で言える状態を目標にすると、AIに頼りすぎずに伸びます(箇条書きはここで2回目に留めます)。
- 結論:私は何を主張するのか
- 根拠:それを支える事実・本文箇所・データはどこか
- 反対意見:別の見方があるなら何で、なぜ自分はこう判断したのか
AIはこの型を作るのが得意ですが、最終的に話すのは自分です。AIを使うなら、AIに「あなた(受験生)が面接で説明できるように、質問して引き出して」と依頼し、対話でプロセスを固める方が安全です。
AIがいる前提で伸ばすべき3つ(読解/説明/問い立て)
AIが普及した環境では、受験勉強の目的が少し変わります。知識の獲得はもちろん必要ですが、同じ量を覚えること自体で差がつきにくくなり、“使い方”で差がつきます。
伸ばすべき能力を、検索されやすい言葉に落とすなら「読解」「説明」「問い立て」の3つです。読解は、本文根拠を押さえる力と、図表を読み切る力です。説明は、根拠と結論をつなげて話す力で、記述・面接に直結します。問い立ては、与えられた情報から「何が問われているか」を掴み、必要な情報を選び取る力です。
この3つは、LifePromptの分析で見えた“AIのズレやすい場所”とちょうど反対側にあります。だからこそ、AIと競争するのではなく、AIを前提に強化すると勝ちやすい分野だと言えます。
親・受験生が今すぐできる「AIとの正しい付き合い方」
最後に、今日から実行できる「AI活用の現実的な型」をまとめます。ここで重要なのは、AIを使う・使わないの二択ではなく、「どの使い方なら伸びるか」「どの使い方だと伸びないか」を分けることです。
特に共通テスト後は、自己採点や出願、二次対策へと一気に進みます。情報が多い時期ほど、AIを雑に使うと混乱も増えます。ここは短期で差がつきやすいので、型を決めておくと強いです。
やりがちNG:答えだけ見る
いちばん多い失敗は、「解けなかった問題をAIに投げて、答えと解説を読んで満足する」パターンです。気持ちは楽になりますが、次に同型の問題が来たときに再現できません。
また、AIは“それっぽい説明”が得意なので、根拠が薄いまま理解した気になりやすいのも危険です。国語や資料読解でこの状態になると、共通テスト本番では選択肢のわずかなズレに対応できません。
伸びる使い方:解法の比較、根拠の指差し、弱点の棚卸し
伸びる使い方は、AIを「答え製造機」ではなく「添削者」「比較対象」「弱点発見器」にすることです。具体的には、次の運用が効果的です。
- 解法の比較:自分の解法とAIの解法を並べ、「どこで分岐したか」を確認する
- 根拠の指差し:国語なら“本文の一文”、地理なら“図表の該当箇所”を必ず示させる
- 弱点の棚卸し:ミスを「知識不足」「読み落とし」「条件整理ミス」「時間配分」のように分類する
このやり方だと、AIの弱点(図や濃淡、心情の一般論化など)も見えやすくなります。LifePromptの分析が示す“どこでズレるか”を知ったうえで使うと、AIはかなり優秀な練習相手になります。
家庭で揉めない“ルール”例
親子で揉めやすいのは、「AIを使う=ズル」という感覚と、「使わない=非効率」という感覚がぶつかることです。ここは感情論にすると長引くので、ルールを“行動”で決めた方が早いです。
たとえば、「提出物はAIに書かせない」「ただし、理解のための質問はOK」「AIを使ったら、必ず自分の言葉で要点を説明する」など、検証可能なルールに落とすと運用できます。受験直前期は特に、家庭内の消耗が学習効率に直結するため、短く決めて淡々と回すのが合理的です。
まとめ
今回の「ChatGPTが共通テストで9科目満点・得点率97%」という話題は、AIが“正解が決まっている処理型の問題”で非常に強くなったことを示しています。実際に、LifePromptの検証結果として9科目満点が公表され、報道でも数学・化学・公共(政治・経済)などが満点科目として触れられています。
一方で、AIが間違えやすいのは「国語の心情理解のズレ」「図表・地図・濃淡など視覚情報の読み取り」「出題意図の取り違え」といった領域で、ここがそのまま“人間の勝ち筋”になります。
AI時代の受験で大切なのは、AIを避けることではなく、答えを丸のみせず、根拠を指差しできる形で使い、読解・説明・問い立てを伸ばすことです。共通テストと個別試験では問われ方も違うため、AIを活用して効率化しつつ、二次試験や記述・面接で必要な「自分の言葉」を固める、という分業が現実的です。
差がつく場所は、すでに見えています。あとは、その場所に学習時間を寄せられるかどうかが、これからの勝負になるでしょう。
【関連記事】



コメント