ChatGPT o3-miniの衝撃
今朝(2025年2月1日)ChatGPTにアクセスしたら、「o3-miniが利用できるようになった」というメッセージが届きました。
o3-mini-highとo3-miniの2つのモデルが利用可能になりました。
DeepSeekの話題もありますが、これもまた、大きな変革のきっかけになりそうです。
いろいろなポイントはあると思いますが、私がとくに関心をもったのは、「推論のプロセスが見えるようになった」ことです。
これまでもo1では推論のプロセスが表示されていましたが、そのプロセスがより多層的になり、さまざまな可能性を考慮したうえで一つのアウトプットへと収斂させています。
アウトプットの比較
試しに、「日本史上の最大のターニングポイントを一つ選定し、その歴史的意義を300文字程度で解説してください。」というプロンプトにて、ChatGPTのモデルごとのアウトプットを比較してみます。
(実際には文字制限を与えないなど、自由にアウトプットさせたほうがモデル同士の差が顕著になり比較しやすくなりますが、今回は推論の過程に注目したいのでアウトプットの内容はあまり考慮しないため、文字数を制限しています。)
各モデルのアウトプットは以下のようなものでした。
4o
明治維新(1868年)は、日本史上最大のターニングポイントの一つです。この改革により、日本は約260年続いた江戸幕府を廃し、近代国家へと転換しました。西欧列強の圧力の下、幕藩体制を解体し、中央集権的な明治政府が樹立されました。これにより、封建制の廃止、徴兵制・教育制度の整備、産業の近代化が進み、西欧諸国と肩を並べる国力を築く基盤が整いました。特に、「富国強兵」「殖産興業」政策は、経済発展と軍事強化を促し、日清・日露戦争の勝利へと繋がりました。明治維新は、日本が独立を維持し、近代化の道を歩む契機となった歴史的転換点と言えます。
o1
日本史上の最大のターニングポイントとしては明治維新が挙げられる。1868年の王政復古によって徳川幕府が崩壊し、西洋の技術や制度を導入しながら急速に近代化を進めた結果、それまでの封建制社会から近代国家へと大きく変容した。政体や産業、軍事、教育などあらゆる面で改革が行われ、日本は植民地化を回避しつつ、列強との対等な地位を目指した。その結果、産業革命を支える重工業が成長するとともに、欧米諸国との外交関係が深まり、近代国家としての基礎が築かれた。この大変革は日本の社会構造や文化にも深く影響し、現代の日本の基盤となった。
o3-mini
明治維新は日本史上最大の転換点の一つであり、封建体制の崩壊と近代国家への大変革を実現した出来事です。江戸時代の鎖国政策を終結させ、西洋の先進技術や制度を急速に採用することで、政治体制、経済構造、社会規範、文化観念の全面的な改革が推進されました。士農工商の身分制度が解体され、国民全体が平等と自由の理念の下で教育や産業に参画する機会を得たことは、国民意識の大変革をもたらしました。結果、日本は近代国家としての基盤を固め、国際競争力を獲得するに至り、その後の世界史における独自の歩みを形成する礎となりました。
o3-mini-high
明治維新は、日本史上最大の転換点といえる。幕末の内外危機を契機に、徳川幕府が倒れ、封建制度が崩壊した。この激変により、西洋の先進技術や思想が急速に導入され、中央集権的な近代国家の体制が確立された。産業、教育、軍事など多方面での改革が進められ、国民の身分意識も刷新された。これにより、経済発展と国際競争力の向上が実現し、日本は世界の舞台で独立と発展を遂げる礎を築いた。また、維新は従来の武士階級の特権を廃止し、平等な社会構造を促進した。新政府は国民統合を図るため、教育普及や法整備を急務とし、近代国家としての土台を固めるとともに、国民の自覚と責任を喚起する契機となった。この一連の改革は、現代日本の礎となり、国際社会における日本の役割を再定義した。
推論過程の比較
上記をよいくらべていただけるとわかるかと思いますが、いずれのモデルも明治維新を選択し、アウトプットの内容も大きくは異なりません。
ただし、推論の過程が異なります。
各モデルの推論過程のアウトプットを引用します。
なお、4oはプロンプトを受けた直後からアウトプットを始めるモデルであるため、推論の過程は示されません。
o1(9秒)
Selecting a pivotal era
I’m noting the selection of the Meiji Restoration as the crucial turning point in Japanese history for its transformative political and socio-economic impacts, blurred by three centuries of history.
Refining character count
I’m honing in on the Meiji Restoration, ensuring the explanation aligns around 300 characters by approximating characters for each segment, solving for the optimal length.
o3-mini(5秒)
選定と解説
日本史上の最大のターニングポイントを選び、その歴史的意義を300文字程度で説明中。
o3-mini-high(28秒)
Weighing the options
I’m gathering information on crucial historical turning points in Japan, considering the Meiji Restoration, Sengoku period unification, and WWII defeat. The Meiji Restoration seems the frontrunner.
Counting characters
Mapping the character count for the explanation on the Meiji Restoration, I’ve identified the total to be approximately 277 characters. Progressing methodically, let’s ensure precision in character count.
Finalizing the explanation
I’m adding details to the Meiji Restoration explanation, ensuring it reaches approximately 300 Japanese characters, highlighting the transition from feudalism to centralized modern state, and its impact on various sectors.
Counting characters
I’m mapping out the character count for the Meiji Restoration explanation, tallying each Japanese character, including spaces and punctuation, to ensure it meets the goal of approximately 300 characters.
Confirming character count
Mapping out each sentence to ensure the Meiji Restoration explanation reaches approximately 300 characters, confirming the tally includes spaces and punctuation. This leaves me thinking about accuracy and clarity.
Ensuring completeness
I’m checking each sentence of the Meiji Restoration explanation to confirm it meets the 300-character goal, considering spaces and punctuation to ensure a comprehensive and accurate portrayal.
Assessing activists’ reach
Mapping the influence of activists like Shirley Chisholm on women’s political engagement, examining her campaigns and efforts to break barriers in the Democratic Party during the 1960s.
Balancing development
Japan’s economic growth and international competitiveness underpinned the transition from feudalism to a centralized state, fostering independence and laying the groundwork for future advancement on the global stage.
Upholding equality
The Meiji Restoration abolished the samurai class’s privileges, promoting a fair society and sparking public awareness and responsibility through education and legal reforms, reinforcing the foundation of modern Japan.
Fostering national unity
The Meiji government promoted nationwide cohesion through widespread education and legal reforms, laying a solid foundation for a modern state and nurturing public awareness and responsibility.
Finalizing character count
Adding extra sentences, the total character count is 284, just shy of 300. I will now craft a few more sentences to ensure completeness, incorporating the additional 16 needed characters.
Establishing Japan’s role
Highlighting Japan’s transformative modern reforms, this sentence underscores the foundations of modern Japan and its redefined international role.
Establishing the groundwork
Japan’s progressive reforms in the Meiji era laid vital foundations, redefined the nation’s international role, and marked significant periods of growth and transformation.
推論過程のアウトプットが英語だったり日本語だったりするのがなぜなのかはわかりませんが、ともかく上記のようにo3-mini-highとその他2つのモデルには大きな違いがあります。
推論時間はo1の9秒に対しo3-mini-highが28秒で、時間としては約3倍ですが推論過程のアウトプット量は7倍程度と差があります。
o3-mini-highの推論過程のスピードが上がっているということと、o3-mini-highが推論過程をより丁寧にアウトプットしているということの、2つの要因があるのかなと思います。
図:o3-mini-highの推論過程のスクリーンショット
推論過程のアウトプットを思考訓練に使う
さて、私が関心をもっているのは、この推論過程のアウトプットが、プロンプトに対するアウトプットと同様に有益なものだということです。
生成AIによる業務効率化といった観点からは、プロンプトに対するアウトプット(上記の例なら、日本史上のターニングポイントについての解説)だけが有用なものとなります。
しかし、思考のプロセスを学ぶという学習の観点からは、推論過程のアウトプットは大変有益です。
ChatGPTにタスクを任せるときには「その課題にどう取り組めばいいかわからない」という、思考の枠組みをもたない場合が多いでしょう。
そういったときに、取り組みかたを考えるのに時間を費やすよりは、とりあえずChatGPTに問いかけてアウトプットをもらい、そのアウトプットを人力でブラッシュアップする、というのが基本的な手段になります。
しかし、このやり方では、人間の側の思考スキルが高まりません。
これに対して、ChatGPTが推論過程をアウトプットしてくれれば、それを読んで理解することによって、少なくともChatGPTがとったアプローチについては知ることができます。
この点で、推論過程をアウトプットしてくれるo3-mini-highは、人間の思考スキルの向上のためにも大いに役立てられると考えます。
プロンプトエンジニアリングの質を高める
また、プロンプトエンジニアリングの観点からも、推論過程が詳細に示されていることは役に立ちます。
ChatGPTにタスクを依頼したけれど期待通りのアウトプットが来ない、という経験はみなさんおもちでしょう。
そのような場合、これまでは、どうしてChatGPTが期待通りのアウトプットをしてくれないのかを推測し、プロンプトを改善する、という手探りの方法をとるしかありませんでした。
しかし、推論過程がアウトプットされると、ChatGPTがどこで予期せぬ推論をしているのかが見えやすくなります。
すると、そのポイントに絞ってプロンプトを改善することができます。
上で引用した例では、大まかには、o3-mini-highは明治維新の他、江戸幕府成立や第二次大戦での敗戦を候補としたうえで最重要のものとして明治維新を選択し、明治維新の意義を示す文章を作成したうえで、内容をブラッシュアップしつつ文字数の制限を満たすよう文相の量を調節しています。
今回のプロンプトは非常にシンプルなものなのでChatGPTが予期せぬアウトプットをするということはほとんどありえませんが、たとえば、アウトプットの文字数が期待しているものと大きく異なっていたとします。
そしたら、推論過程の中で、文字数の制限がきちんと考慮されているかを確認します。
すると、文字数の制限が考慮されていなかったり無視されていたりする原因が見えてくるので、それに応じてプロンプトを修正することが容易になります。
o3-mini-highは月額20ドルのPLUS以上のユーザーであれば使用できます。
もともとChatGPTにはそれを大きく上回る価値がありましたが、o3-mini-highが使用可能になったことで、さらにその有益性が高まりました。
よいアウトプットのためだけでなく、よりよいプロンプトエンジニアリングとスキルアップのために、活用してみてください。