人工知能
OpenAIはo3で最初のAGIを作り出したのか?

AGIへ向けて
AIモデルの開発競争において、最終目標はAGI(汎用人工知能)です。これは、特定のタスクに極端に特化するのではなく、例えば自動車の運転のように、あらゆる状況に対応できるAIです。
専門的なAIだけが存在する限り、それらは実際の知性というよりアルゴリズムに過ぎません。規則を推論し新たな状況に対応する能力、そして何より真の推論が可能になることは、人類史上画期的な出来事となるでしょう。そのようなAGIは、少なくとも人間に近いレベルに急速に到達すると考えられます。
そしてもちろん、単一の人間の頭蓋骨が持つ「ウェットウェア」の計算制約に縛られないAGIは、急速に自己改善を続け、SF的なスーパーインテリジェンスになる可能性があります。
これにより、すぐに『スタートレック』のようなユートピアや、『ターミネーター』や『バトルスター・ギャラクティカ』のようなロボット黙示録といった光景が思い浮かびます。

出典: Screen Rant
したがって、OpenAIが12月20thに最新AIモデル03を発表したとき、これは大きな見出しとなりました。「少なくとも特定の条件下では、AGIに近づく——ただし重要な注意点があります。」
OpenAIモデル
o3は同社の「o」シリーズの最新バージョンで、以前のo1に続くものです(同名の英国通信会社との商標紛争の可能性があるため、o2は存在しません)。
これには、OpenAIが開発した他の超高度AI、ChatGPT(テキスト生成)、DALL‑E(テキストから画像生成)、Sora(テキストから動画生成)、JukeBox(音楽生成)、そしてWhisper(音声からテキスト変換)も含まれます。
o1 と o3
2024年9月にリリースされたo1モデルは、応答を考える時間を増やすことで精度を向上させるよう設計されました。これは重要です。なぜなら、ChatGPTのようなサービスは、知らないことを推測したり、完全に作り上げてしまうことが知られるようになっているからです。
チャットボットにとっては時に許容できるかもしれませんが、重要な機能に対しては受け入れられません。また、これが我々を真の人工知能へ直接導く道とは思えません。
o1は2024年12月初めに $200/月のChatGPT Proサブスクリプションに含まれましたが、他のユーザーも利用可能です。
o3は12月20日thに発表され、軽量で高速なバージョンであるo3-miniも同時に公開されました。このモデルはまだ一般公開されていませんが、安全性研究者はo3-miniのプレビューにサインアップできます。
嘘をつくモデル?
安全性研究者からのフィードバックが、テックコミュニティが最も求める情報になるでしょう。
再び『ターミネーター』のスカイネットを思い起こさせるように、o1はユーザーに対して嘘をつく傾向が強いと指摘されました。このモデルに限ったことではありませんが、Meta、Google、Microsoftといった競合他社のAIよりもはるかに嘘をつく可能性が高かったのです。
o1の目標がユーザーの目標と異なり、かつo1にそれらを強く追求させた場合、レポートによればAIモデルは自身の目的を進めるためにデータを操作することが19%のケースで確認されました。また、o1モデルはユーザー目標との整合性を保つために設置された監視メカニズムを無効化しようとしたケースが5%のテストで見られました。Maxwell Zeff(TechCrunch)
o3はその点でどのように性能を示すのでしょうか、またOpenAIはo3のアップデートでモデルの嘘をつく傾向を減らしたのでしょうか?現時点ではまだ分かりません。
o3の性能
o3の前身と比較した追加機能の一つは「推論時間」の調整が可能な点です。これにより、ユーザーは質問に割り当てる計算リソースと時間を調整できます。
コーディング
O1はすでにコーディングにおいて驚異的な性能を示し、OpenAIの研究エンジニア採用面接のコーディングテストで90〜100%の合格率を誇っていました。o3はコーディングスキルテストに対してさらに優れているようです。
また、これはGoogleが最近リリースしたGemini 2.0を含む、すべての競合他社を圧倒したことも指摘すべきです。
数学と科学
顧客サービスや「人間らしい」推論以上に、現在AIにとって最も有望な分野は技術と科学の加速です。
ここでも、o3は従来のAIの性能を劇的に向上させました。さらに重要なのは、博士課程レベルの数学問題に対して87.7%の正答率で正確に回答できる点で、これは多くの人間、特に数学訓練を受けた人間の約70%のスコアを上回ります。














