MENU

新しいChatGPT-o1モデル登場!どこがすごいのかざっくり解説

リンクの一部にアフェリエイト広告を利用しています。
  • URLをコピーしました!

こんにちは!じゅりんHACK管理人のじゅりんです。

今回は、OpenAIがリリースした新しいAIモデル「ChatGPT-o1」についてざっくりとお話ししていきます。この新しいモデルがどんな特徴を持っているのか、どんな場面で役立つのか、一緒に見ていきましょう!

LISTEN
#115 新モデル「ChatGPT o1」は何がすごいのか?実際に使ってみました! - じゅりんHACK|ラジオ館 突如として発表されたOpenAIのチャット型AIの新モデル「OpenAI o1」。有料版を使っている方は、すでに使える状態になっていますが、今回のモデルは今までのモデルの進化と...
目次

ChatGPT-o1って何?

まず、ChatGPT-o1っていうのは、2024年9月13日にOpenAIが新しく発表したAIモデルです。「o1」という名前はちょっとわかりにくいかもしれないですけど、ポイントは「考えるAI」っていうところ。「ついにGPT-5」なのか?なんて噂もありましたが、今回のo1はちょっと違います。

今までのAIは、質問に対して瞬時に答えを出すタイプでしたが、o1は違うんです。「考える時間」を作って、より正確に答えを出す仕組みが入っているんです。例えば、普通のChatGPT-4は、質問に対して1回でバーンと答えを出してくれるんだけど、その過程で間違えちゃうことがありました。

でも、ChatGPT-o1は少し時間をかけて考え、答えをチェックして改善したりします。例えば、一度答えを出した後に「本当にこの答えで良いのか?」と自分で振り返るプロセスが入っているんです。もし間違いや曖昧な部分があれば、もう一度考え直してより良い答えに修正してくれるんですよ。つまり、今までよりももっと人間らしい考え方をしてくれるってことです。これは、私たち人間が難しい問題に取り組むときに、何度も見直して最適な答えを見つけるプロセスに似ていて、とても共感できる部分ですよね。

GPT-4oとの違いは?

OpenAIのHPを見てみると、このGPT-o1の能力についても詳しく書かれていました。物理学や科学、生物学の難しいベンチマークタスクで、博士課程の学生と同等のパフォーマンスを発揮したそうです。また、数学とコーディングでも優れた結果を示していて、特に国際数学オリンピック(IMO)の予選試験では、GPT-4が13%しか正解できなかった問題に対して、GPT-o1はなんと83%のスコアを獲得しました。

さらに、コードフォースコンテストではGPT-o1のコーディング能力が評価され、89%という高スコアを達成したことも報告されています。これによって、複雑で難しい問題に対する正答率が大幅に向上していることがわかります。

加えて、安全性も非常に強化されています。従来のGPT-4は安全ルールを突破する「ジェイルブレイク」への対応が弱く、100点満点中の22点しか取れなかったんですが、GPT-o1では84点を獲得しています。この結果、悪意のある使い方を防ぐ能力が大幅に向上しており、安全に使用することができるようになっているんです。

Introducing OpenAI o1-preview

思考が必要な「ひっかけ問題」にもo1は正解しました

GPT-4と頭の良さ自体はあんまり変わらないみたいです。ただ、答えを出すときのプロセスが違うんですよね。GPT-4は「速攻で答える」スタイルでしたが、o1は「じっくり考えて答える」スタイル。

例えば、「幼女が30メートルの井戸に落ちて、1時間ごとに3メートル登って2メートル落ちる」という引っ掛け問題があります。この問題、普通に考えるとちょっとややこしくて、どのタイミングで井戸を登り切るかを見極めるのが難しいんですよね。

GPT-4にこの問題を解かせてみると、途中で計算を間違えてしまい、結果として「29時間」という答えを出してしまいました。でも実は正解は「28時間」なんです。o1はこの問題に対して、少し時間をかけて考えることで、どのステップで井戸を登り切るかを正確に判断し、正しい答えを出してくれました。この「考えるプロセス」を丁寧に行うのが、o1の大きな強みなんです。

どんな人におすすめ?

このo1、今のところは有料版ユーザーしか使えないですし、1週間の使用回数も制限があります。でも、プログラミングとか研究、論理的な課題に取り組む人にとってはとても便利。例えば、コードを書くときにエラーを減らしながら、考えながら進めてくれるので、コーディングにはかなり助かるかも。

逆に、普段使いするには少しオーバースペックかなという感じもします。なので、今すぐに日常生活で大活躍するかというと、そうでもないかもしれません。でも、試しに使ってみる価値はありますよ!

試してみたい?

今、GPT-o1は有料プランの人なら使えますし、使い方も簡単。例えば、論理クイズみたいなのを投げかけてみると、その「考える力」を実感できると思います。ちょっとしたクイズでも、どうやって考えて答えにたどり着いたのかを見せてくれるので、結構面白いですよ。

ということで、新しいChatGPT-o1についてざっくりお話ししました。もし興味があれば、ぜひ試してみてくださいね!

この記事が気に入ったら
いいねしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次