![](https://jyurin-hack.com/it/wp-content/uploads/2024/12/dd84b1d87de759b5e871f4f0484c8409-1200x675.jpg)
こんにちは。じゅりんHACK管理人のじゅりんです。
今日はちょっとワクワクする話題があったので慌ててPCに向かっています!
実は、ChatGPTに大きなアップデートがあって、「高度な音声モード」っていう新機能に「目」がついたんです!。え?「 目って何?」って思いますよね。文字通り、ChatGPTがカメラで現実世界を見ることができるようになったんです。ぼくらがChatGPTのスマホアプリで普通にAIとしゃべりながらスマホのカメラを向ければ、ChatGPTはその景色やモノを認識してくれちゃう。もうだいぶSFっぽい感じになってきましたよね!
ということで、実際に試してみました…いやいや、これはかなりおもしろいですし、すごい可能性を感じました!
「目」のあるChatGPTと実際に話してみた!
この「目」のあるChatGPTとの会話をぼくは実際に試してみたんですが、これが想像以上にすごかった。たとえば、ぼくをカメラで写して「これは誰?」って尋ねれば、
![](https://jyurin-hack.com/it/wp-content/uploads/2024/12/f4205a7fc8c643dc3b86b8c5b1e653d7.png)
「見えているのはじゅりんさんだと思います。背景にたくさんの本が並んでいて、いつもの雰囲気ですね。」
って即座に答えてくれるんです。
さらにぼくがメガネをかけているってことや、ぼくの表情が笑っているかどうか、それくらいの細かいポイントまで読み取ってくれるんですよ。「これホントにAIなの?こっそり人間が見てない?」って思わず二度見しちゃいました。
さらに驚いたのは、ぼくの背後にある本棚まで認識しているところ。こちらが聞いていないことまでちゃっかり拾ってくるところが面白いですよね。ちょっとおせっかいなところが、人っぽくてクスッときました。というか、認識力が凄すぎる。人間なら見落とすところまで、しっかり見ている!(見られている!)
他にも、デスク周りのPCやモニターを見せて、それが何なのかを確認してもらったり(ほとんど当たりました)。PC上に表示したメールの文面を見てもらって、「このメールにどんな返信したらいいと思う?」って聞いたら、ちゃんと答えてくれたり。いやいや、ちょっと試しただけでも想像を上回る認識力です。
気をつけないと、楽しすぎてあっという間に「高度な音声モード」の使用上限まで使ってしまいそうです。
「目」のあるChatGPTの可能性!
で、これを使って何ができるのかというと、たとえば目の前の書類をカメラで見せながら、「この補助金申請書、どう書けばいいかな?」って聞けたりするのではないかと。
今までもPDFなどでこういった申請書の書類はChatGPTにサポートしてもらえましたが、何枚もある紙の書類をパラパラとめくりながら、ChatGPTにサポートしてもらえるなら、ほぼほぼ人間のアドバイザーと変わらないくらいになるのでは!?と思っちゃいました。
同じように、紙ベースの契約書とかちょっと専門的な資料なんかでも、特にスキャンとか必要なくAIにチェックしてもらえるようになったりするのかもしれないなぁ、なんて夢がふくらみます。
さらに未来には、もっと直接人命救助に関わるような使い方もできるかもしれません。
たとえば、医療現場で困っている人が目の前にいるときに、その様子をChatGPTに見せてアドバイスをもらうとか。もちろん、実際の医療行為はお医者さんに任せなきゃいけないですが、緊急時に素早い判断が必要なときに、何かのヒントをくれたりしたら……ちょっとSFみたいな話ですが、将来的にはあり得るのかもって思います。(ChatGPTなどのAIは医療行為に関することは答えられないので、今はまだ厳しいかもしれませんが)
「目」で見るChatGPTはさらに世の中を変える!
この「目」で見るChatGPTの機能はまだ始まったばかりで、完璧とは言えません。
でも、ぼくとしては「おー、とうとうAIが世界を見て、考えて、答える時代がきたか!」と胸が高鳴るばかりです。実際、試してみると想像を超えた面白さがあって、これからどんな進化をしていくのか、本当に楽しみです。
これからもぼくはこの新機能をいろいろ試してみて、活用方法を見つけていこうと思います!!