ここからこの記事のポッドキャストが聞けます

こんにちは!じゅりんです。今回は、数時間前に行われた 「Google I/O 2024」発表内容をぼくの方で少し整理してお伝えしていきたいなと思います。
昨日のOpenAIの発表に続いて、翌日にはGoogleの発表という形で、AI関連が盛り上がってますね!今回のGoogleの発表も、ほぼほぼAIについての発表で、やっぱりAIに力を入れてますよ、というのがはっきりとわかるような発表でした。
ただ、全体的な印象としては、「Googleすごいよ」っていうアピールばかりだったかな、と。機能面、性能面の進化はすごいんですが、昨日のOpenAIの発表みたいに「AIと人間が仲良くなる」みたいな一貫したテーマが見えにくかったのが、少し残念でした。Googleはすごいんだけど、方向性がちょっとバラバラな感じがしましたね。
Gemini AIの進化
まず、Googleのチャット型AI「Gemini」が進化しました。有料プラン「Gemini Advanced」では、最新モデル「Gemini 1.5 Pro」が使えるようになり、なんと100万トークンという膨大な文字数を扱えるようになったんです!日本語で考えると、約100万文字まで対応できるってことですね(厳密には1トークン1文字ではありません)。
100万文字もあれば、一般的な仕事(数時間にもわたる議事録の作成など)や本を読ませて要約させたりするには十分すぎる量ですよね。しかも、ChatGPT-4並みの能力を持っているということで、これは本当にすごい進化だと思います。
さらに、今後は200万トークンまで拡張される予定らしいですが…さすがに使いこなせる人は限られてくるんじゃないかな、というのが正直な感想です。
Gemini AdvancedとGoogleサービスの連携強化
そして、これもおそらく有料プランが中心になると思うんですが、「Gemini Advanced」では、GeminiとGoogleサービス(Gmail、Googleドキュメント、Googleスプレッドシートなど)が直接連携できるようになるそうです。
AIがガッツリ組み込まれて、より便利になるみたいですね。無料プランユーザーとしては、羨ましい限りです。
検索サービスの強化
検索サービスもAIによって大きく変わります。今までのようにキーワードではなく、文章で検索できるようになるんです。例えば「昨日行われたGoogleのイベントの情報をまとめて教えて」みたいに検索できるようになる、ということですね。
さらに、検索結果の一番上に、AIが情報を要約したものを表示してくれるようになるそうです。これは、膨大な情報の中から必要な情報にすぐにアクセスできるようになる、とても便利な機能だと思います。
…ただ、ちょっと気になるのは、ブログ記事とかが読まれなくなってしまうんじゃないか?ってことなんですよね。AIが要約した情報だけで満足して(Googleの検索結果の画面だけで満足して)、元のブログ記事まで見に行ってくれる人が減ってしまうんじゃないかと…。ブログを書いている身としては、少し心配なところです。
Project Astra
個人的に面白いと思ったのは、「Project Astra」という機能です。スマホのカメラで映している映像をAIが認識して、質問に答えたり、サポートしてくれる機能。
例えば、街を歩いていて「ここは何て場所?」って聞けば、AIが教えてくれますし、「メガネどこ置いたっけ?」って聞けば、一連の流れで映っていた映像からメガネが置いてあった場所を教えてくれます。視覚障碍者の方には特に役立つ機能だと思いますし、そうでなくてもいろんな使い方ができそうで、ワクワクしますね。
Ask Photos
What if your photos could answer your questions? 🤔 At #GoogleIO today, we announced Ask Photos, a new Google Photos feature that does just that. Ask Photos is the new way to search your photos with the help of Gemini. #AskPhotos https://t.co/KhPeCauFAf pic.twitter.com/3MZg55SgdD
— Google Photos (@googlephotos) May 14, 2024
これも面白い!「Ask Photos」は、Google Photoに保存されている膨大な写真の中から、AIが目的の写真を探し出してくれる機能です。
例えば、「子供が幼稚園の頃、プールでお母さんと一緒に浮き輪で遊んでる写真」みたいに、複数のキーワードを含む自然な文章で検索できるんです。Google Photoに何万枚も写真がある人にとっては、すごく便利な機能だと思います。
動画生成技術の向上
Googleからも、テキストから動画を生成するAIが登場しました。「Veo」という名前のAIで、OpenAIの「Sora」と同じように、テキストで指示した通りの動画を生成してくれます。まだ発展途上ではありますが、これからの進化が楽しみな技術です。
教育系AI機能
教育分野でもAIが活用されるようになりそうです。単純に答えを教えてくれるだけでなく、問題の解き方をステップバイステップで教えてくれる、家庭教師のようなAIが登場するんです。教育系のYouTube動画と連動して、動画を見ながらAIが学習をサポートしてくれたりする機能も搭載されていくようです。
この辺りは、多くのサービスを自社で抱えるGoogleならではの機能ですよね。
詐欺検出機能(スマホ)
最後に、ちょっと気になったのが「詐欺検出機能」です。スマホにかかってきた電話の内容をAIがリアルタイムで分析して、詐欺の可能性を検出して警告してくれる機能なんです。
ちなみに、AI(Gemini nano)はスマホ搭載されたものを使うようなので、インターネットに接続して通話内容を送ることはないようでセキュリティ的にも安心です。
英語と日本語とで言語や詐欺の会話パターンが違うでしょうから、どの程度詐欺を検出できるのかはまだ未知数ですが、もしかしたらすごく頼りになる機能になるかもしれませんね。
まとめ
今回のGoogleの発表は、個々の技術はすごいものの、全体として見るとちょっとバラバラな印象でした。個人的にはOpenAIのような明確なメッセージ性が欲しかったです。
とはいえ、GoogleのAI技術はこれからもどんどん進化していくと思うので、引き続き注目していきたいと思います。