GeminiとCopilot

Microsoft Copilot対Google Gemini
Microsoft Copilot対Google Gemini

Microsoft CopilotとGoogle Geminiの使い方と特徴を簡単にまとめます。最新Gemini 1.5 Proは、GPT-4oを上回る性能と聞いたからです。生成AI性能評価は、専門家に任せ、我々利用者は、両者の特徴や使い方を知っていれば十分です。

生成AI(GeminiやCopilot)ができること、注意点

会話型AIサービスGoogle Geminiは、Microsoft Copilotのライバルです。専門家によると、2024年5月公開の最新Gemini 1.5 Proは、GPT-4oより高性能だそうです。生成AI関連の開発スピードは凄まじいです。

激変AIサービスの利用側は、生成AI利用時の最低限の知識、無償版GeminiとCopilotの使い方や特徴を知っていれば、十分使えます。業務にAIを活用することは、当たり前になりつつあります。先ずは、手軽に無償版生成AIを使い、その特徴や癖を掴んでいけば良いと思います。

生成AI利用時、最低限の注意点、会話型生成AIサービスができることが以下です。

生成AI注意点:ハルシネーション(幻覚)。AIが事実と異なる情報を生成し、まるでAIが幻覚を見ているかのように、もっともらしい回答を生成する現象。AIは、大量のテキストから単語関連性やパターンを学習し、つながる確率の高い単語を使って回答を生成するのが原因。対策は、ユーザ自身による回答出典先確認。

会話型生成AIサービスができること:テキストやPDF、ブラウザ表示中のページ要約が得意。これ以外に、ネット検索や翻訳、AIスマホが得意な画像認識や生成なども可能。有償版は、無償版の制限緩和や高度なプログラミング開発支援もできる。

※生成AI牽引企業GOMA(Google、OpenAI、Microsoft、Anthropic)は、コチラの投稿参照。

Geminiの使い方、特徴

Google Geminiログイン画面
Google Geminiログイン画面

Geminiは、GeminiページへGoogleでログインすると、新しくGemini専用ページが開き、ページ下のプロンプト欄へ質問や相談を入力すると、ページ上にGeminiのAI回答が示されます。

Gemini回答は、最新ネット情報に基づいています。ここが、ChatGPTベースのCopilotと異なる点です。ChatGPTは、GPT-3.5なら2021年9月までの学習済みデータからCopilot回答を生成します。

弊社7月19日ブログのGemini要約例を示します。

Gemini要約画面。画面下がプロンプト欄。画面上にGemini回答と出典が示される。
Gemini要約画面。画面下がプロンプト欄。画面上にGemini回答と出典が示される。

また、Geminiへ一般的な質問や相談をした場合は、「回答を再確認」ボタンが現れ、これを押すと、Gemini回答の基になったリンクが示されますので、ハルシネーション対策ができます。

Gemini回答の確認ボタン
Gemini回答の確認ボタン

Googleログインを使うGeminiは、スマホでよく使うGoogle MapやGoogle Photoなどと連携性が良い会話型生成AIサービスです。

Copilotの使い方、特徴

Copilotの使い方は、コチラの投稿、Afterwordに示しています。

Copilot活用ページ概要生成
Copilot活用ページ概要生成

Microsoftへログインすると、Edgeページ右上にCopilotボタンが表示されます。このボタンを押すと、ページ左側からCopilotエリアが現れます。このエリア内に、ページ概要生成やページ関連質問、会話スタイル選択など良く使うボタンが初めから用意されていますので初心者でも使い易いと思います。

有償版では、WordなどのOfficeアプリとCopilotを連携し、下書き作成や企画書テンプレート自動作成なども可能です。Geminiよりも、Windows PCとの連携を強化しています。

Summary:GeminiとCopilot使い方と特徴

AIスマホとの連携性が良いGeminiは、最新Googleネット情報を基にAI回答を生成します。また、回答再確認ボタンで、AI回答の基リンクが示されるなどハルシネーション対策ができます。

Windowsアプリとの連携性が良いCopilotは、使用するChatGPT版数により学習済みデータ作成年月が異なります。ページ概要生成や会話スタイル選択ボタンが用意済みなど、初心者に判り易いユーザインタフェースです。

Geminiは、Googleログイン、Copilotは、Microsoftログインが必要です。Google/Microsoftともにログインユーザ情報を収集し、より良いAI回答や、次期AI開発に活かすためでしょう。

AI活用は、当然の業務になりつつあります。現在AIサービスは過渡期ですが、安定期まで待って利用開始するより今使い始め、回答やその注意点、癖に慣れると、業務AI活用性を高めると思います。

Afterword:パーソナルAIエージェント(AIアシスタント)の鍵、NPU

販売中Copilot+ PCのNPU TOPS値は、GPUより小さいのが一般的です。例えば、Lunar Lake SoCは、 トータル120TOPS=NPU48+CPU5+GPU67です。この理由が、コチラの記事で解りました。

つまり、GPUでもできるAI処理を、NPUは徹底的に低電力処理できるようにワットパフォーマンスを最適化します。例えば、数時間のビデオ会議でAIが常時同時翻訳をしても、低電力NPUならバッテリー動作も大丈夫となるなどです。

PC/スマホどちらもパーソナルAIエージェント(AIアシスタント)実現に、低電力NPUの常時バックグラウンド学習動作が鍵となりそうです。


安く早いGPT-4o

AI対人間インタフェース性能を向上するGPT-4o
AI対人間インタフェース性能を向上するGPT-4o

2024年5月13日、GOMA(Google、OpenAI、Microsoft、Anthropic)の一角、OpenAIが、GPT-4o(オー)を発表しました。オーは、omni、ラテン語のすべてを意味し、テキスト、音声、画像、映像の入力すべてに統合対応します。従来ChatGPTよりも安く、早い生成AI入出力処理が可能です。

Summary:安く早いGPT-4o

GPT-4o特徴、OpenAI発表の要約などが堀江貴文氏のYouTube動画(6分31秒)で判ります。
前半2分40秒までが、「本物の人間、堀江氏」解説、後半は、GPT-4oを使ってOpenAI発表を要約し、それを「AIで生成した堀江氏」が説明しています。

既存ChatGPTや競合他社比、利用料金が50%安く、音声と画像理解が速いのが統合対応GPT-4oの特徴です。例えば、音声応答は人間と同じ会話速度、笑い声や感情表現画像も出力できます。

Mac版アプリも同時発表、Windows版は、今年後半リリース予定です。

対人間インタフェース性能向上

AIを人が上手く使うコツは、AIへの質問力です。上手い質問ができれば、所望の回答が得られます。ただ現在、AI自身が急変化しています。この過渡期のAIに合わせた質問のコツを人が掴むのは大変です。

そこで、人間同士の対面会話と同じようにAI側が対応できれば、より簡単に質問ができます。AI側が人に近づくからです。また、対人間インタフェース性能向上によりAI自身の学習速度も更に上がります。

安く早いGPT-4o の特徴が活かせるのは、このAI対人間インタフェースの部分です。

例えクラウドAI利用時でも、GPT-4oは、人と同じレスポンス速度で会話し、人の画像を認識、笑うなどAI感情表現も出力します。堀江氏動画(2分5秒頃)で語られた、GPT-4oとぬいぐるみを使った子供や老人のAI話し相手のフロントエンドとして十分使えます。

つまり、AI入出力を、より人間らしく効率的にできる能力をGPT-4oは持っています。

筆者としては、PC向けだけでなく、エッジAI MCU/MPU向けアプリも欲しいです。
※AIとAIデータを引出すChatGPTなどの役割は、コチラの投稿1章参照。

シンギュラリティ

AIが人間よりも賢くなるシンギュラリティ、2045年問題
AIが人間よりも賢くなるシンギュラリティ、2045年問題

AIが人間よりも賢くなる時を、シンギュラリティ(日本語は技術的特異点)と言います。AIの世界的権威:Ray Kurzweil氏が、2005年の著書でシンギュラリティを2045年と予測したため、2045年問題とも呼ばれます。

筆者は、GPT-4oにより、AIがシンギュラリティに一歩近づいたと思います。最近AI関連の話題は、食傷ぎみですが、GPT-4o出現は、予測よりも早くシンギュラリティになる可能性を秘めています。

GoogleやAnthropicのGPT-4o対抗ChatGPT、MicrosoftのGPT-4o対応Copilot、OpenAIの次期GPT-5がどれ程の能力を持つか想像もできません。ただGOMA各社が、AI開発を加速中なのは確かです。

また、進化中のAIが、次世代半導体も牽引しています。GOMAだけでなく、半導体製造、電力、通信各社もAIが動向を左右しています。生成AI革命といわれるゆえんです。
※生成AIと電力、通信会社の関係は、コチラの投稿参照。

Afterword:MCUソフトウェア開発史と似ている?

現在のMCUソフトウェアは、ベンダHAL(Hardware Abstraction Layer)APIを利用した開発です。数十年前のMCU毎に異なるハードウェアドライバを自作し、アプリ担当に自作APIを提供していた頃とは別世界です。

レベルは違いますが、AI進化もこのMCU開発史に似ています。数年後には、人工知能活用開発が普通になるかもしれません。今、AI進化過程を実感できる我々は、幸せだとも思います。

MCU開発者が、PC利用や開発方法を根本から変える可能性があるAI状況を知ることは必然です。根本変化、別世界に対応できるよう状況を把握しておきましょう。