2024年5月13日、GOMA(Google、OpenAI、Microsoft、Anthropic)の一角、OpenAIが、GPT-4o(オー)を発表しました。オーは、omni、ラテン語のすべてを意味し、テキスト、音声、画像、映像の入力すべてに統合対応します。従来ChatGPTよりも安く、早い生成AI入出力処理が可能です。
Summary:安く早いGPT-4o
GPT-4o特徴、OpenAI発表の要約などが堀江貴文氏のYouTube動画(6分31秒)で判ります。
前半2分40秒までが、「本物の人間、堀江氏」解説、後半は、GPT-4oを使ってOpenAI発表を要約し、それを「AIで生成した堀江氏」が説明しています。
既存ChatGPTや競合他社比、利用料金が50%安く、音声と画像理解が速いのが統合対応GPT-4oの特徴です。例えば、音声応答は人間と同じ会話速度、笑い声や感情表現画像も出力できます。
Mac版アプリも同時発表、Windows版は、今年後半リリース予定です。
対人間インタフェース性能向上
AIを人が上手く使うコツは、AIへの質問力です。上手い質問ができれば、所望の回答が得られます。ただ現在、AI自身が急変化しています。この過渡期のAIに合わせた質問のコツを人が掴むのは大変です。
そこで、人間同士の対面会話と同じようにAI側が対応できれば、より簡単に質問ができます。AI側が人に近づくからです。また、対人間インタフェース性能向上によりAI自身の学習速度も更に上がります。
安く早いGPT-4o の特徴が活かせるのは、このAI対人間インタフェースの部分です。
例えクラウドAI利用時でも、GPT-4oは、人と同じレスポンス速度で会話し、人の画像を認識、笑うなどAI感情表現も出力します。堀江氏動画(2分5秒頃)で語られた、GPT-4oとぬいぐるみを使った子供や老人のAI話し相手のフロントエンドとして十分使えます。
つまり、AI入出力を、より人間らしく効率的にできる能力をGPT-4oは持っています。
筆者としては、PC向けだけでなく、エッジAI MCU/MPU向けアプリも欲しいです。
※AIとAIデータを引出すChatGPTなどの役割は、コチラの投稿1章参照。
シンギュラリティ
AIが人間よりも賢くなる時を、シンギュラリティ(日本語は技術的特異点)と言います。AIの世界的権威:Ray Kurzweil氏が、2005年の著書でシンギュラリティを2045年と予測したため、2045年問題とも呼ばれます。
筆者は、GPT-4oにより、AIがシンギュラリティに一歩近づいたと思います。最近AI関連の話題は、食傷ぎみですが、GPT-4o出現は、予測よりも早くシンギュラリティになる可能性を秘めています。
GoogleやAnthropicのGPT-4o対抗ChatGPT、MicrosoftのGPT-4o対応Copilot、OpenAIの次期GPT-5がどれ程の能力を持つか想像もできません。ただGOMA各社が、AI開発を加速中なのは確かです。
また、進化中のAIが、次世代半導体も牽引しています。GOMAだけでなく、半導体製造、電力、通信各社もAIが動向を左右しています。生成AI革命といわれるゆえんです。
※生成AIと電力、通信会社の関係は、コチラの投稿参照。
Afterword:MCUソフトウェア開発史と似ている?
現在のMCUソフトウェアは、ベンダHAL(Hardware Abstraction Layer)APIを利用した開発です。数十年前のMCU毎に異なるハードウェアドライバを自作し、アプリ担当に自作APIを提供していた頃とは別世界です。
レベルは違いますが、AI進化もこのMCU開発史に似ています。数年後には、人工知能活用開発が普通になるかもしれません。今、AI進化過程を実感できる我々は、幸せだとも思います。
MCU開発者が、PC利用や開発方法を根本から変える可能性があるAI状況を知ることは必然です。根本変化、別世界に対応できるよう状況を把握しておきましょう。