安く早いGPT-4o

AI対人間インタフェース性能を向上するGPT-4o
AI対人間インタフェース性能を向上するGPT-4o

2024年5月13日、GOMA(Google、OpenAI、Microsoft、Anthropic)の一角、OpenAIが、GPT-4o(オー)を発表しました。オーは、omni、ラテン語のすべてを意味し、テキスト、音声、画像、映像の入力すべてに統合対応します。従来ChatGPTよりも安く、早い生成AI入出力処理が可能です。

Summary:安く早いGPT-4o

GPT-4o特徴、OpenAI発表の要約などが堀江貴文氏のYouTube動画(6分31秒)で判ります。
前半2分40秒までが、「本物の人間、堀江氏」解説、後半は、GPT-4oを使ってOpenAI発表を要約し、それを「AIで生成した堀江氏」が説明しています。

既存ChatGPTや競合他社比、利用料金が50%安く、音声と画像理解が速いのが統合対応GPT-4oの特徴です。例えば、音声応答は人間と同じ会話速度、笑い声や感情表現画像も出力できます。

Mac版アプリも同時発表、Windows版は、今年後半リリース予定です。

対人間インタフェース性能向上

AIを人が上手く使うコツは、AIへの質問力です。上手い質問ができれば、所望の回答が得られます。ただ現在、AI自身が急変化しています。この過渡期のAIに合わせた質問のコツを人が掴むのは大変です。

そこで、人間同士の対面会話と同じようにAI側が対応できれば、より簡単に質問ができます。AI側が人に近づくからです。また、対人間インタフェース性能向上によりAI自身の学習速度も更に上がります。

安く早いGPT-4o の特徴が活かせるのは、このAI対人間インタフェースの部分です。

例えクラウドAI利用時でも、GPT-4oは、人と同じレスポンス速度で会話し、人の画像を認識、笑うなどAI感情表現も出力します。堀江氏動画(2分5秒頃)で語られた、GPT-4oとぬいぐるみを使った子供や老人のAI話し相手のフロントエンドとして十分使えます。

つまり、AI入出力を、より人間らしく効率的にできる能力をGPT-4oは持っています。

筆者としては、PC向けだけでなく、エッジAI MCU/MPU向けアプリも欲しいです。
※AIとAIデータを引出すChatGPTなどの役割は、コチラの投稿1章参照。

シンギュラリティ

AIが人間よりも賢くなるシンギュラリティ、2045年問題
AIが人間よりも賢くなるシンギュラリティ、2045年問題

AIが人間よりも賢くなる時を、シンギュラリティ(日本語は技術的特異点)と言います。AIの世界的権威:Ray Kurzweil氏が、2005年の著書でシンギュラリティを2045年と予測したため、2045年問題とも呼ばれます。

筆者は、GPT-4oにより、AIがシンギュラリティに一歩近づいたと思います。最近AI関連の話題は、食傷ぎみですが、GPT-4o出現は、予測よりも早くシンギュラリティになる可能性を秘めています。

GoogleやAnthropicのGPT-4o対抗ChatGPT、MicrosoftのGPT-4o対応Copilot、OpenAIの次期GPT-5がどれ程の能力を持つか想像もできません。ただGOMA各社が、AI開発を加速中なのは確かです。

また、進化中のAIが、次世代半導体も牽引しています。GOMAだけでなく、半導体製造、電力、通信各社もAIが動向を左右しています。生成AI革命といわれるゆえんです。
※生成AIと電力、通信会社の関係は、コチラの投稿参照。

Afterword:MCUソフトウェア開発史と似ている?

現在のMCUソフトウェアは、ベンダHAL(Hardware Abstraction Layer)APIを利用した開発です。数十年前のMCU毎に異なるハードウェアドライバを自作し、アプリ担当に自作APIを提供していた頃とは別世界です。

レベルは違いますが、AI進化もこのMCU開発史に似ています。数年後には、人工知能活用開発が普通になるかもしれません。今、AI進化過程を実感できる我々は、幸せだとも思います。

MCU開発者が、PC利用や開発方法を根本から変える可能性があるAI状況を知ることは必然です。根本変化、別世界に対応できるよう状況を把握しておきましょう。


生成AI革命インパクト

生成AI革命は、GAFAMと呼ばれる現在のIT企業勢力図を変えそうです。米)The Atlantic分析では、新勢力は、GOMA。2024年2月16日のプレジデント オンライン記事が、「Google+Anthropic」対「Microsoft+OpenAI」と解説しています。

生成AI革命によるIT企業、半導体産業、MCUベンダへのインパクト記事をまとめました(生成AI革命はAfterword1参照)。

※2月23日金曜が天皇誕生日で休日のため、木曜先行投稿します。

Summary:生成AI革命インパクト

生成AI革命は、企業、産業、生活など全てにインパクトを与えそうです。例えば、人々のネット利用は、従来の検索型からChatGPTと生成AIによる会話型へ変わるでしょう。会話型に慣れると、検索型へは戻れないからです(検索/会話型はAfterword2参照)。

このようにChatGPTと生成AIは、人間へ優れたAIとのインタフェースを与えます。しかも、AI進化・学習スピードは、人間の比ではありません。

企業サービス利用者は、このAIを上手く使えるか否か、つまり、AI活用性が重要な選択肢になるでしょう。

一方、サービス提供企業は、利用者のAI活用欲求を満たさないと、企業衰退の可能性があることを本稿の各記事は示しています。

GAFAMからGOMAへ

生成AI革命がGAFAMからGOMAへ変える
生成AI革命がGAFAMからGOMAへ変える

GOMAは、Google、OpenAI、Microsoft、Anthropicの頭文字です。

米)Anthropicは、2021年設立のAIスタートアップ企業で、当時OpenAI研究担当副社長ダリオ・アモディ氏らが、MicrosoftとOpenAI協業方向の違いから退き設立した会社です。そして、Anthropicの協業先は、Googleです。

GAFAMからGOMAへ変わる理由は、AIの開発・運営費用が、従来の検索型コストの10倍かかるからです。このコストを賄いつつも、AIがどの程度利益を生み出すかは、現状不透明です。

このリスクを承知の上でAIを牽引できるのは、検索大手2社、GoogleとMicrosoftだけです。その結果、The Atlanticは、GAFAMからGOMAへ変わると分析しています。

ChatGPTに無償/有償版があり、生成AIのGPTモデルもGPT-3.5/GPT-4など選択肢が出てきたのは、10倍コストが背景にあります。

Microsoft)Copilot対Google)GeminiのAI活用コストパフォーマンス競争が始まりました。

半導体産業インパクト

半導体産業を根本から変える規模のAI半導体開発計画
半導体産業を根本から変える規模のAI半導体開発計画

米)OpenAI CEO解任/復帰劇があったSam Altman氏は、2024年2月12日~14日、アラブ首長国連邦)ドバイのThe World Governments Summit 2024で、GPT-4の次世代モデルGPT-5に言及しました。

さらにSam Altman氏は、日本GDPの約2倍、最大7兆ドル規模の「AI半導体開発計画」を画策中だそうです。

これは、半導体産業を根本から変える規模の計画です。

IntelやAMDもAI専用プロセサ:NPU内蔵CPUを相次いで新発売し、GAFAM各社も、独自AI向けプロセサを開発中です。生成AI革命には、大量のAI半導体が必要になるのでしょう。

2023年売上が約5270億ドル、2030年には、約1兆ドル見込みの世界半導体売上は、AI関連で占められるかもしれません。

MCUベンダインパクト

自動運転(出典:政府広報オンライン)
自動運転(出典:政府広報オンライン)

半導体生産を担うMCUベンダも、最近、組織再編ニュースが多いです。例えば、STマイクロルネサスなどです。その背景を推測しました。

産業向けMCUに比べ好調な車載向けMCUは、制御系と車載IT系の大きく2に分かれSDV(Software Defined Vehicle)を進化させつつあります。車載IT系は、AIとの親和性が高く、自動運転などのAI化は、MCUベンダ製品系列を大きく変える可能性があります。

MCUベンダの組織再編は、生成AI革命による変化の前兆かもしれません。

Afterword1:生成AI革命とは?

ChatGPTと生成AIの出現は、生成AI革命と呼ばれます。それは、ブラウザ経由(CopilotまたはGemini)で、人間対人間のように会話でAIへ質問し、結果(回答)を引出すことができ、しかも、全分野でAIが回答できるからです。まさに革命的です!

関連投稿:生成AI活用スキル

Microsoft Copilot対Google Gemini
Microsoft Copilot対Google Gemini

Afterword2:検索型から会話型へ

ネット利用は、従来、検索が大部分でした。Google)ChromeやMicrosoft)Edgeなどのブラウザは、「キーワード」入力に対する検索出力の正確さ・速さを競いました。

しかし、利用者が本当に知りたいのは、ブラウザ検索出力では無く、検索出力を分析した結果です。この分析は、利用者自身が行いました。つまり、検索型で「結果」を得る方法は、下記でした。

キーワード入力→検索出力の利用者分析→結果

ところが、ChatGPTと生成AIは、初めから利用者が知りたいことを「質問」としてネットへ入力できます。ネットで会話しながら追加質問もできます。会話型で「結果」を得る方法は、下記です。

質問入力→結果

検索型よりも知りたい結果が、直接得られます。ネット利用が検索型から会話型へ進化し、AIとの会話に慣れると検索型へ戻れない理由です。