安く早いGPT-4o

AI対人間インタフェース性能を向上するGPT-4o
AI対人間インタフェース性能を向上するGPT-4o

2024年5月13日、GOMA(Google、OpenAI、Microsoft、Anthropic)の一角、OpenAIが、GPT-4o(オー)を発表しました。オーは、omni、ラテン語のすべてを意味し、テキスト、音声、画像、映像の入力すべてに統合対応します。従来ChatGPTよりも安く、早い生成AI入出力処理が可能です。

Summary:安く早いGPT-4o

GPT-4o特徴、OpenAI発表の要約などが堀江貴文氏のYouTube動画(6分31秒)で判ります。
前半2分40秒までが、「本物の人間、堀江氏」解説、後半は、GPT-4oを使ってOpenAI発表を要約し、それを「AIで生成した堀江氏」が説明しています。

既存ChatGPTや競合他社比、利用料金が50%安く、音声と画像理解が速いのが統合対応GPT-4oの特徴です。例えば、音声応答は人間と同じ会話速度、笑い声や感情表現画像も出力できます。

Mac版アプリも同時発表、Windows版は、今年後半リリース予定です。

対人間インタフェース性能向上

AIを人が上手く使うコツは、AIへの質問力です。上手い質問ができれば、所望の回答が得られます。ただ現在、AI自身が急変化しています。この過渡期のAIに合わせた質問のコツを人が掴むのは大変です。

そこで、人間同士の対面会話と同じようにAI側が対応できれば、より簡単に質問ができます。AI側が人に近づくからです。また、対人間インタフェース性能向上によりAI自身の学習速度も更に上がります。

安く早いGPT-4o の特徴が活かせるのは、このAI対人間インタフェースの部分です。

例えクラウドAI利用時でも、GPT-4oは、人と同じレスポンス速度で会話し、人の画像を認識、笑うなどAI感情表現も出力します。堀江氏動画(2分5秒頃)で語られた、GPT-4oとぬいぐるみを使った子供や老人のAI話し相手のフロントエンドとして十分使えます。

つまり、AI入出力を、より人間らしく効率的にできる能力をGPT-4oは持っています。

筆者としては、PC向けだけでなく、エッジAI MCU/MPU向けアプリも欲しいです。
※AIとAIデータを引出すChatGPTなどの役割は、コチラの投稿1章参照。

シンギュラリティ

AIが人間よりも賢くなるシンギュラリティ、2045年問題
AIが人間よりも賢くなるシンギュラリティ、2045年問題

AIが人間よりも賢くなる時を、シンギュラリティ(日本語は技術的特異点)と言います。AIの世界的権威:Ray Kurzweil氏が、2005年の著書でシンギュラリティを2045年と予測したため、2045年問題とも呼ばれます。

筆者は、GPT-4oにより、AIがシンギュラリティに一歩近づいたと思います。最近AI関連の話題は、食傷ぎみですが、GPT-4o出現は、予測よりも早くシンギュラリティになる可能性を秘めています。

GoogleやAnthropicのGPT-4o対抗ChatGPT、MicrosoftのGPT-4o対応Copilot、OpenAIの次期GPT-5がどれ程の能力を持つか想像もできません。ただGOMA各社が、AI開発を加速中なのは確かです。

また、進化中のAIが、次世代半導体も牽引しています。GOMAだけでなく、半導体製造、電力、通信各社もAIが動向を左右しています。生成AI革命といわれるゆえんです。
※生成AIと電力、通信会社の関係は、コチラの投稿参照。

Afterword:MCUソフトウェア開発史と似ている?

現在のMCUソフトウェアは、ベンダHAL(Hardware Abstraction Layer)APIを利用した開発です。数十年前のMCU毎に異なるハードウェアドライバを自作し、アプリ担当に自作APIを提供していた頃とは別世界です。

レベルは違いますが、AI進化もこのMCU開発史に似ています。数年後には、人工知能活用開発が普通になるかもしれません。今、AI進化過程を実感できる我々は、幸せだとも思います。

MCU開発者が、PC利用や開発方法を根本から変える可能性があるAI状況を知ることは必然です。根本変化、別世界に対応できるよう状況を把握しておきましょう。


生成AIデータセンタとIOWN

サーバやネットワーク機器を安全に管理運用する施設がデータセンタです。世界規模の生成AI需要急増に対し、米)大手AI企業の日本国内へのデータセンタ新設が話題です。2024年4月21日その背景が、欧米に比べ日本のプライバシー規制の緩さだとTV放送がありました。

筆者は、地震国日本にAI関連投資が盛んな理由は、地理的に離れたデータセンタ間を、低遅延接続できるIOWNがあるからだと思います。このリアルタイムネットワークAI処理の要、IOWNを説明します。

データセンタ間IOWN接続遅延

光電融合デバイスによるNTT IOWN APN(オールフォトニックス・ネットワーク)は、従来比電力効率100倍、伝送容量125倍、エンドエンド遅延1/200が目標です(関連投稿はコチラ)。

IOWN特徴(出展:NTTサイト)
IOWN特徴(出展:NTTサイト)

2024年4月12日、NTTは、IOWN APNの英国と米国でのデータセンタ間接続実証結果を発表しました。

英国、米国のIOWN APN実証実験(出典:NTTサイト)
英国、米国のIOWN APN実証実験(出典:NTTサイト)
400Gbps通信 データセンタファイバー距離(km) 遅延時間(ms) 遅延揺らぎ(μs)
London、UK 89 0.893 0.035
Ashburn、US 4 0.062 0.045

同一施設データセンタ間遅延規定<2ms

同じ施設、場所の複数データセンタ間の接続遅延は、2ms以内の規定があります。

従って、IOWN APN実証結果の遅延1ms以下、揺らぎ1μ秒以下は、例えデータセンタ設置場所が離れていても、規定2ms以内を満たし、同一施設データセンタとして機能することが判ります。

また、IOWN APN回線は、ダークファイバー新設無しで波長追加により提供できることも特徴です。APN提供までの時間短縮が可能だからです。

※ダークファイバーとは、敷設光ファイバーのうち、未使用で光信号が稼働していない(ダークな)芯線。

つまり、地理的に分散したデータセンタ間をAPNで接続しておけば、地震や過負荷トラブル発生時でも当該データセンタの負荷をAPNで別の場所へ移動できます。そして、あたかも同一施設のデータセンタのように稼働を続けられます。

データセンタ信頼性向上に役立つIOWN APNは、地震国日本ならではのネットワーク技術です(関連記事:NTT光ファイバー分岐・合流に世界初成功)。

NTTは、これら特徴や欧米でのAPN実証実験により、光電融合デバイスネットワークIOWN APNを、生成AIデータセンタや金融分野向けのワールドワイドインフラとして普及を狙っています。

郊外データセンタと市中カメラのAPN接続

大都市圏における郊外型データセンタによるAI分析(出典:NTTサイト)
大都市圏における郊外型データセンタによるAI分析(出典:NTTサイト)

また、NTTは2024年2月20日、武蔵野市データセンタと横須賀市設置カメラ間の100kmをIOWN APNで接続し、郊外データセンタで市中カメラのリアルタイムAI分析実験を行いました。

これは、超高速ネットワークを活かしたリアルタイムクラウドAI処理例です。但し、超高速ネットワーク回線が十分安くなった時の話です。未だ高価なIOWN1.0ですが、IOWN4.0で現状インターネット並み価格になった後の話です。

それまでは、クラウド側よりもエッジ側でAI処理を行うアプローチが、AI処理遅延、電力消費の点から現実的だと思います(関連投稿:エッジAI導入アプローチ)。

日本への欧米AI投資

OpenAI Japan 始動(出典:OpenAI Japan)
OpenAI Japan 始動(出典:OpenAI Japan)

AI関連投資は、データセンタだけではありません。

2024年4月15日、米OpenAIは、アジア初のOpenAI Japan始動を発表しました。日本語最適化GPT-4カスタムモデルの提供を開始するそうです。2024年4月10日、米Microsoftも、日本へAI研究所など今後2年間で29億ドルの投資を発表済みです。

もちろん日本側AI投資も盛んです。例えば、4月19日、KDDI の1000億円、4月23日、ソフトバンクの1500億円投資などです。

いずれの投資も、高信頼ネットワークインフラ技術IOWNが日本にあるからです。

Summary:生成AIデータセンタとIOWN

生成AIやインターネット金融の要であるデータセンタは、災害やセキュリティ事故などのリクスに強いことが必要です(日本データセンタより)。

世界規模の生成AI需要急増に対し、地震国日本で米)AIデータセンタ新設やAI関連投資が盛んな背景は以下です。

  1. 欧米よりも緩い日本のプライバシー規制
  2. データセンタ地理的分散配備を可能とする低遅延NTT IOWN APN接続

Afterword:次回投稿5月10日(金)

来週5月3日(金)は、ゴールデンウイーク中のため休みを頂き、5月10日(金)に次回投稿します。


生成AI活用スキル

MCU開発以外にも生産性向上のAI活用事例は多数あります。例えば、芥川賞受賞作家が、5%前後の生成AI文書を受賞作にそのまま利用、大学入試共通テストを、AIが平均以上に解いたなどです。

また、自動車業界もAIアシスタントのChatGPT搭載など、今後AI活用は更に加速するでしょう。

急増するAIに対し、筆者が現在考えている生成AI活用スキル、それは質問能力です。質問能力を鍛え、同時に意味が解らない用語などを簡単に解決する方法を示します。

生成AI、ChatGPT、Copilot

AI用語を簡単に整理します(出典:SoftBank AI用語解説)。

AI、機械学習、ディープラーニング、生成AIの関係(出典:SoftBank)
AI、機械学習、ディープラーニング、生成AIの関係(出典:SoftBank)

生成AIは、機械学習した膨大なデータから、パターンや特徴を抽出し、これらから新しいデータ(テキスト、画像、音声)を生成します。

ChatGPTは、対話(Chat)により質問に対する回答の形式で生成AIデータを引出すサービスです。最新生成AI GPT-4 (Generative Pre-Trained Transformer 4)を使って共通テストをダントツに解いたのもこのChatGPTです。

Copilotは、 Microsoftの対話AIアシスタントの総称です。GoogleならBard、AppleならSiri、AmazonならAlexaなどがあります。

Copilot/Bird/Siri/Alexaが、各社ブラウザ搭載のChatGPTを利用し、GPT-4から回答を引出す役目は同じです。AIアシスタント名が異なる、と考えれば良いでしょう。

同じARM Cortex-M4コア利用MCUでも、STマイクロならSTM32F4、ルネサスならRA4M1などと製品名が異なるのと同じ、と言えばMCU開発者には解り易いと思います(内蔵周辺回路や製造プロセスが異なるので、性能も多少異なりますが…)。

ChatGPT分析

ITmedia記事 のChatGPT進化(前編)、ChatGPTビジネス(中編)、ChatGPT活用スキル(後編)からも、効果的に生成AIを活用するには、ChatGPTへの的確な質問、つまりブラウザへのプロンプト入力が重要と言われます。

ブラウザ検索が上手い人ほど、問題解決が速いのと同じです。

では、どうしたらChatGPTへ上手いプロンプト入力ができるでしょうか? 「練習、慣れ」だと思います。

Microsoft Copilot利用方法

ブラウザとしてMicrosoft Edgeを使った例を示します。プライベートモードでは右上Copilotアイコンが表示されないので注意してください。PC版Copilotは、過去のAI回答も履歴として保存されます。

スマホ版Copilot起動例が、左側のダークモード表示です。「GPT-4を使用する」へ変更します。

Microsoft CopilotのChatGPT利用例
Microsoft CopilotのChatGPT利用例

どちらの版も、「何でも聞いてください…」の部分へ、ChatGPTへの質問:プロンプトを入力します。スマホ版では、音声入力が便利かもしれません。

意味が解らない用語などは、そのまま上記プロンプトへコピー&ペーストで入力します。すぐに的確な用語解説が得られます。

上手いプロンプト入力の方法は、ChatGPT活用スキル(後編)のページ1に(1)~(6)が、また、プロンプト入力のコツも、ページ2の(1)~(4)にまとまっています。

※プライベートモードでCopilotが起動しないのは、履歴保持以外にも、ユーザ毎の質問背景やユーザレベルをAIで学習、推定させるためです。これは、Copilot性能向上に役立っているそうです。

ChatGPT最大メリット

人間的配慮不要なのがChatGPT最大メリット
人間的配慮不要なのがChatGPT最大メリット

人間同士だと、質問を受ける相手のことを気遣って、納得するまで質問しない場合も多いでしょう。AIの場合は、この人間的配慮は全く不要です。1日最大2000回まで、いつでも、どこでも、何度でもChatGPTプロンプト入力が可能です。

これらが機械ChatGPT最大メリットだと思います。※上限回数は暫定値。

ChatGPTへのプロンプト入力は、質問スキルを鍛える手段にも使えます。そして、エキスパート盲点だらけの MCU技術資料は、このスキル鍛錬教材としても役立つ、つまり、MCU開発者には一石二鳥と言えます。

Summary:生成AI活用スキル

筆者が考える生成AI活用スキル、それはChatGPTへの質問能力です。

Microsoft EdgeブラウザCopilotを使い、ChatGPTへの質問スキルを鍛え、同時にMCU技術資料に多いエキスパート盲点記述の両方を解決する方法を示しました。

Afterword:人間対自ら学習、成長するAI

機械学習で自ら学習し成長する生成AIの回答が、本当に正しいかを判断するのは、人間です。

ChatGPT活用スキル(後編)の最後に書かれている、試行錯誤しながらChatGPTを使い、学んで生きた知識にしていく「極めて人間らしい営みがAI利用に重要」に大賛成です。

履歴やレベル推定、いわゆる無断学習は、多少気になりますが、AIを活用しご自分の質問スキル、MCU開発スキルを上げましょう!