2024年5月14日(現地時間)にリリースされたchat GPT-4o(omni)ですが、そのなかでも特に衝撃を受けたのは音声認識機能です。

以下のテキストは実際に私が音声でやり取りしたものになりますが、これがリアルタイムで音声としてやり取りをしています。

翻訳ツールとしてもかなり優秀であることを実感し、他のLLMモデルであるGeminiよりも一歩先を進んでいる認識です。(6/2現在ではGeminiでは音声認識でリアルタイムに音声で返す機能は未実施)

Category
Tags

No responses yet

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です