rel.ax

#10 画像、音声、そして未来のデバイス:AIの進化が加速する


Listen Later

ポッドキャスト第10回目の紹介
## 1. AIによる画像認識の進化- オープンAIのChatGPTに対して、画像認識機能が追加された。
- これにより、画像をテキスト情報とともに解析し、チャットGPTが回答することが可能になった。
- 例えば、レシートの画像を撮影し、その内容を問い合わせると、チャットGPTが解析して回答してくれる。
- これまでは、画像の説明をするだけでなく、画像に含まれる文字情報も解析し、回答してくれる。
- これにより、手書きのメモの内容を問い合わせる際に、OCRで文字列に変換する必要がなくなった。
- 画像とテキストのマルチモーダルな機能により、チャットGPTの利用範囲が広がった。## 2. ChatGPTと音声会話の進化- ChatGPTとの対話が音声で行えるようになった。
- スマートフォン向けのアプリで、チャットモードや会話モードを選択することで、音声での対話が可能。
- ユーザーが発音すると、チャットGPTがきれいな日本語で回答してくれる。
- ワイヤレスのヘッドセットを使用し、24時間アプリを立ち上げておくことで、常にAIとの会話が可能。
- 本を読んでいる最中に疑問が生じた場合、口頭で質問すると、チャットGPTが回答してくれる。
- 音声を通じてAIとの対話ができることで、自身の能力が拡張された。## 3. ダリースリーと新しいデバイス開発- オープンAIのサム・アルトマン氏と、デザイナーのジョナサン・アイブ氏がAIのハードウェア開発に取り組む可能性があるとの噂が広まっている。
- この話はまだ確定的な情報ではなく、業界の話題として注目されている。## 4. AmazonのAIへの出資- Amazonがアンソロピックという会社に対して約5900億円の出資を行い、生成AIの強化を図ることを発表した。
- AmazonがAIの生成に本格的に取り組む姿勢を示している。## 5. プリファード・ネットワークスの大規模言語モデル- プリファード・ネットワークスが、高性能な大規模言語モデルを発表した。
- プラモという名前のモデルは、日本的な名前付けがされており、注目を集めている。

※ タイトルや概要は AI にて生成させています。

放送で紹介されたニュースへのリンク

https://ainewsdev.substack.com/weekly-ai-news-10


放送の最初と最後の音声は https://elevenlabs.io/ で作成しました。

...more
View all episodesView all episodes
Download on the App Store

rel.axBy bbz