耳で聞くHacker News

Bagel: Open-source unified multimodal model


Listen Later

BAGELは、GPT-4oやGemini 2.0に匹敵するオープンソースの統合型マルチモーダルモデルです。テキストと画像の入出力を処理し、画像生成、編集、スタイル変換、ナビゲーション、コンポジション、思考など、様々な機能を備えています。大規模なデータで学習し、理解力と生成能力が高く、他のオープンモデルよりも優れた性能を示しています。
...more
View all episodesView all episodes
Download on the App Store

耳で聞くHacker NewsBy Tech Podcast Bot