ArxivCaster

DDSC: Dynamic Dual-Signal Curriculum for Data-Efficient Acoustic Scene Classification under Domain Shift


Listen Later

# DDSC: Dynamic Dual-Signal Curriculum for Data-Efficient Acoustic Scene Classification under Domain Shift
## 背景
- 音響シーン分類(ASC)は、デバイスによるドメインシフトの影響を受けやすい。
- ラベルが限られている場合、特にこの問題が顕著になる。
- 従来の研究は、簡単なデータから難しいデータへと順序付けて学習を促進するカリキュラムベースのトレーニングに焦点を当てている。
## 課題
- 既存のカリキュラムは静的であり、トレーニング前に順序や重みが固定される。
- 例の難易度やマージナルユーティリティが学習された表現とともに進化することを無視している。
## 手法
- **Dynamic Dual-Signal Curriculum (DDSC)**を提案。
- 各エポックで計算される2つの信号(ドメイン不変信号と学習進捗信号)を組み合わせてカリキュラムをオンラインで適応。
- 時間変動スケジューラがこれらの信号を融合し、初期エポックではドメイン不変の例を優先し、徐々にデバイス特有のケースを強調。
## 結果
- DCASE 2024 Task 1プロトコルの下で、DDSCは多様なASCベースラインとラベル予算において、クロスデバイスポイントを一貫して改善。
- 特に未見デバイスの分割での最大の改善が見られる。
## 限界 / 今後の展望
- DDSCは軽量でアーキテクチャ非依存であり、追加の推論オーバーヘッドを導入しないが、特定のデバイスや環境における適応性には限界がある。
- 今後は、より多様なデバイスやシナリオに対する適用性を高めるための研究が求められる。
...more
View all episodesView all episodes
Download on the App Store

ArxivCasterBy YutoTAKAGI