AIサブスク貧乏とノートブックLM活用術
エピソード概要
今回のエピソードでは、最近話題のAIサブスクリプション課金の実態と、ノートブックLMを活用したオーディオブック自炊について詳しく語りました。
まず、AIサブスク貧乏の現状について。以前はAdobe Auditionの月額3000円が高いと感じていたのに、今ではウィンドサーフやMidjourneyなど、AI関連サービスに月額1500円程度を複数契約している状況です。特にウィンドサーフは当初1ヶ月だけの利用予定でしたが、今ではエディターとして日常的に使用しており、もったいない使い方をしているという自覚があります。
ノートブックLMについては、一時期のブームは去ったものの、個人的には今でも非常に魅力的なツールだと感じています。有料版は月額3000円程度で、これはほぼAdobe Auditionと同額という皮肉な状況です。現在は無料版を使用していますが、十分に実用的です。
ノートブックLMの最も興味深い機能は音声概要生成です。2-3時間の雑談を投稿すると、6分程度のポッドキャスト風概要を作成してくれます。しかも内容を好意的に解釈して要約してくれるため、ただの雑談が価値あるコンテンツのように聞こえる効果があります。
さらに、本をデータ化してノートブックLMに投稿し、要約や質問応答を行う実験も行っています。分厚い本や「影響力の武器」のような定番書籍をデータ化して要約させると、本を読んだ気分になれる快感があります。これは新しい読書体験の可能性を示唆しています。
オーディオブック自炊の技術的な側面についても詳しく説明しました。本をデータ化する際の著作権の問題から、実際の作業工程まで幅広くカバーしています。
Kindleで購入した本は著作権保護のため、簡単にはデータ化できません。そのため、1ページずつスクリーンショットを撮影し、不要な部分を切り取ってからOCRでテキスト化するというアナログな手順を踏んでいます。ノートブックLM自体にOCR機能があるため、PDF化して直接投稿すれば文字起こしから図表の読み込みまで自動化できる可能性があります。
この過程で、オーディオブック自炊の新しい可能性に気づきました。従来はKindle Fireの読み上げ機能をICレコーダーで録音するという非常にアナログな方法を使用していましたが、OCRでテキスト化できれば、より高品質なTTS(Text-to-Speech)でオーディオブックを作成できます。
特に注目しているのは、YouTubeでよく使われている「ずんだもん」の音声です。聞き慣れた声のため、意外に聞きやすく感じられます。これは慣れの効果かもしれませんが、新しいオーディオブック体験の可能性を示しています。
現在の作業工程は複雑で、スクリーンショット撮影、画像編集、OCR処理、テキスト保存、音声合成、ファイル結合など多くのステップが必要です。特にWindowsとMacを使い分ける必要があり、最終的にはターミナルでコマンドを実行してMP3ファイルに結合する作業も含まれます。
AIを活用したバイブコーディングにより、意味が分からないコマンドでも呪文のように貼り付けるだけで作業が完了する体験は、新しい時代の到来を感じさせます。
効率化の余地はまだ多く残されており、ウィンドサーフなどのAIツールを活用してワークフローの自動化を検討しています。
最後に、音声で話した内容をブログ記事にまとめる活用法についても触れました。これは単なる効率化ツールとしてではなく、タイムスタンプとしての記録価値や、見える場所に置くことによる他者との交流促進、そして自己監視効果も期待しています。
チャプター
- 00:00 - イントロ・収録開始
- 00:43 - AIサブスク貧乏の実態
- 02:30 - ノートブックLMとの出会い
- 04:24 - 音声概要機能の魅力
- 06:01 - 本のデータ化とOCR活用
- 08:06 - オーディオブック自炊の新手法
- 10:06 - ずんだもん音声での読み上げ実験
- 11:24 - 複雑な作業工程の詳細
- 13:24 - 効率化とバイブコーディング
- 14:18 - 音声コンテンツの活用法と今後の展望
ハッシュタグ
#ポッドキャスト #AI #ノートブックLM #オーディオブック #自炊 #OCR #TTS #ずんだもん #読書 #効率化 #音声合成 #コンテンツ制作 #デジタル化 #バイブコーディング #Windsurf