September 20, 2023

S40E02 ボイスチェンジャー、その１　これまでのおさらい

11 minutes

ZENKEI AI ポッドキャスト、シーズン４０は２０２３年４月２６日に開催した ZOOMライブの模様です。
この日のテーマは「ゴールデンウィーク　AI で遊ぼう！」です。

エピソード２は、第１部「ボイスチェンジャー」その１、これまでのおさらいです。

当日の市來の発表資料

このブラウザでは再生できません。
再生できない場合、ダウンロードは🎵こちら

ビデオ見れる人はこちらからご覧ください。

（以下は、OpenAI の Whisper を使って文字起こししたものを修正したものです。）

** 注：以下は未編集の草稿です **

こんにちは、ZENKEI AI FORUM です。
今晩は。ZENKEI AI FORUM です。今日は 2023 年の４月２６日。４月の終わりの ZENKEI AI FORUM です。

でね今日のフォーカスはゴルデンウィークにみんなAI関係で何かやりたいなもちろんねチャットGPTを使って色々やりたいっていう人はチャットGPTの情報いくらでもあふれてるんでやってみたらいかがでしょうか面白いと思います今のね技術の最先端どうなってるか話題フォーラム僕今回ゴルデンウィーク皆さんに話題提供としてはですねパート1 ここでボイスチェンジャーって書きましたがこのネタを紹介したいなと思ってますいこうかなはいボイスチェンジャーってもうタイトルにジャーンって入れましたが振り返ると全系アイフォーラム僕もともとだから音系のコンピュータープログラムってのが好きなんですねっていうのもあってモデルとかね色々出るたびに気になってた影響もあってここ今年に入ってから1月のイベント2月のイベントでディープラーニング AI を使った音ネタっていうのを紹介してきました主な文脈はテキストススピーチ TTS って言いますけども文字をモデルに与えると音声が出てくる喋ってくる AI がっていうファンクションのことを TTS って言います1月で紹介したのは Microsoft がValley っていうねボイスで生成権のモデルだからこれ Valley ってオープン AI のディフュージョンモデルの Valley ありましたねテキスト入れると絵が出るイラストレーターマッサオっていうやつのテキスト入れると音声が出てくるボイスが出てくるっていう意味のモデルValley っていうのを Microsoft が発表したこれ何がすごいって短い声ネタを学習させたら例えば僕の喋りの3秒って書いてありますが3秒のデータを与えると僕の声で何でも喋ってくれるようなことができるっていうのが歌い文句すげーじゃんって言って使ってみたいとかってわーわー言ってたのが1月でしただけどここに書いてあるように論文は出たしアナウンスもプレスリリースも代々的にされてモデルを使ったサンプルオーディオっていうのがページに行けばいくらでもあるんだけどもモデルが公開されてないっていうかモデルっていうよりも学習済みのモデルが公開されてなくて僕の声で生成するっていうのはすぐにできないうーん残念っていうのが1月でしたその辺を自分でするにはどうしたらいいのっていうんでオーディオ関係のディープラーニングの学習フレームワークっていうかなそして esp ネットっていうのが歴史が古くあるらしいっていうのを学んでたっていうのが1月でしたそれを受けてね2月 esp ネットを使ってじゃあ僕の声で実際にね上でバリーが使えないんだったら esp ネットで他のモデルでいいから僕の声を生成するモデルを作ってみようってやったのが2月でしたでデモとしてねv チューバー兼語作ってねあの音声のテキストスピーチモデルは vits という vits っていうモデルを esp ネットでファインチューニングして僕の声を生成するようにしましたでねその結果っていうのを2月に発表して喋らせた動画がありました興味ある方は見に行ってくださいビデオのアーカイブもありますでここまでが小前というかあの状況でしたと今回は新しい皆さんまだ今日お見せするネタでね応用編やります v チューバー兼語さんちょっと本格的にですね応用してみようで時期的にねチャット gpt が出てきてるんでこの v チューバー兼語さんにチャット gpt で作った物語を喋ってもらってで同じく ai の顔を動かすモデルっていうのはねあのワンショットトーキングヘッドモデルだったっけ僕はこの上で使っているやつを使って実際にだから元ネタはチャット gpt が書いたテキストと僕の顔写真っていうか写真だけであとは ai さんが生成したビデオを喋りのビデオ語りのナレーションのビデオっていうのを作ったんですねそれを応用編としてご紹介しますちなみにまずねネタねストーリーチャット gpt に子供向けの物語を書いてへって言って 8書いてもらった物語のこれですタイトルはねたまという犬の冒険えっ何かねありがちっていうかねまあいいんですけどチャップ gpt が作ったんでまあね恥ずかしさもチャップ gpt のせいでせいにすればいいでえっとこのストーリーをねテキストをさっきの tts 僕の声でパインチューニングした tts に壊して僕の顔をベースにした8生成型の顔で喋らせますちょっと4分半えっといきますねちょっと聞いてくださいんたまという犬の冒険作でタッチ ptたまは小さな犬でしたがとても愉快でしたある日彼女は家の庭で遊んでいると突然大きな鳥が現れました鳥は玉を捕まえ空に飛び上がってしまいましたたまは怖かったけれど彼女は決して諦めませんでした彼女は鳥の背中にしがみつき空を飛び続けましたしばらくの間たまは風に揺られ空を飛び続けましたやって鳥は山の上に着陸しました雨は時からにらしいまあ読み回しました彼女は山の中に入りそこで新しい友達に出会いました彼女の友達は山の中に住む小さな動物でしたたまは彼女の新しい友達と一緒に山の中を探検しました彼女たちは美しい滝や川そしても世の中を歩きましたしかし彼女たちは危険な状況にも遭遇しました彼女たちは大きな熊や蛇と戦わなければなりませんたまは彼女の勇気と友情によって山の中で多くの冒険を経験しましたそして彼女は家に戻ることになりました彼女は家に戻った時彼女の家族に彼女の冒険の物語を語りました彼女の家族はたまの冒険の物語を聞いて動きました彼らはたまが山の中でどのように生き延びたのかそして彼女がどのように勇敢に振る舞ったのかを知りたがっていましたたまは彼女の家族に彼女が出会ったすべての動物や人々の物語を語りました彼女は山の中で出会った熊や蛇そして山族たちとの戦いについても話しました彼女の家族は彼女が冒険を経験したことに驚きそして彼女の勇気に雨を受けました彼らは彼女が家に戻ってきたことを喜び彼女を抱きしめましたそしてたまは彼女の冒険の物語を書いた本を出版することを決めました彼女の物語は多くの子供たちに勇気と友情の大切さを教えることになりましたたまは彼女の冒険を通じて自分自身を見つけそして彼女の家族や友人たちとの絆を強めることができましたそして彼女は自分自身が何を達成できるかを知り自信を持つことができましたたまは自分自身を見つけた後新しい冒険に挑戦することを決めました彼女は自分が何を達成できるかを知っていたので自信を持って次のステップに進むことができました彼女は新しい友達を作り新しい場所を探検し新しいことを学びましたそして彼女は自分自身が成長し自分自身を信じることができました最終的にたまは彼女の家族や友人たちと再会し彼らに自分の冒険の物語を語りました彼女は彼らに自分自身を見つけ自信を持つことができた理由を説明しましたそして彼女は彼女の家族や友人たちと一緒に新しい冒険に出かけることを提案しました彼女は彼らと一緒に冒険することで彼らとの絆をより強めることができると感じました彼女の提案に賛成した家族や友人たちは彼女と一緒に新しい冒険に出かけましたそして彼らは新しい場所を探検し新しい友達を作り新しいことを学びました彼らはたまの冒険を続いて自分自身を見つけそして彼らの絆を強めることができますそして彼らは自分自身が何を達成できるかを知り自信を持つことができた彼らは幸せな結末を迎えました全部喋ってもらえるので楽ちんですね声は聞こえていることを祈ってますけどもあのミキサーのループバックってコンピューターの出す音声がきちんとアウトに乗るようにマイクに乗るようにしないといけないねなんかうまいことする方法あんのかねはいっていうのがtext to speech のサマリンですね今までの集大成が今のでした

...more

View all episodes

By Kengo Ichiki

September 20, 2023

S40E02 ボイスチェンジャー、その１　これまでのおさらい

11 minutes

当日の市來の発表資料

...more

Share S40E02 ボイスチェンジャー、その１　これまでのおさらい

Sign up to save your podcasts

S40E02 ボイスチェンジャー、その１　これまでのおさらい

S40E02 ボイスチェンジャー、その１　これまでのおさらい