私のYoutube動画 製作手順 2

今回は「昭和に生まれたとんがったバイク達 」編になります。
備忘録を兼ねて作業工程を記録しています。
エフェクトの種類・トラブルの対応とか書いてあります。
この動画の製作手順を公開しています。

メモから、次の動画を決める

1.  動画テーマの選び方は作りたくなるものです。
わくわくするテーマ「感情を込めやすい」か「早く伝えたい内容」もどちらかを選択します。

今回は「昭和に生まれたとんがったバイク達(3選)」です。
最近Youtubeでみたバイクの評価が、私の好みと合わなかったので、自分で作ることにしました。
その番組の内容は忘れてしまいましたが・・・

データー(資料)を集める

昭和のバイクの代表例を調べます。
先ずは、AIで調べます。
基本的には※ChatHubというクロームの拡張機能をつかって検索します。
ブラウザーの多くはクロームベースの為、クロームの拡張機能をインストールが可能です。

ChatHubは、複数のAIに同時に指示が出せる機能です。
有料版だと6つ同時に出せますが、3~4つで十分だと思います。
無料版は2つ迄です。
下記3つをメインの検索です。
ChatGPT
Claude
Gemini
うーん出てきたバイクのリストは、そうかもしれないけど、イメージしていたバイクとはズレています。

原因は昭和という年代にあるようです。
私がイメージしていたのはバルブ時代のバイク達です。
バブルは昭和最後と平成の初期の時期になります。

仕方が無いので、個々に調べていきます。
個々のリサーチはGensparkをつかってリサーチです。

写真を探す

以前所有していたバイクもあり、写真を探します。
PCのデーターフォルダーを見ても見つかりません。

そういえば昔はデジカメではなかった・・・

アルバムや映像データーのほとんどは、B型の父親に処分されて残ってません。
(父親は温厚だと思うのですが、こういうこともあります。)

息子の出産直後の映像を処分されたときは、ショックだったとこを思い出します。
この時にバイク雑誌やCDなどほとんどが処分されています。

データーが無いなら古本屋で探そうかと思ったのですが、先ずは近所の図書館に向かいます。

さすが図書館ですね。ありました。ない場合は他の図書館から取り寄せなければならないところでした。

ちなみに古本屋にはありませんでした。結婚するまで購入していたREV SPEEDが置いてありましたが・・・。

写真には当然著作権があるので、要注意です。

出典先を明記し、CG加工して使用しています。

画像のアップスケールをする(ぼやけている輪郭をキレイにする)

映像は動画編集ソフト(Davinci Resolve)のスケールでもキレイになります。×2強だと再生時に崩れる現象が出たので×2がおすすめです。

アップスケールは、無料~有料まで色々なサービスがあるのですが、あまり使わないので差が良くわかりません。

無料の場合、ウオーターマークと言われる会社のロゴ「透かし」が入る場合が多いです。
後から編集で削除することも出来ますが、手間なのでない方が助かります。

Leonardo AIでは毎日150クレジット分を無料でもらえるので、使ってみるのも良いかもしれません。

Creativity Strengthが3以下にすると破綻(画像が崩れる)が減ります。

シナリオ(ストーリー)を考える

登場させるバイクを決めたら、シナリオを考えます。私の場合は一太郎をつかって書いていきます。
書いた文章はAIで再編集していきます。

Chat Hubというクローム拡張機能をつかって、複数のAIに同じ質問を投げかけます。
無料版だと2つ同時に、有料版は6つ同時に出来ます。

できるのですが、基本はChatgpt・Gemini ・Claudeの3つで十分です。

下段の2つはエラーになることが多いです。
特にPerplexityは、まともに動いたことはありません。
(設定が上手くいっていないだけかも?)

このように主に3つのAIに文章を修正してもらい
一番しっくりくるフレーズを採用しています。

Claudeはこの中では、一番自然な文章を考えてくれるのですが、内容やニュアンスが変わっていることもあるので、要注意です。

読み上げソフトでシナリオを聞いてみる

とりあえず7割くらいできたら、テキストを再生しながら、シナリオを修正してきます。

今回はVoiceRoide2ではなく、VOICEPEAKをメインにしようしました。
後発のVOICEPEAKは、より自然な発声をし、微調整も出来ます。

VoiceRoide2の方が操作性が良いので、VOICEPEAKから「紲あかり」の声が発売されれば、100%こちらになるかと思います。

VOICEPEAKは、Dreamtonics社の音声合成技術「Syllaflow」が採用されています。

Dreamtonics社といえば、Synthesizer V(シンセサイザー ブイ)というPCで歌わせるソフトで有名です。
各社の歌わせるソフトシリーズより、断トツに自然です。

VOICEPEAKもDreamtonics社ということを知ったときは、納得してしまいました。

Synthesizer V(Voice:AYAME)
ベタ打ち(加工無し)⇩

Nector4で少し加工しました。
マスタリングのOzon10も使用したかったのですが、Cubase13の使用方法が良くわかっていないので、あきらめました。⇩

音量が小さいと違いが分かりにくいですけど、Nector4を使用するとエコーが少し掛かっています。

変化(フック)が欲しいとき

静止画でもズームしたり、移動したりすることで変化(飽きさせない)工夫は出来ますが
今回のバイクの場合、ワンパターンになりがちです。
そこで、AIを使用して動かしてみました。

案外これが上手くいき課金までしてしまいました。(RUNWAY)
1ヶ月間使ってみます。

Standardコースだと625クレジット/月使えます。クレジットは使い切れなくても繰り越しはされないようです。
実際に課金をしてみると1000クレジットになっています。初回ボーナスでしょうか?

写真から動画を生成するのにいくつかのエンジンを選択出来ます。
使用するエンジンによって使用クレジットが変わってきます。

写真から動画を生成する場合(GEN-3の場合:5秒・10秒の2択)

エンジン動画の長さ必要クレジットコメント
GEN-2:1世代前のエンジン 4秒20Alpha Turboと同じコスト
GEN-3 Alpha Turbo5秒25おすすめ
GEN-3 Alpha5秒50高い
Standardは15ドル/月 625クレジット/月
使い放題プランは95ドル/月になります。2250クレジット OR 時間は掛かるが無制限を選択できます。

最初は10秒で生成していましたが、コストが掛かるので5秒に変更しました。
5秒の動画を1/2倍速で再生すると10秒。
1/3倍速なら15秒です。

スロー再生するとコマ落ちしてしまうので、
リタイム&スケーリングの設定をオプティカルフロー または スピードワープにします。
※オプティカルフロー +スピードワープだと処理が重くなります。(多分・・・)

オプティカルフロー とスピードワープについてはここに詳しく書いてあります。


画像生成AIも、動画生成AIも同様に、多くの失敗を繰り返しながらの作業になるので、625クレジットでは、かなり妥協していかないと
あっという間に625クレジットは溶けていきます。

私の場合、RUNWAYの透かし(ウオーターマーク)の消し方が分からず無駄にクレジットを消費してしまいました。
もしかして、1000~625クレジットまでは、透かしが入るのかと考えて無駄打ちを多くしてしまいました。

結局625クレジット以下になっても透かしが消えなかったので、公式FAQをみて消すことが出来ました。
公式FAQは、文字だけで分かりにくいので、簡単にこの場で説明しておきます。

RUNWAYの透かしの削除方法(ウオーターボールを消す)課金ユーザー限定

先ずは公式FAQから

公式では一番知りたかったGEN-3の情報がありません。

公式情報は、不親切なので補足説明します。

最初にダッシュボードといわれるHOME画面に行きます。

Start a new session(Toolsの Generative Videoでも良いと思う)をクリック

左下の2つの上下スライダーマークをクリック

Runway watermarkのレ点をクリックして外す。

これで透かしが入らなくなります。

ウオーターマークという名前の由来は、GEN-2で生成したときに右下に丸い変なものが由来かもしれません。
GEN-3の場合は、文字で「RUNWAY」と透かしが入ってきます。

排気音をつくってみる

GameSynth という音をつくるツールがあります。

色々な音を作れるらしいのですが、シンプルな使い方しかしたことがありません。
今回はその中で、追加プラグインのEnginesというエンジン音専用のプラグインを使用します。

この中にはV-MAXというプリセットがあったのでこれを使います。
操作方法が良くわからず悪戦苦闘したのですが、なんとか排気音を手に入れました。

排気音を探す。エキゾースト音

プリセットに入っていた排気音が、リアルな音とどの位にているか確認するため、あちこち探してみます。
結果は、結構違うです。

そこで
YAMAHAの公式HPを探しているとエキゾーストが公開されている動画がありました。
そこで音声だけをお借りしています。

2ストのエキゾースト音はBGM付きだったので、RX10のMusic Rebalanceという機能でBGMの分離を試みます。
色々試したのですが、しっかり分離しようとすると音質が変わってきてしまいます。

リアル感が無くなるというか軽い音になってしまいます。

とりあえず妥協したのですが、後日コンプレッサーを掛ければ、音に迫力が出るかもと思い実施してみました。

コンプレッサーを掛ける


コンプレッサーの選択

色々試したのですが、Neutron4 Compressorに落ち着きました。

Davinci Resolve付属のMultiband Compressorも直感的に理解しやすくおすすめです。

作っているときは気がつかなかったのですが、比較して聞いてみると、違いが良くわからないです。

もう少し変化があったはずなのに・・・

後日比較サウンドアップもUPします。

ココに動画を追加する予定

再調整しました。多分エフェクトが消えてしまった事件があったのですが、この時に効果が消えたかもしれません。エフェクト表示はあるのですが、ON・OFFで違いが分からなかったです。

音声を整える

ナレーションには、RX10の※De-plosiveモジュールを使って少しマイルドにして行きます。

前回はさらにDe-essモジュール

「De-ess」の処理を追加したのですが今回は省きます

、音声録音における「サ行」や「シ」などの歯擦音(シビランス)を軽減するためのツールです。このモジュールは、以下の2つのモードを提供しています。

ここでトラブルです。この処理をすると音声の入りのところでプチッとノイズが入ります
オーディオエフェクトキャッシュをオンにすれば解決できます。

編集時だけのノイズかと思ったのですが、キャッシュをオンにしていないと、書き出し後の作品にもノイズが入ってしまいました。

「De-plosive」は、「パ行」や「バ行」などの破裂音(プローシブ)を検出し、低周波数帯域の不要なポップ音を軽減するためのツールです。

動画UP後に、FX(エフェクト)が外れていた事に気がつき、急いで修正しました。
ブログを書きながら見直していて良かったです。

音声に変化(遊び心)をつけてみる

今回は SSLのX-ORCISM2という無料でGETしたプラグインをつかいました。

使った場所は
07:46 何人たりとも俺の前を走らせねえ!!
のワンフレーズです。
音声追加予定

どうしても、このフレーズの発音の調整が上手くいかなかったので、このエフェクトで誤魔化しました。

リバーブという「ちょっと複雑なエコー」を掛けることは決めていたのですが、男性みたい音質にしようと思っていたので、使用したことはなかったのですが、ビジュアルでこのプラグインを試しました。男性ぽい音声は、なんか違ったので動画の音声のような感じに落ち着きました。

ラウドネス ノーマライゼーションを試してみる

Davinci Resolveには、音声のノーマライズ機能もあります。

1年以上は使用してこなかった機能ですが、久しぶりに使用してみるとYoutubeのプリセットが追加されています。早速、分析した後、ノーマライズです。

ノーマライズを全体に掛けてしまうと、BGMの音も大きくなってしまいました。
ナレーションのみに掛け直します。設定は相対ではなく個別にセットします。
(なんとなく個別の方が正解だと思ってセットしたのですが正解だったようです)

しかし、再生しましたが、違いが分かりません・・・。

私の設定した音量とYoutubeの音量が同じくらいだったということなのかな?

オーディオレベルのノーマライズの「相対」と「個別」の使い分け

DaVinci Resolveにおけるオーディオレベルのノーマライズの「相対」と「個別」の使い分けについて。

  1. 相対ノーマライズ:
    • トラックやクリップ全体を一括で調整します。
    • それぞれのクリップの相対的な音量差を保持しながら、指定したターゲットレベルに調整します。
    • 例: 会話の音量のバランスが取れている複数のクリップを全体的に大きくする際に適しています。
  2. 個別ノーマライズ:
    • 各クリップを独立してターゲットレベルに調整します。
    • 個別のクリップごとの音量がばらばらの場合に、それぞれを均一化する目的で使用します。
    • 例: 異なる音量で録音された音声クリップを同じ音量に揃える場合に適しています。

使い分けのポイント:

  • 【相対】同じ録音や制作のクリップ・音量バランスを維持したい場合
    1つの映像で製作
  • 【個別】異なるソースや録音環境のクリップ・均一な音量を目指したい場合
    複数の映像で作っている場合

書き出し

Fairlightページで書き出しします。

設定は既にプリセットに登録してあって呼び出せば良いだけです。

下の設定項目「Target・・・」を変更しないとファイルの大きさが1GBになってしまいます。
あまり覚えていませんが・・・。

ファイルが大きくなってしまうので、最近はこの設定で書き出しをしています。

フォーマットをQuickTimeにしているのは、コーデックをリニアPCMにするためです。

Davinci17で動画を作り始めた頃、途中でブチブチとノイズが入ることが有り
その対策で、この設定になっています。

それから「ずーと」この設定のまま来ています。

特に困っていないので、今後もこのままで行くと思います。

Youtubeは動画を削除すると評価が下がるとお話も聞くので、限定動画や非公開にしてしばらく放置予定です。

実は、この動画のUPは3回目、前の2つはお蔵入りです。

理由はエフェクトが消えていたからです。

そして、3回目の書き出しは、11回実施しています。約3分~4分です。

書き出し→再生→修正

動画アップ時間をかなり過ぎてしまったので

すぐにUPします。

今回の動画のレンダリング回数は20回以上です。
それだけ、トラブルと修正箇所が出てきたということです。

今回のトラブル

1.  書き出し(レンダリング)時に止まってしまう。

フリーズしている分けではなく、レンダリングを開始してから何も進まない・・・
画面は「Magic Mask トラッキング中・・・」

2.  FX(エフェクト)が消えてしまった。
最初に気がついたのは「何人たりとも・・・」のセリフのところでFXの効果が消えていた
?と思って、もう一度、 SSLのX-ORCISM2でエフェクトを付けてレンダリング・・・

今度は、画面に文字が出ない・・・真っ黒です。

試行錯誤してたら、できるようになった。

多分、FUSIONコンポジションの何かが悪さをしていた気がします。

右クリックして、キャッシュをいじったり、素材を思い切って移動させていたら直ってしまった。

多分これも30分以上は、試行錯誤していた。

3. 属性のコピペをしたらコピー元の音声に全て置き換わってしまっていた。
気がつくのが遅れてUNDOでは、戻せなかった。

属性のコピペとは、その素材のズームや位置・FXなどを他の素材に貼り付けする機能のことです。

時短につながる方法なのですが、なぜかコピー元と同じ素材に置き換わってしまって、修正に30分以上掛かってしまった。

Davinci Resolve レンダー停止(Magic Mask)

原因のクリップを見つけ出し※Magic Maskのレンダーを解いてやる(削除しなくても、リファイン範囲を少しずらせば再レンダーできる状態になる)

実施したこと。
エディットやフライト画面でクリップを選択して「D」を押すと反転して無効化することが出来ます。

原因と思えるところ、スタート時から全く動かない(CPUも無反応)のでスタートから4秒以内のMagic Maskが怪しいと推測

とりあえず2つのMagic Maskを使用したクリップを「D」を押して無効化。

フライト画面の左側の下の方の詳細設定
最適化メディア・プロキシメディア・レンダーキャッシュしたイメージを使用。(効果無し)

最適化メディアの生成

IN点-OUT点を4秒間に設定。
レンダーを実施→変化無し

キャッシュをクリアしてみる
再生→レンダーキャッシュの削除→使用していないモノ
効果無し

最適化メディアの生成(最初の4秒間にあるクリップ):効果無し

スタートの4秒以外のところでIN点-OUT点で範囲指定しレンダー
問題無く出来る事を確認

偶然に解決。
もう一度、問題のあるスタート4秒間のレンダーを実施。

レンダー出来た。

再生してみると「Magic Mask」が崩れたり無効になっている(カラーページで確認すると再レンダーを促す赤いラインになっている)

トラッキングを一度消してやり直す。

通常は消さなくても、トラッキングをやり直す事が出来るのですが、今回は反応しなかったので・・・。

解決。

解決には1日以上掛かってしまった。

※Magic Mask:対象物をペンで簡単になぞるだけで、その対象をフレームごとに自動でマスキングし続ける機能です。
従来は四角形や円形などの特定の形状で「マスク」として範囲を指定していましたが、動きのある対象物に対しては修正作業に手間がかかることが課題でした。
Magic Maskはこの手間を大幅に軽減し、効率的にマスキングを行うことができます。

コピーはできませんが、かぺNote応援ありがとう。