今年の1月31日から、AI 生成にはまっています。
こんなことになってるとは、想像もしていませんでした。
AI生成といっても、 オープンAIのChatGPTは2年ほど前から使っていました。
まぁ使うといっても、英語の翻訳するとか、文章を校正してもらうとか、 メールの返信を代わりに書いてもらうとか。 その程度の使い方。
しかしGoogleの画像生成AI「イメージFX」のリリースとともに画像生成AIを試したところ、あまりの出来の良さにびっくりしてしまいました。
とともに、YouTubeを見てみるとやたらAI生成の音楽とか動画ミュージックビデオが溢れているではありませんか。
みんなものすごい勢いで次から次へとミュージックビデオををアップしています。そんなに簡単に次々と作れるものなのかと、驚いていましたが、まぁ実際自分でもやってみればどんなもんだかわかるかなと思って始めたのです。

これがAI生成で初めて生成した画像。 プロンプトは「書き初め」
いやはや画面上は日本語をちゃんと認識できなくて適当な漢字を書いてしまうと言うところに驚きと不思議な魅力を感じました。
「書き初め」と言うプロンプトを英語で入れるとこんな画像を作ってくれるのですが、
フォトリアリスティックと言う言葉を足すとこんな写真になります。

というところから始まり、2月の3週間位で 2本のミュージックビデオを作ってみました。
これは2個目に作った動画です。走ったり歌ったり、など人物の動きが大きいところになると入力した画像の人の顔が、全く別人に変わってしまいます。
これはまだ生成AIの使い方が全くわからない状態で初めて作った動画。
実際に生成してみると人が勝手に動いたり勝手にくるくる回ったりするので、ものすごくてこずりました。
この3週間位は、ネット上やYouTubeにある情報を検索しまくりで。
以前デモとして作った曲で、ストックしてあった曲があったので、それに映像をつけて。
まず最初に画像を生成させるには、GoogleのイメージFXもしくはステイブルディフュージョンと言うソフトが優秀で。それをもとに、歌う人の映像とか、背景の景色を生成。
その画像をもとにムービーを生成させるには、KLING,Hailuo,SORA,Runway
と言うアメリカ製か中国製のソフトが優秀であるということがわかり、次から次へとサブスク契約していきました。
そして、画像の中の人の動きを英語で書いていきます。
例えば上の「風に乗って」のラストの子供達が走るドローンのショットだと、こんなふうなプロンプトを書きます。
「ドローンから見下ろした。川と河原。桜の木が生えている。桜は満開。
20人いる子供たちは、手に手にそれぞれピンク色の20メートルあるリボンを持って
右から左に走っている。20本あるリボンは宙に舞い上がる。画面一面に広がる。」
「Looking down from the drone. A river and the riverbank. Cherry trees are growing there. The cherry blossoms are in full bloom.Twenty children are running from right to left, each holding a 20-meter pink ribbon in their hand. The 20 ribbons fly up into the air.The drone gradually lowers its altitude.They spread across the entire screen.」
さて、この画像生成AIの利用料金。
サブスクといっても一月10ドル程度で使用できるので結構手軽に始めることができます、また中には生成時間に ものすごく長時間かかりますが無料のものもあります。
さらにSUNO AI と言う音楽制作 ソフトも凄まじい進化を遂げていて、歌のクオリティーが非常に高く、さらに数十秒で1曲完成させてしまうと言う、作曲家にとっては、恐ろしいことになっていました。
といっても、実際に仕事でオリジナルの音楽が必要になった場合は、ディレクターと相談して、例えばここのフレーズはブラスじゃなくてストリングスにしましょうか、などと言う要求に応えられるような機能はまだまだついていませんが、そのうちプロンプトを適切に書けばイメージに近い曲が1分以内に次々と生成できるような時代になってしまうんでしょうね。
ここ数週間で生成した音楽と映像のリンクを貼っておきました。
この曲は、ある人の務める学童保育のテーマソングを作ってみたものです。最近の学童保育の行事とか、楽しいイベントのことを聞いて、 チャットGPT で作詞しました。
その詩をもとにSno AIで生成したのですが、6曲生成して、この曲が1番イメージにあったのでこれを採用。
6曲生成するのに10分はかからなかったかな?人間では絶対無理ですね。
とまぁまだまだ始まったばかりで、いずれのソフトも数ヶ月前にリリースされたばかり。
まだバージョン1.*のような状態です。
KLINGの動画サービスが日本でアクセス可能になったのが2024年7月。
Image FXは2024年8月
SORAは2024年12月
Googleの動画生成Veo2は間も無くサービス開始。
ウェイティングリストに 登録しています。
ただ他のサービスからVeo2を使えるサービスもあるので、もう日本でも使い始めた人がいるようです。
とまあ今年2025年はこれらのサービスが、出揃うのかな?
それでもどこにもロケにいかず、空撮もせず、歌手も女優も雇わず、これができてしまうのは、ちょっと驚きですね。
とても面白い時代になったものです。
ちなみにブログをChatGPTに校正してもらうのは、やめました。
整った文章になるのですが、AIに頼むと、なんか基本的に伝えたいことがちゃんと伝わらないような文章になってしまうので…
Commentaires