7月は展示会ラッシュ!からの生成AIは便利という話
7月の1か月間で、北九州、愛知、東京の展示会に出展いたしました。
リアルタイム音判定システム「エスカレイド」と嵌合音判定システム「エスカレイドボウル」がメイン展示で、加えて今回は新製品の「TegnosStade(テグノスステード)」のお披露目となりました。
展示会に際して、アイキャッチ動画を作成したのですが、今回は生成AIを用いて作成してみましたので、そのネタを書くことにします。
作成にあたって幾つかの参考となるyoutubeを視聴し、いざ。
まずはイメージの作成です。
GoogleImageFXを使ってみました。文章を入力すると、それに応じたイメージを作成してくれるツールです。
流れとしては、 このような感じです。
google翻訳で日本語の文章を英訳。
英訳した文章をGoogleImageFXに入力しイメージ作成を指示。
幾つかイメージ案を出してくれるので、そこからイメージに近いものを選定。
イメージと違えば文章を変えて再度イメージ作成を依頼。
しばしば言われることですが、どういった文章を入力するか?が大切です。
例えば、
イメージのテイスト(リアルな描写が良いのか、漫画的な描写か、抽象的なイメージか))
人物であれば年代や性別、身体的な特徴、表情。
背景(時間帯、場所、天候)。
どのアングルから見たイメージか(モニターに向かって座る横顔か後ろ姿かなど)
なんとなくのイメージを自分の中に持っておいて、何度か文章を入力していきイメージを固めていく作業でした。
何回か使っていると、補完すべき文章が見つかってきますが、一進一退なところも。イメージに近づいてきたと思ったら、離れたり。急に間抜けなものになったり。
使っていて難しいと思ったのは、抽象的なイメージを作ってもらうとき。
たとえば、仮想空間のネットワークが広がっていて、抽象化されたパソコン画面が1か所でかつ安全につながっているイメージ。テイストはクールでかっこよく。
なんとなく想像できますでしょうか。
このようなイメージが出来上がりました。(安全とかセキュリティというとだいたい盾と鍵穴で作ってきます。)
具体的な文章で抽象的なイメージの作成を依頼するのは矛盾しているのかもしれないなと思いつつ、AIは何かしら作成はしてくれます。そこが助かるのです。
きっとうまく指示する方法はあると思いますが、それらしいものが出来上がったので良しとしました。
何枚かイメージを作成したら、あとはBGMもMusicFXに依頼して作成し、後は編集して完了
今回の動画は紙芝居でしたが、人物がしゃべっている動画も作れるそうです。
テキストの読み上げ音声を作成
登場人物のイメージを作成
登場人物に動きを付けた動画を作成(これも生成AIで可能だそう。同じ人物像をキープしながら、カットが作れる!)
音声と人物をリップシンクさせて、あたかも喋っているかのように(これも生成AIで)
などと夢が広がるのですが、そりゃフェイク動画とか簡単に作れるよなぁと思い、恐ろしさも感じました。
(担当:ふ)