多すぎて悩む生成AI、最新注目ツールはこの3つ! お手軽で画像や音楽の作成に強力な性能を発揮

5/15 16:32 配信

東洋経済オンライン

空前の生成AIブームの中、一般の人でもそのすごさが実感できるような生成AIツールが次々と登場しています。SF作家のアーサー・C・クラークは「十分に発達した科学は、魔法と見分けがつかない」という言葉を残していますが、急速に発展する生成AIツールでできることは、数年前までは研究者ですら想像もつかなかったような、まさに「魔法」のようです。そんな最新生成AIツールについて『生成AIで世界はこう変わる』の著者であるAI研究者・今井翔太氏に語ってもらいました。

■どのようなツールを使えばいいか

 拙著『生成AIで世界はこう変わる』では、具体的な生成AIツールの使い方について説明を行うことはしませんでした。技術の発展が速すぎ、個別のツールの解説をしてもすぐに陳腐化するためです。

 仮に本の中でツールの説明をして、それが別の上位互換的なツールに置き換わってしまった場合、その記述は役に立たなくなってしまうでしょう。実際、動画生成AIに関しては、書籍の執筆時にあったほとんどの動画生成AIのツールは、OpenAI社の開発した動画生成AI「Sora」に置き換えられてしまいそうです。

 しかし、生成AIツールが増えすぎたがゆえに、かえって「どのようなツールを使えばいいかわからない」という声があがっています。現に、画像生成AIのツールだけでも何十個、何百個くらいのツールが存在します。

 また、「生成AIはすごいすごいと言われているが、自分でそれを実感できない」という声が一般の方からも多く聞こえてきます。

 研究者である私としては、あくまで生成AIツールの背後にある技術の理論の追求や解説が本分であり、実は個別の生成AIツールの説明というのは微妙に抵抗があります。

■生成AIの性能を実感できるツール

 ただ、このような状況を鑑みると、AI研究者の視点で「どんなツールが使うに値し、生成AIの性能を実感できそうか」を解説することは一定の価値があるように思います。

 ここでは、ChatGPT以降に登場した生成AIのツールに関して、拙著で取り上げられなかったもので、手軽に使用でき、その性能が一般の方にも実感しやすいような以下の3つの生成AIツールを紹介します。

①画像生成AI:Image Creator

②音楽生成AI:Suno
③動画像生成と声の生成AIのコラボレーション:HeyGen
 ①画像生成AI:Image Creator

最初に解説するのは、マイクロソフトの画像生成AIサービス「Image Creator」です。

 画像生成AIというと、Stable DiffusionやMidjourneyなどが有名ですが、一般の方が使うには意外とハードルが高かったりします。サイトが英語だったり、有料だったり、見慣れないUI(ディスコードというサービスなのですが、エンジニアやゲーマーはともかく一般の方はあまり馴染みがないでしょう)だったりと、気軽に触れるサービスとは言い難いでしょう。

 また、このようなサービスで綺麗で実用的な画像生成を行うには、複雑な英語で書かれたプロンプトが必要なのですが、これも初心者にはなかなか難しいものです。

 もっと手軽に利用できて、かつ画像生成AIの性能をすぐに実感できるサービスがこのImage Creatorです。利用は簡単で、マイクロソフトのアカウント(Googleアカウントのようなもので大丈夫です)を作ってログインすると、すぐに利用できます。

 誰もが利用するマイクロソフトのサービスで、サイトは日本語、プロンプトも日本語の簡単なもので非常に綺麗な画像が生成できます。次の画像は、実際にImage Creatorを使って私が画像を生成した様子です。「海中にある赤煉瓦建築の町」という無茶振りをしてみました。

 Image Creatorでは数秒程度で、上の図にあるような複数の画像が生成されます。入力したプロンプトは、イメージをそのまま言語化したような単純なものですが、非常に綺麗な画像が生成されています。

 それもそのはず、このImage Creatorの背後にある画像生成AIの本体はDALL-E3という、OpenAIが開発した最新の画像生成AIなのです。そのため、このツールは、現時点で最新の画像生成AIがただで使える大変お得なサービスです。

■圧倒的な質を誇る「Suno」

 ②音楽生成AI:Suno

拙著内で言及することができず、個人的に大変後悔している生成AIサービスが、音楽生成AIの「Suno」です。Suno自体は、私が本を執筆していた2023年の中盤ごろには存在しましたが、その性能が注目を集めるようになったのは2023年の12月でした。

 このSunoは歌詞を入力すると、実際にその歌唱と伴奏を生成してくれるサービスです。ボーカロイドのように、歌唱の一部を人間が調整するものはともかく、単なる歌詞の入力から音楽全体を作るAIサービスというのは、今まであまり脚光を浴びていませんでした。

 実際、今までに存在したほとんどのAIサービスの生成音楽の質は人間によるものには程遠く、せいぜい「これがAIの作った音楽(笑)」などと笑いのネタの一つとして消費されるくらいのものでした。その点、Sunoの生成音楽の質は圧倒的です。

 下の図は、実際にSunoに歌詞を入力して音楽を生成している様子です(ちなみにこの歌詞はChatGPTに考えてもらったもので、純AI音楽です)。GoogleアカウントなどでSunoのアカウントを作成し、「Create」ボタンから「Custom Mode」を選択して、歌詞を入力、そして「Create♫」ボタンを押してしばらくすると音楽が生成されます。

 Sunoには生成音楽の共有機能があります。以下のURLから、上の図で実際に生成した音楽を聴くことができます。

 →音楽の視聴はこちらから

 いかがでしょうか?  歌唱も伴奏も、実際のアーティストによるものと勘違いするような品質です。あくまで個人的な意見を申し上げると、表面上は人間のアーティストに迫るものであろうと、細かい部分は人間のほうが上だとは思いますが、Sunoが注目され始めた当初は、当の作曲家たちもその性能の脅威を主張していました。

 ③動画像生成と声の生成AIのコラボレーション:HeyGen

 ほんやくコンニャクという、有名なドラえもんの秘密道具があります。これを食べると、外国語が自分の母語で聞こえるようになり、自分も母語を話しているつもりで相手に応じた外国語を喋れるようになるというものです。生成AIの発展により、この秘密道具のようなことが実現できるようになっています。

■言語に合わせて唇の動きも生成AIで調整

自分が喋った内容を「自分の声を保ったまま」別の言語に変換できるようなAIは、すでにいくつか存在します。これだけでも十分に驚異的ですが、中にはその喋っている様子を入力し、「喋っているときの唇の動き」まで、別の言語を喋っているように調整できる生成AIツールが存在します。それがHeyGenです。

 HeyGenは実在の人間のみならず、架空の人間に喋らせたりなど、さまざまな機能がありますが、一番手っ取り早いのは、自分が喋っている様子の動画をアップロードして、別の言語を喋らせてみることでしょう。

 以下のHeyGen公式YouTubeアカウントにアップされたデモ動画では、女性が英語で喋っている動画を日本語などさまざまな言語で喋るものに変換しています。

 何も準備なくとにかく試してみたいという方は、HeyGenの中に最初から準備されているデモ用の動画(HeyGenのCEOが英語でスピーチをしている動画)を使い、それを日本語などに変換するのもいいでしょう。

 HeyGenはサイト内の言語が完全に英語で少しハードルが高く、また、サイトの外観も時間経過と共に変化するため、お世辞にも簡単に利用できるとは言い難いのですが、検索して出てくる日本語の解説サイトに従って操作すればできるはずです。HeyGen登録時にクレジットがいくらか与えられており、このクレジットの範囲であれば無料で利用できます。

 このHeyGenですが、すでにさまざまな場面で利用されています。今回ご紹介したのは言語の変換でしたが、ある人物の画像があれば、その人物に唇の動きも含めてさまざまなことを喋らせることができるため、有名人による解説や教育動画を作ることも可能です(もちろん、本人の同意が前提ですが)。また、行政の担当者などが外国語で発信する必要がある場合などにも利用できます。

 本記事では、計3つの生成AIツールを紹介しました。これらのツールは、どれも強力な性能を持ち、初めて見た人からすればまさに魔法のようなものです。それを利用するのも、大変役に立ち、また面白いことでしょう。ただし、生成AIツールは強力な反面、利用には注意が必要な点もいくつかあります。

■共有する場合は、著作権への配慮などが必要

 生成したものをネットで送信・共有したりすることなく、自分のスマホやPCで利用する分には、注意することはほとんどありません。せいぜい、使いすぎによるお金が心配という程度です。

 ただ、生成したものをネット上で共有する場合などは、著作権への配慮などが必要になってきます。意図的に他者の作品に似せたり、既存の作品の一部を改変したりなどという行為、あるいは実在の人物のフェイク動画やフェイク音声を作るといった行為は、法的に罰せられる可能性もあります。

 生成AIはまだまだ発展途上です。今後どのようなツールが登場するか、AIを研究している私のような者でも想像することは難しく、それだけに今後が楽しみです。

東洋経済オンライン

関連ニュース

最終更新:5/15(水) 16:32

東洋経済オンライン

最近見た銘柄

ヘッドラインニュース

マーケット指標

株式ランキング