広告

トップページ > DTMのための音楽機材・ソフト紹介 > 【悪用厳禁】自分の声がプロの歌手に!?AI ボイスチェンジャー「LALAL.AI」のヤバさを体験
目次を見る
Sleepfreaks監修のDTM向けPC

【悪用厳禁】自分の声がプロの歌手に!?AI ボイスチェンジャー「LALAL.AI」のヤバさを体験

【PR】

カスタムボイスを手に入れる!「Voice Cloner」の特徴と活用法

音声分離サービスで知られるLALAL.AIが、既存のボーカルやナレーションの声をAIに学習させ、カスタムボイスを作成できる新機能「Voice Cloner」をリリースしました。
このサービスは、音楽制作者やクリエイターのアシスタントツールとして、新たな可能性を感じさせる画期的な機能となっています。
本記事では、Voice Clonerの特徴や使い方の手順などを解説します。

LALAL.AI「Voice Cloner」 動画解説

Voice Clonerとは?

Voice Clonerは、自分や特定の人物の声をAIに学習させて、自然なボイスパック(音声クローン)を作成するサービスです。
同社の「Voice Changer」と組み合わせることで、別の音声ファイルのボーカルやナレーションを、手軽にボイスパックに置き換えることも可能です。

活用例と可能性

このVoice Clonerの登場は、様々なクリエイティブな用途に活用できる可能性を秘めています。
例えば、音楽制作においては、以下のような使い方ができそうです。

  • デモ音源の精度向上 : 仮歌を本番ボーカリストの声で制作し、ディレクションの質を高める
  • パートの追加・修正 : レコーディング後に、本人の声でハーモニーなどを追加する。
  • 声域外のカバー : ボーカル合成ソフトなどの歌唱を使い、自身の声域では歌えないパートを作成する

また、公式サイトでは、下記のような活用法も紹介されています。

  • コンテンツ制作 : ポッドキャストや広告ナレーションなどを効率的に作成する
  • 思い出の保存 : 家族などの愛する人の声で、大切な思い出を保存するオーディオ記念品を作成する
  • カスタムメッセージ : 自分の声を何度も録音し直すことなく、カスタム音声メッセージを作成する

なお、自分以外の声を使用する場合は、必ず本人の許可を得てからボイスパックを作成してください。

ボイスパックの作成と使用手順

ボイスパックの作成には、元となる声の音声ファイルが必要です。
まずは、下記のポイントを参考に音声ファイルを準備してください。

  • 音声の長さ : 合計10分〜50分ほど。長いほど精度が向上する傾向
  • ファイル数 : 分割された録音ファイルでも最大5つまで同時にアップロード可能
  • 音質 : AIではノイズも学習するため、できる限りクリアな音質を推奨

今回は、下記のようなナレーションを40分ほど収録しました。

1. ログイン

Voice Clonerは専用ソフトウェアではなくウェブサービスとなるため、下記の公式サイトにアクセスし「ログイン」します。
LALAL.AI公式サイト

まだアカウントを持っていない場合でも、ログインから指示に従って進めることで簡単に登録が完了します。

もし、英語で表示されている場合は、右上の赤い箇所をクリックすると「日本語表示」に切り替えることができます。

2. アップロードと解析

画面上部の「製品」メニューから「Voice Cloner」を選択します。

「ファイルを選択」からを元となる声を収録した音声ファイルをアップロードします。
音声ファイルは、ドラッグ&ドロップでもアップロードが可能です。

ファイルのアップロードが完了したら、任意のボイスパック名を入力し「続行」ボタンをクリックすると、音声ファイルの解析が開始します。

AIによる音声解析(ボイスパックトレーニング)は時間がかかる場合があります。
音声ファイルの長さやサーバーの負荷によって変わってきますが、例えば40分〜50分のファイルで約1時間〜1時間半ほど要することもあるため、時間に余裕を持って実行するのがおすすめです。
解析が完了すると「試してみる」ボタンが表示されるので、クリックします。

3. プレビューと購入

ここでは、左側にサンプルのナレーションや英語の歌などが用意されており、試したいものを選択しプレイボタンをクリックすると、作成した声で再生されます。
ボイスパックは一度購入すると、後から追加学習させたり修正したりすることができないため、このプレビューで精度をしっかりと確認してください。
もし納得いかない場合は、音声ファイルの録り直しからもう1度やり直すことをおすすめします。
(ここまでの手順は無償で行え、クレジット消費も発生しません)

「購入」ボタンをクリックすると、購入手続きのページへ進みます。

価格プラン

Voice Clonerには、2種類のバンドルプランが用意されています。
どちらのプランも作成できるボイスパックは1つで、変換できる楽曲の分数が異なります。
プランを選択し「カード」ボタンをクリックすると、決済ページに移行します。

Vox Lite BundleVox Max Bundle
価格$20(約3,000円)$45(約6,700円)
内容1つの音声パック1つの音声パック
ボーナスミニッツ
(利用可能時間)
20分500分
おすすめの用途小規模プロジェクト、試験的利用大規模プロジェクト、継続的利用

※価格は為替や時期によって変動する場合があります。

4. 声の差し替え

ボイスパックの購入が完了したら、いよいよ実際に声の差し替えを行います。
「製品」メニューから「Voice Changer」を選択します。

ボイスパックの一覧から、使用したい声を選択します。(ここでは先ほど作成したMy Voiceを選択しました。)

次に、声を差し替えたい楽曲ファイルまたは動画をアップロードします。
「オーディオまたは動画を選択します」ボタンからファイルを選択するか、ドラッグ&ドロップでもアップロードできます。
また、LALAL.AIの画期的な機能として、AIが自動でボーカルだけを分離し差し替えを行うため、アップロードの際はボーカルと伴奏が分かれていない、いわゆる2ミックスの完成音源をそのまま使用することが可能です。

5. プレビューとアクセントやピッチの調整

音源ファイルのアップロードが完了すると、プレビュー画面に切り替わります。
プレイボタンをクリックするとアップロードした楽曲のボーカルが、ボイスパックの声に変わっていることを確認できます。

▼差し替え用に準備した音声(ナレーション)

▼上記をボイスパック(My Voice)に差し替えた音声

歯車アイコンの処理設定では、アクセントや調性、エコーについての設定を行うことができます。

  • ターゲット音声に合わせる : デフォルト設定
    差し替え後の声の特性に合わせるため、楽曲全体のキーが変更される場合あり
  • 元のアクセント・トーンを維持する : アップロードした楽曲のキーやトーンを維持する設定
    ラップ曲などで元のニュアンスを保ちたい場合や、キーの変化を避けたい場合に有効

なお、プレビュー再生ではクレジットは消費されないため、納得がいくまで何度でも曲や設定を変えて試すことができます。

6. ダウンロードとクレジット消費

ダウンロードは、「ファイル全体を処理する」ボタンを押します。
完成版のファイルをダウンロードする際に、初めて楽曲の長さに応じたクレジットが消費されます。
ダウンロードされるファイルは、ボーカルが差し替えられた単一のオーディオトラックで、ファイル形式は、アップロードしたファイルと同じ形式になります。(例:MP3で入れればMP3で、WAVで入れればWAVで出力)

作成したボイスパックの音声例

最後に、参考として、前述した処理設定を変えることで2パターン(ボイスパック違いで全4パターン)の音声を用意しました。
AI繋がりということで、音楽生成サービス「SUNO」で楽曲を作成し、さらに簡単なミュージックビデオも制作してみましたので、聴き比べながらご覧ください。

楽曲例 : City Pop(金谷の場合)

【MV】処理設定 : ターゲット音声に合わせるで声を差し替えた場合

【MV】処理設定 : 元のアクセント・トーンを維持するで声を差し替えた場合

楽曲例 : Hip Pop(宮川の場合)

【MV】処理設定 : ターゲット音声に合わせるで声を差し替えた場合

【MV】処理設定 : 元のアクセント・トーンを維持するで声を差し替えた場合

まとめ(絶対に守るべきこと)

いかがだったでしょうか。
聴いていただいたとおり、LALAL.AIのVoice Clonerは、作成されるボイスパックの精度が高いため、アイデア次第で時短やクリエイティビティを刺激するツールとして、大きな可能性を秘めています。

ただし、利用には責任が伴い、AI技術の常として悪用の危険性も指摘されています。
音声素材を利用する際は、使用目的を含め、必ず本人の明確な許可を得ることが必須です。
著作隣接権、肖像権、パブリシティ権などを侵害しないよう、法律やマナーを遵守した上で活用するように気をつけて、新たな可能性を探ってみてください!