【悪用厳禁】自分の声がプロの歌手に!?AI ボイスチェンジャー「LALAL.AI」のヤバさを体験
カスタムボイスを手に入れる!「Voice Cloner」の特徴と活用法
音声分離サービスで知られるLALAL.AIが、既存のボーカルやナレーションの声をAIに学習させ、カスタムボイスを作成できる新機能「Voice Cloner」をリリースしました。
このサービスは、音楽制作者やクリエイターのアシスタントツールとして、新たな可能性を感じさせる画期的な機能となっています。
本記事では、Voice Clonerの特徴や使い方の手順などを解説します。
LALAL.AI「Voice Cloner」 動画解説
Voice Clonerとは?
Voice Clonerは、自分や特定の人物の声をAIに学習させて、自然なボイスパック(音声クローン)を作成するサービスです。
同社の「Voice Changer」と組み合わせることで、別の音声ファイルのボーカルやナレーションを、手軽にボイスパックに置き換えることも可能です。
活用例と可能性
このVoice Clonerの登場は、様々なクリエイティブな用途に活用できる可能性を秘めています。
例えば、音楽制作においては、以下のような使い方ができそうです。
- デモ音源の精度向上 : 仮歌を本番ボーカリストの声で制作し、ディレクションの質を高める
- パートの追加・修正 : レコーディング後に、本人の声でハーモニーなどを追加する。
- 声域外のカバー : ボーカル合成ソフトなどの歌唱を使い、自身の声域では歌えないパートを作成する
また、公式サイトでは、下記のような活用法も紹介されています。
- コンテンツ制作 : ポッドキャストや広告ナレーションなどを効率的に作成する
- 思い出の保存 : 家族などの愛する人の声で、大切な思い出を保存するオーディオ記念品を作成する
- カスタムメッセージ : 自分の声を何度も録音し直すことなく、カスタム音声メッセージを作成する
なお、自分以外の声を使用する場合は、必ず本人の許可を得てからボイスパックを作成してください。
ボイスパックの作成と使用手順
ボイスパックの作成には、元となる声の音声ファイルが必要です。
まずは、下記のポイントを参考に音声ファイルを準備してください。
- 音声の長さ : 合計10分〜50分ほど。長いほど精度が向上する傾向
- ファイル数 : 分割された録音ファイルでも最大5つまで同時にアップロード可能
- 音質 : AIではノイズも学習するため、できる限りクリアな音質を推奨
今回は、下記のようなナレーションを40分ほど収録しました。
▼元の声として準備した音声ファイル
1. ログイン
Voice Clonerは専用ソフトウェアではなくウェブサービスとなるため、下記の公式サイトにアクセスし「ログイン」します。
LALAL.AI公式サイト
まだアカウントを持っていない場合でも、ログインから指示に従って進めることで簡単に登録が完了します。
もし、英語で表示されている場合は、右上の赤い箇所をクリックすると「日本語表示」に切り替えることができます。
2. アップロードと解析
画面上部の「製品」メニューから「Voice Cloner」を選択します。
「ファイルを選択」からを元となる声を収録した音声ファイルをアップロードします。
音声ファイルは、ドラッグ&ドロップでもアップロードが可能です。
ファイルのアップロードが完了したら、任意のボイスパック名を入力し「続行」ボタンをクリックすると、音声ファイルの解析が開始します。
AIによる音声解析(ボイスパックトレーニング)は時間がかかる場合があります。
音声ファイルの長さやサーバーの負荷によって変わってきますが、例えば40分〜50分のファイルで約1時間〜1時間半ほど要することもあるため、時間に余裕を持って実行するのがおすすめです。
解析が完了すると「試してみる」ボタンが表示されるので、クリックします。
3. プレビューと購入
ここでは、左側にサンプルのナレーションや英語の歌などが用意されており、試したいものを選択しプレイボタンをクリックすると、作成した声で再生されます。
ボイスパックは一度購入すると、後から追加学習させたり修正したりすることができないため、このプレビューで精度をしっかりと確認してください。
もし納得いかない場合は、音声ファイルの録り直しからもう1度やり直すことをおすすめします。
(ここまでの手順は無償で行え、クレジット消費も発生しません)
「購入」ボタンをクリックすると、購入手続きのページへ進みます。
価格プラン
Voice Clonerには、2種類のバンドルプランが用意されています。
どちらのプランも作成できるボイスパックは1つで、変換できる楽曲の分数が異なります。
プランを選択し「カード」ボタンをクリックすると、決済ページに移行します。
Vox Lite Bundle | Vox Max Bundle | |
---|---|---|
価格 | $20(約3,000円) | $45(約6,700円) |
内容 | 1つの音声パック | 1つの音声パック |
ボーナスミニッツ(利用可能時間) | 20分 | 500分 |
おすすめの用途 | 小規模プロジェクト、試験的利用 | 大規模プロジェクト、継続的利用 |
※価格は為替や時期によって変動する場合があります。
4. 声の差し替え
ボイスパックの購入が完了したら、いよいよ実際に声の差し替えを行います。
「製品」メニューから「Voice Changer」を選択します。
ボイスパックの一覧から、使用したい声を選択します。(ここでは先ほど作成したMy Voiceを選択しました。)
次に、声を差し替えたい楽曲ファイルまたは動画をアップロードします。
「オーディオまたは動画を選択します」ボタンからファイルを選択するか、ドラッグ&ドロップでもアップロードできます。
また、LALAL.AIの画期的な機能として、AIが自動でボーカルだけを分離し差し替えを行うため、アップロードの際はボーカルと伴奏が分かれていない、いわゆる2ミックスの完成音源をそのまま使用することが可能です。
5. プレビューとアクセントやピッチの調整
音源ファイルのアップロードが完了すると、プレビュー画面に切り替わります。
プレイボタンをクリックするとアップロードした楽曲のボーカルが、ボイスパックの声に変わっていることを確認できます。
▼差し替え用に準備した音声(ナレーション)
▼上記をボイスパック(My Voice)に差し替えた音声
歯車アイコンの処理設定では、アクセントや調性、エコーについての設定を行うことができます。
- ターゲット音声に合わせる : デフォルト設定
差し替え後の声の特性に合わせるため、楽曲全体のキーが変更される場合あり - 元のアクセント・トーンを維持する : アップロードした楽曲のキーやトーンを維持する設定
ラップ曲などで元のニュアンスを保ちたい場合や、キーの変化を避けたい場合に有効
なお、プレビュー再生ではクレジットは消費されないため、納得がいくまで何度でも曲や設定を変えて試すことができます。
6. ダウンロードとクレジット消費
ダウンロードは、「ファイル全体を処理する」ボタンを押します。
完成版のファイルをダウンロードする際に、初めて楽曲の長さに応じたクレジットが消費されます。
ダウンロードされるファイルは、ボーカルが差し替えられた単一のオーディオトラックで、ファイル形式は、アップロードしたファイルと同じ形式になります。(例:MP3で入れればMP3で、WAVで入れればWAVで出力)
作成したボイスパックの音声例
最後に、参考として、前述した処理設定を変えることで2パターン(ボイスパック違いで全4パターン)の音声を用意しました。
AI繋がりということで、音楽生成サービス「SUNO」で楽曲を作成し、さらに簡単なミュージックビデオも制作してみましたので、聴き比べながらご覧ください。
楽曲例 : City Pop(金谷の場合)
▼SUNOで作成した楽曲
▼ボイスパックを作成した金谷の声
【MV】処理設定 : ターゲット音声に合わせるで声を差し替えた場合
【MV】処理設定 : 元のアクセント・トーンを維持するで声を差し替えた場合
楽曲例 : Hip Pop(宮川の場合)
▼SUNOで作成した楽曲
▼ボイスパックを作成した宮川の声
【MV】処理設定 : ターゲット音声に合わせるで声を差し替えた場合
【MV】処理設定 : 元のアクセント・トーンを維持するで声を差し替えた場合
まとめ(絶対に守るべきこと)
いかがだったでしょうか。
聴いていただいたとおり、LALAL.AIのVoice Clonerは、作成されるボイスパックの精度が高いため、アイデア次第で時短やクリエイティビティを刺激するツールとして、大きな可能性を秘めています。
ただし、利用には責任が伴い、AI技術の常として悪用の危険性も指摘されています。
音声素材を利用する際は、使用目的を含め、必ず本人の明確な許可を得ることが必須です。
著作隣接権、肖像権、パブリシティ権などを侵害しないよう、法律やマナーを遵守した上で活用するように気をつけて、新たな可能性を探ってみてください!
- CATEGORY:
- DTMのための音楽機材・ソフト紹介