広告

音程処理 音楽理論 音楽機材・ソフト紹介 音圧・音量 音像処理 空間処理 波形処理 歪み・サチュレーター 機材設定 機材 書き出し・読み込み・変換 打ち込みテクニック 打ち込み 基本編集 周波数 便利操作・作業効率化 作詞のメソッド 作業環境 低音処理 レコーディング リミッター・マキシマイザー リバーブ リハーモナイズ リズム楽器 リズム処理 リズム モニタリング ミックスが上手くなるTIPS ミキサー・ミキシング マルチ音源 マスタリング ポップス ボーカロイド ボーカル ボリューム処理(コンプレッサー) ベース ベル ヘッドホン ブレイクビーツ ブラス ファイル管理 ピアノ・Key ビンテージ ヒット曲の分析 パッド バージョン新機能解説 バンドサウンドを創るには バッキング ハード機器 ハードウェア操作 ドラム・打楽器 ドラム ドラゴンクエスト トリガー トランジェント ディレイ ディエッサー テンポ処理 テストタグネーム ソフトシンセ ストリングス ステレオイメージャー シンセサイザー サンプリング サンプラー サウンド入出力 サウンド入出 コンプレッサー ゲーム音楽 ゲート グリッチ ギター ギタリストのためのAbleton Live キック カットアップ オートメーション オーディオ操作 オーディオ処理 オーディオインターフェイス エフェクト処理 エフェクト インストール/製品登録 イコライザー アナライザー いきものがかり Zynaptiq YouTube生配信 XLN Audio Xfer Records
トップページ > DTMのための音楽機材・ソフト紹介 > 【悪用厳禁】自分の声がプロの歌手に!?AI ボイスチェンジャー「LALAL.AI」のヤバさを体験
目次を見る
Sleepfreaks監修のDTM向けPC

【悪用厳禁】自分の声がプロの歌手に!?AI ボイスチェンジャー「LALAL.AI」のヤバさを体験

【PR】

カスタムボイスを手に入れる!「Voice Cloner」の特徴と活用法

音声分離サービスで知られるLALAL.AIが、既存のボーカルやナレーションの声をAIに学習させ、カスタムボイスを作成できる新機能「Voice Cloner」をリリースしました。
このサービスは、音楽制作者やクリエイターのアシスタントツールとして、新たな可能性を感じさせる画期的な機能となっています。
本記事では、Voice Clonerの特徴や使い方の手順などを解説します。

LALAL.AI「Voice Cloner」 動画解説

Voice Clonerとは?

Voice Clonerは、自分や特定の人物の声をAIに学習させて、自然なボイスパック(音声クローン)を作成するサービスです。
同社の「Voice Changer」と組み合わせることで、別の音声ファイルのボーカルやナレーションを、手軽にボイスパックに置き換えることも可能です。

活用例と可能性

このVoice Clonerの登場は、様々なクリエイティブな用途に活用できる可能性を秘めています。
例えば、音楽制作においては、以下のような使い方ができそうです。

  • デモ音源の精度向上 : 仮歌を本番ボーカリストの声で制作し、ディレクションの質を高める
  • パートの追加・修正 : レコーディング後に、本人の声でハーモニーなどを追加する。
  • 声域外のカバー : ボーカル合成ソフトなどの歌唱を使い、自身の声域では歌えないパートを作成する

また、公式サイトでは、下記のような活用法も紹介されています。

  • コンテンツ制作 : ポッドキャストや広告ナレーションなどを効率的に作成する
  • 思い出の保存 : 家族などの愛する人の声で、大切な思い出を保存するオーディオ記念品を作成する
  • カスタムメッセージ : 自分の声を何度も録音し直すことなく、カスタム音声メッセージを作成する

なお、自分以外の声を使用する場合は、必ず本人の許可を得てからボイスパックを作成してください。

ボイスパックの作成と使用手順

ボイスパックの作成には、元となる声の音声ファイルが必要です。
まずは、下記のポイントを参考に音声ファイルを準備してください。

  • 音声の長さ : 合計10分〜50分ほど。長いほど精度が向上する傾向
  • ファイル数 : 分割された録音ファイルでも最大5つまで同時にアップロード可能
  • 音質 : AIではノイズも学習するため、できる限りクリアな音質を推奨

今回は、下記のようなナレーションを40分ほど収録しました。

1. ログイン

Voice Clonerは専用ソフトウェアではなくウェブサービスとなるため、下記の公式サイトにアクセスし「ログイン」します。
LALAL.AI公式サイト

まだアカウントを持っていない場合でも、ログインから指示に従って進めることで簡単に登録が完了します。

もし、英語で表示されている場合は、右上の赤い箇所をクリックすると「日本語表示」に切り替えることができます。

2. アップロードと解析

画面上部の「製品」メニューから「Voice Cloner」を選択します。

「ファイルを選択」からを元となる声を収録した音声ファイルをアップロードします。
音声ファイルは、ドラッグ&ドロップでもアップロードが可能です。

ファイルのアップロードが完了したら、任意のボイスパック名を入力し「続行」ボタンをクリックすると、音声ファイルの解析が開始します。

AIによる音声解析(ボイスパックトレーニング)は時間がかかる場合があります。
音声ファイルの長さやサーバーの負荷によって変わってきますが、例えば40分〜50分のファイルで約1時間〜1時間半ほど要することもあるため、時間に余裕を持って実行するのがおすすめです。
解析が完了すると「試してみる」ボタンが表示されるので、クリックします。

3. プレビューと購入

ここでは、左側にサンプルのナレーションや英語の歌などが用意されており、試したいものを選択しプレイボタンをクリックすると、作成した声で再生されます。
ボイスパックは一度購入すると、後から追加学習させたり修正したりすることができないため、このプレビューで精度をしっかりと確認してください。
もし納得いかない場合は、音声ファイルの録り直しからもう1度やり直すことをおすすめします。
(ここまでの手順は無償で行え、クレジット消費も発生しません)

「購入」ボタンをクリックすると、購入手続きのページへ進みます。

価格プラン

Voice Clonerには、2種類のバンドルプランが用意されています。
どちらのプランも作成できるボイスパックは1つで、変換できる楽曲の分数が異なります。
プランを選択し「カード」ボタンをクリックすると、決済ページに移行します。

Vox Lite BundleVox Max Bundle
価格$20(約3,000円)$45(約6,700円)
内容1つの音声パック1つの音声パック
ボーナスミニッツ
(利用可能時間)
20分500分
おすすめの用途小規模プロジェクト、試験的利用大規模プロジェクト、継続的利用

※価格は為替や時期によって変動する場合があります。

4. 声の差し替え

ボイスパックの購入が完了したら、いよいよ実際に声の差し替えを行います。
「製品」メニューから「Voice Changer」を選択します。

ボイスパックの一覧から、使用したい声を選択します。(ここでは先ほど作成したMy Voiceを選択しました。)

次に、声を差し替えたい楽曲ファイルまたは動画をアップロードします。
「オーディオまたは動画を選択します」ボタンからファイルを選択するか、ドラッグ&ドロップでもアップロードできます。
また、LALAL.AIの画期的な機能として、AIが自動でボーカルだけを分離し差し替えを行うため、アップロードの際はボーカルと伴奏が分かれていない、いわゆる2ミックスの完成音源をそのまま使用することが可能です。

5. プレビューとアクセントやピッチの調整

音源ファイルのアップロードが完了すると、プレビュー画面に切り替わります。
プレイボタンをクリックするとアップロードした楽曲のボーカルが、ボイスパックの声に変わっていることを確認できます。

▼差し替え用に準備した音声(ナレーション)

▼上記をボイスパック(My Voice)に差し替えた音声

歯車アイコンの処理設定では、アクセントや調性、エコーについての設定を行うことができます。

  • ターゲット音声に合わせる : デフォルト設定
    差し替え後の声の特性に合わせるため、楽曲全体のキーが変更される場合あり
  • 元のアクセント・トーンを維持する : アップロードした楽曲のキーやトーンを維持する設定
    ラップ曲などで元のニュアンスを保ちたい場合や、キーの変化を避けたい場合に有効

なお、プレビュー再生ではクレジットは消費されないため、納得がいくまで何度でも曲や設定を変えて試すことができます。

6. ダウンロードとクレジット消費

ダウンロードは、「ファイル全体を処理する」ボタンを押します。
完成版のファイルをダウンロードする際に、初めて楽曲の長さに応じたクレジットが消費されます。
ダウンロードされるファイルは、ボーカルが差し替えられた単一のオーディオトラックで、ファイル形式は、アップロードしたファイルと同じ形式になります。(例:MP3で入れればMP3で、WAVで入れればWAVで出力)

作成したボイスパックの音声例

最後に、参考として、前述した処理設定を変えることで2パターン(ボイスパック違いで全4パターン)の音声を用意しました。
AI繋がりということで、音楽生成サービス「SUNO」で楽曲を作成し、さらに簡単なミュージックビデオも制作してみましたので、聴き比べながらご覧ください。

楽曲例 : City Pop(金谷の場合)

【MV】処理設定 : ターゲット音声に合わせるで声を差し替えた場合

【MV】処理設定 : 元のアクセント・トーンを維持するで声を差し替えた場合

楽曲例 : Hip Pop(宮川の場合)

【MV】処理設定 : ターゲット音声に合わせるで声を差し替えた場合

【MV】処理設定 : 元のアクセント・トーンを維持するで声を差し替えた場合

まとめ(絶対に守るべきこと)

いかがだったでしょうか。
聴いていただいたとおり、LALAL.AIのVoice Clonerは、作成されるボイスパックの精度が高いため、アイデア次第で時短やクリエイティビティを刺激するツールとして、大きな可能性を秘めています。

ただし、利用には責任が伴い、AI技術の常として悪用の危険性も指摘されています。
音声素材を利用する際は、使用目的を含め、必ず本人の明確な許可を得ることが必須です。
著作隣接権、肖像権、パブリシティ権などを侵害しないよう、法律やマナーを遵守した上で活用するように気をつけて、新たな可能性を探ってみてください!