STORY /

面倒なプレゼンは「デジタル人類」にお任せ、Rephrase.aiが示す働き方

Last Updated:
Aug 4, 2021

「自動生産」の兆し

この1年でZoomでの会議が増えましたが、「果たして動きのない自分の顔をカメラに映し続ける意味はあるのか」、と疑問に思った人も少なくないはず。

たしかに会議に出席している“感”や、チームとしての“グルーヴ感”を出すに顔出しは必要でしょう。今日から会社のメンバーが全員顔を出さなくなったらもちろん困ります。しかし、これから5-10年先にも同じように、当事者がカメラの前に座り続ける習慣が存在しているのかは甚だ疑問に感じます。

こう感じたきっかけとして、非同期に動画メッセージを残せるサービス「Loom」を多用する機会に恵まれたことが挙げられます。

何人ものメンバーに会議室に集まってもらうにも関わらず、その場で資料と全く同じ内容を話すのは時間の無駄になってしまうことがあります。そこで、動画メッセージを事前に共有して、プレゼンを会議前に視聴してもらっていた方が、いきなり質疑応答に入れるため、会議時間を最大限有効活用できることが多いです。

動画メッセージ体験はこれから到来する「自動生産社会」の始まりを象徴しています。ゆくゆくは動画メッセージを送るのも、Zoomのカメラに映るのも、全て自分のレプリカ「デジタル人類」となっていくでしょう。私たちは自ら何かを生産するのではなく、レプリカも生産力を発揮し、何倍もの成果を残せるようになると感じます。

ここからは生産性文脈で登場しつつある、デジタル人類を具体化したサービスを紹介します。

営業プレゼンはAIにお任せ、「Rephrase.ai」の事例

インドを拠点とするスタートアップ「Rephrase.ai」。2019年のTechstars Bangaloreプログラムに参加しており、その後Lightspeed Venture PartnersとAV8 Venturesがリードするシードラウンドで150万ドルの調達を発表しています。同社はセールスメールの自動化に努めています。

Rephrase.aiを使えば、テキスト情報だけでAIが勝手にセールストークをしてくれている動画を作成できます。メールに貼り付ければ、動画を活用した立派なセールスメールが完成。使い方は至ってシンプルです。実際の人間そっくりのアバター画像と音声を選択、あとはピッチして欲しいテキスト情報を入力するだけ。アバターが入力テキストに沿ってプレゼンをした動画データが出力されます。

動画があれば、より深く情報を伝えることができるため、従来の淡白なメールのやりとりをアップデートすることができます。TechCrunchの取材によれば、開封率も向上するとのこと。また、同記事ではRephrase.aiの技術面にも触れられています。曰く、実際のスタジオで(任意のフレーズを言っている)人物を10分間撮影した場合、その人物の唇の動きがどのようになるかを予測することができる技術を保有しているとのことです。

これら技術は「ディープフェイク」の分野に括られます。自分の代わりに何かしらの情報発信をしてくれるアバターを生成し、それらにタスクをこなしてもらうことができる未来は、すでに実装されつつあります。

続々と作られる、デジタル人類・ライブラリー

アバターと動画の相性はとても良い印象です。別の事例として「Synthesia」を挙げます。同社はAI動画生成プラットフォームを開発しており、2021年4月、First MarkがリードするシリーズAラウンドにて1,250万ドルを調達したと発表。

40以上の言語に対応した、AIアバターを活用したプレゼン動画をアウトプットします。まずは企業向けの教育コンテンツ市場をターゲットとしている模様。たとえば従業員のトレーニング動画や、会社や部門全体のビデオアップデートなどを手軽に行えるようにしています。

使い方はRephrase.aiと似ており、Synthesiaの提供するライブラリーの中から、好きなアクターを選択。もし自分の動画を使いたければ、手順に沿って素材データをアップロードして使えるようになります。次にテキストを入力すれば、あとはアバターがその内容に沿ってプレゼンをしている動画が完成します。ちなみにアバター元となるアクターは、自分が出演した作品ベースで報酬が発生するとのこと。

こちらの記事によると、Synthesiaの今後の活用法として、毎日(もしくは毎週)届くチームの全体メッセージに上司のアバターが動画で説明するユースケースが記されています。テキスト・メールのようなドライなコミュニケーションではなく、より立体的かつリッチな表現でチームメンバーに現在のプロジェクト進捗を伝えられるといいます。また、特定の株価・銘柄を指定しておき、日々のマーケット相場をAIアバターにしゃべらせた動画をスマホの電話番号に送るといった、APIベースの取り組みにも着手しているとのこと。

こうしたデジタルクローン技術を持つスタートアップは世界的に多数登場してきています。

ポッドキャスト編集ツール「Descript」は、AI合成音声による自動読み上げ機能「Overdub」をリリース。ライブラリーにあるアクターの音声や、自分の音声を使ってテキストをそれっぽく読み上げてくれます。ポッドキャスト音声コンテンツの量産を可能としています。同じく音声クローン領域では、「Resemble.ai」や、「Resepeecher」も活躍。

他にも周辺技術として、ユーザーの表情を読み取ることで3Dアバターの表情をリアルタイムに反映する技術を持つ、Epic Gamesに買収された「Hyprsense」や、カメラで取得した情報をリアルタイムでアニメーション化するAdobeが開発するアバターアニメーターなども挙げられます。

AIアバターやデジタルヒューマン系のサービスは、私たちの実際の話し方や表情データに基づいた研究の賜物。その上で、徐々に私たちは1人につき1人の割合で、自身のAIアバターを作りつつあります。形はゲームキャラクターから、実際の自分の体型・顔に寄せたものまで様々ありますが、無数の「デジタル人類」とも呼べるデータ像がインターネット空間に作られ続けています。

アバターが、僕らの「時間」を拡張する

Image Credit:Morgan Housel

ここまで紹介してきたアバターや合成技術は、私たちの時間を最大化させる大きなメリットを持ちます。

1人では到底時間の足りない作業を、AIアバターを駆使することで多動的にこなすことができるでしょう。自分1人では1日8時間の事業プレゼンしかできない場合でも、アバターを使えば2倍・3倍のプレゼン数を勝手にこなせているといったことも可能。多言語化すれば、さらにその数倍以上の場数をこなせるかもしれません。

まさに私たちの分身を作り出し、24時間という誰もに科された時間の制約を取り払うことができます。「時間の拡張」を行えるとも言えます。

私たち人類の代わりに、デジタル人類と接する時間が増えれば、現在のデジタルインターフェースも変わるに違いないはず。1日の大半をアバターとコミュニケーションを気楽に取れる、プロジェクション技術や、グラス端末の活用が注目されるはずです。

デスクトップやスマホ上に映し出されるアバターのプレゼン動画を観るという体験では終わらず、ARグラス端末やVRヘッドセットを通じたデジタル空間を介して、当人と会話をするかのようにアバターとやり取りする、まさに本物の人間と触れているようなコミュニケーション体験が求められると考えられます。

自分の知性・知能がインストールされたAIアバターが会議ディスカッションに参加してきてくれて、その場で交わされた内容は後ほど議事録としてサマリーを共有する。最終的な意思決定は物理世界に住むユーザーが下すといったフローが1つ考えられるかもしれません。

いずれによせ、世界はゆっくりとですが、デジタル人類にタスクを消化してもらう動きになりつつあります。それに連れてデジタル情報そのものとやり取りをするインターフェースへと進化することでしょう。その中でAR・VR端末は広く使われていく重要な要素となるはずです。

このSTORYが収録されているMAGAZINE