12時間の編集でビデオ制作を見直した話
前四半期、私は週末全体を使って12分の製品デモを再録音しました。リードエンジニアが風邪を引いていたからです。彼の声は3語ごとに割れ、照明は不適切で、背景には散らかった在宅オフィスが映っていました。再撮影、再編集、再出力を終える頃には12時間を費やしていましたが、最終版は2020年のZoom通話のように見えたままでした。その時、ついにSynthesiaを試しました。それは期待した魔法の弾丸ではありませんでしたが、特定の痛みを伴う問題を解決しました:人間が不在でも人間らしいプレゼンターを得ること。
実際の機能:Synthesiaはテキストから話すAIビデオアバターを生成します。スクリプトを入力し、既製のアバターを選ぶ(または写真をアップロードしてカスタムアバターを作成する)と、20分以内にそのアバターが台詞を届けるビデオが得られます。アバターはリアルなリップシンク、頭の動き、手のジェスチャーを持っています——漫画的な「不気味の谷」の顔はありませんが、本当の感情もありません。明るく照らされ、きちんと服装したニュースアンカーが、適度な熱意でテレプロンプターを読む姿を想像してください。
実際の使用例:オスカー級のストーリーテリングには向いていません。社内トレーニングビデオ、カスタマーオンボーディング、セールスピッチに最適で、コンテンツは情報提供が目的で、プレゼンターは交換可能です。私は200人の営業担当者向けに、新しいダッシュボードの4分間のウォークスルーを作成しました。アバターは明確に話し、つまずくことなく、ボタンラベルを変更した際に10分でスクリプトを更新できました。再撮影は不要でした。
価格の現実(ほとんどのレビューが軽視する部分):Synthesiaの「パーソナル」プランは月額29ドルからで、月10分のビデオ、1つのカスタムアバター、90以上の既製アバターが含まれます。チームコラボレーション、ブランドに合わせたカスタムアバター、無制限のビデオ長が必要な「エンタープライズ」プランは月額1,000ドル以上です。落とし穴:29ドルのプランではアバターが1言語に制限され、背景除去もできません。ドイツ語や日本語を話すプレゼンターが必要な場合、月額89ドルの「プロ」プランを支払う必要があります。また、無料トライアルはわずか1分のビデオのみ——リップシンクのテストには十分ですが、予算に見合うか判断するには不十分です。
できないこと:生の映像からビデオを生成できません(実際の録画の編集は不可)。複雑な視覚効果や、複数のアバターが同じシーンで自然に相互作用することは処理できません。アバターの感情表現は限定的で、涙、笑い、怒りはありません。スクリプトに専門用語や頭字語が含まれている場合、ロボット的な発音を避けるために音声表記を入力するのに30分かかります(例:「API」は「エイピーアイ」と発音)。
結論:Synthesiaは、特定の作業——低リスクでスクリプト化されたビデオで人間のプレゼンターを置き換えること——のための時間節約ツールです。ビデオ編集者や人間の俳優の代わりにはなりません。月に1つのデモを作成する個人起業家なら、29ドルのプランはお買い得です。四半期に50本のビデオを制作するマーケティングチームなら、1,000ドル以上のプランが合理的かもしれません——ただし、スクリプトがアバターの発音制限に対応できるか事前にテストしてください。