先月、私は「余裕」から「不可能」へと縮まった締め切りに直面していました。SaaS分野のクライアントが、新しいプロジェクト管理ツールの90秒のデモ動画を48時間以内に必要としていました。求められたのは、現実的な人間のプレゼンターであり、漫画のアバターや画面上のテキストではありません。予算はタイトで、500ドル未満。以前にHeyGenとSynthesiaの両方を使用したことはありましたが、同じ成果物で直接比較したことはありませんでした。そこで、責任あるテクノロジーレビュアーとして、同じスクリプト、同じアバタースタイル、同じ音声、同じ締め切りで両方のプラットフォームを試しました。以下が結果であり、醜い欠点もすべて明らかにされています。
設定:公平な土俵
90秒のスクリプトを3つのセグメントに分けて作成しました:イントロ(15秒)、機能ウォークスルー(45秒)、CTA(30秒)。動画に必要なもの:
- ビジネスカジュアルな男性プレゼンター、カメラに向かって。
- ソフトウェアの画面録画を重ね合わせ(ピクチャー・イン・ピクチャー)。
- フェードイン/アウトする背景音楽。
- 埋め込まれたクローズドキャプション。
- 1080p、MP4形式での出力。
同じテキスト読み上げ音声(中立的なアメリカ人男性、中程度のペース)と同じ背景(一般的なオフィス)を使用しました。カスタムAIモデルや多言語バージョンなどの「プレミアム」アドオンは一切使用せず、基本プランのみです。以下が生データです:
| 機能 | HeyGen(クリエイタープラン:月額29ドル) | Synthesia(スタータープラン:月額29ドル) |
|---|---|---|
| 価格(月額) | 29ドル(年払い:月額24.17ドル) | 29ドル(年払い:月額22ドル) |
| 無料トライアル | 1無料クレジット(1分動画) | 1無料動画(最大5分) |
| 最大動画長さ | 1動画あたり15分(クリエイター) | 1動画あたり10分(スターター) |
| アバター数 | 100以上(カスタム写真アバター含む) | 140以上(カスタム写真アバター含む) |
| カスタムアバター | あり(写真1枚アップロード、月額29ドル追加) | あり(写真1枚アップロード、月額29ドル追加) |
| 画面録画オーバーレイ | ネイティブ(ドラッグ&ドロップ) | ネイティブ(「画面」アセット経由) |
| 音声クローン | 含まれる(最大5音声) | 含まれない(アドオン、月額95ドル) |
| 背景音楽 | 内蔵ライブラリ(30トラック) | 内蔵ライブラリ(50+トラック) |
| クローズドキャプション | 自動生成、編集可能 | 自動生成、編集可能 |
| エクスポート解像度 | 1080p(エンタープライズ版4K) | 1080p(エンタープライズ版4K) |
| 多言語 | 40以上の言語 | 120以上の言語 |
| スクリプトアシスタント | あり(AI駆動) | あり(AI駆動) |
| APIアクセス | あり(追加費用) | あり(追加費用) |
| ウォーターマーク | なし(有料プラン) | なし(有料プラン) |
| レンダリング速度 | 90秒動画で約3分 | 90秒動画で約8分 |
| 編集の柔軟性 | タイムラインベース、細かく調整可能 | シーンベース、やや粗い |
| サポート | メール+チャット(営業時間) | メール+チャット(上位プランは24/7) |
HeyGenの体験:スピードと洗練、しかし荒い部分も
HeyGenにログインし、「James」という男性アバター(ビジネスカジュアル、中立的な表情)を選択しました。インターフェースはすっきりしており、動画版Canvaのような印象です。スクリプトをテキストボックスに貼り付けると、AIが自動的にシーンに分割しました。各シーンは独立したブロックで、アバターのポーズ、背景、オーバーレイを変更できます。
良かった点:
- レンダリング速度が驚異的でした。 90秒の動画が3分12秒でレンダリングされました。同じハードウェア(私のM2 MacBook Air)で、Synthesiaの約2倍の速さです。タイトな締め切りには重要です。
- タイムラインエディターは本当に便利です。 個々の単語をドラッグしてタイミングを調整したり、間を追加したり、アバターの瞬きの頻度を変更したりできます。例えば、「Here's how it works」の後に0.5秒の間を追加して、画面録画に余裕を持たせました。Synthesiaのシーンベースのエディターでは、シーンを分割する必要があります。
- 音声クローンが含まれています。 クライアントのCEOの30秒クリップをアップロードすると、HeyGenが2分でクローンを作成しました。結果は85%の精度で、完璧ではありませんが、内部使用には十分です。Synthesiaはこの機能に月額95ドルかかります。
- 画面録画オーバーレイが非常に簡単です。 ソフトウェアデモのMP4をアップロードし、シーンにドラッグしてサイズを変更するだけです。AIが自動的に「ピクチャー・イン・ピクチャー」ゾーンに配置しました。手動キーフレーミングは不要です。
悪かった点:
- アバターの口の動きが少しずれています。 長い文のシーン(例:「Our tool integrates with Slack, Jira, and Trello」)では、唇が時々1〜2フレーム止まり、ストロボ効果が生じます。微妙ですが、27インチモニターで気づきます。
- 背景音楽ライブラリが貧弱です。 トラックはわずか30曲で、半分はロイヤリティフリーのエレベーターミュージックのように聞こえます。自分のMP3をインポートする必要がありましたが、手間が増えました。
- スクリプトアシスタントがひどく愚かです。 「Show the user how to create a task」と入力すると、「The user can create a task by clicking the plus icon」と提案されました。これはスクリプトではなく、ヘルプ記事です。結局、すべて手動で作成しました。