Lovable-Devが私を失望させた日(そしてWindsurfはそうではなかった)
物流クライアント向けにリアルタイムダッシュボードを構築していました。仕様:WebSocket駆動のライブ車両追跡マップ、500msごとに更新されるデータテーブル、ディスパッチャー向けチャットオーバーレイ。期限は3日。Lovable-Devから始めました。その「エージェント的」な売り文句が完璧に聞こえたからです。20分以内に壁にぶつかりました。AIが、すべてのWebSocketメッセージでマップ全体を再レンダリングするReactコンポーネントを生成し続けたのです——500msのリフレッシュ、完全なDOM再描画。ブラウザタブがクラッシュしました。Windsurfに切り替え、2時間でuseMemoとReact.memoを使った差分更新による動作するプロトタイプができました——AIが私が尋ねる前に提案してくれたものです。その瞬間に違いが明確になりました:一方のツールはコードを生成し、もう一方はソリューションを生成するのです。
これは単なる「こちらのほうが優れている」という見解ではありません。私は両方を半年間、本番プロジェクト(TypeScript、Python、Go、React、Node)で使用してきました。以下がデータに基づく分析です。
核心理念:2つの異なる種
Lovable-Dev(Lovable社、旧GPT Engineer)は「AIアプリビルダー」としてマーケティングされています——アプリを自然言語で説明すると、フルスタック(フロントエンド、バックエンド、データベース、デプロイ)を生成します。それはまずジェネレーターであり、次にコラボレーターです。
Windsurf(Codeium社)は、VS Codeのカスタムフォーク上に構築された「AI駆動IDE」です。それはまずコパイロットです——エディタ内に存在し、コードベース全体(現在のファイルだけでなく)を理解し、複数ファイルにわたってリファクタリング、デバッグ、提案を行うプロアクティブなエージェントとして機能します。
主な違い: Lovable-Devはグリーンフィールドプロジェクト(ゼロからの構築)向けです。Windsurfはブラウンフィールド開発——既存のコードベース、複雑なリファクタリング、複数ファイルにわたる推論——向けです。
比較表:価格、機能、パフォーマンス
| 機能/指標 | Lovable-Dev | Windsurf |
|---|---|---|
| 価格(個人) | $20/月(スターター)、$50/月(プロ)、$100/月(チーム) | $15/月(プロ)、$30/月(アルティメット)、無料枠(制限あり) |
| 価格(チーム/エンタープライズ) | カスタム(通常$200+/シート/月) | $60/シート/月(チーム)、エンタープライズはカスタム |
| 無料枠 | 1日5回生成、1プロジェクト | 月500回補完、1日2回Flow |
| コンテキストウィンドウ | ~8Kトークン(プロジェクトレベル、ただし制限あり) | ~128Kトークン(ワークスペース全体をインデックス) |
| コード補完 | 基本(1行、複数行不可) | 複数行、関数全体、Tabで受け入れ可能 |
| エージェントモード | 「エージェント」がプロンプトからアプリ全体を生成 | 「Flow」エージェント(自律型マルチステップ)+「Cascade」(チャット+ファイル編集) |
| 複数ファイルリファクタリング | 手動(ファイル間でコピーペースト) | 自動(エージェントが1つのコマンドで10+ファイルを編集可能) |
| ウェブ検索 | なし | あり(Codeium Search経由、ドキュメント/APIを取得可能) |
| デバッグ | 出力の基本的なエラーログ | 統合デバッガ+AI提案ブレークポイント |
| 言語サポート | JavaScript/TypeScript、Python、HTML/CSS(限定的) | 20以上の言語(JS、TS、Python、Go、Rust、Java、C++など) |
| デプロイ | 内蔵(Vercel類似) | 内蔵なし(CI/CDは自分で管理) |
| Git統合 | なし(エクスポートのみ) | 完全(コミットメッセージ、差分レビュー、PR要約) |
| パフォーマンス(レイテンシ) | 生成あたり3-8秒(アプリ全体) | 補完あたり0.5-2秒、複雑なエージェントタスクで5-15秒 |
| 精度(私のテスト) | 初回60-70%(しばしば3-4回の再生成が必要) | 初回85-90%(特にリファクタリングで) |
| 最適な用途 | ゼロからのプロトタイプアプリ構築 | 日常的なコーディング、リファクタリング、デバッグ |
機能詳細:それぞれの長所と短所
1. コード生成:Lovable-Devの速度 vs. Windsurfの精度
Lovable-Dev は5分のデモでは印象的です。「Reactフロントエンド、Nodeバックエンド、PostgreSQLデータベースでTodoアプリを作成して」と入力しました。12のファイル、Dockerfile、docker-compose.ymlを生成しました。動作しました——かろうじて。UIは醜く(CSSフレームワークなし)、バックエンドにはエラーハンドリングがなく、データベーススキーマには外部キーが欠けていました。しかし動きました。それがトレードオフです:品質よりも速度です。
Windsurf は単一のプロンプトからアプリ全体を生成しません。分解する必要があります:「Todoリスト用のReactコンポーネントを作成」→次に「Node.js APIエンドポイントを追加」→次に「PostgreSQLに接続」。しかし各パーツは本番品質です。例えば、Windsurfに「Todoリストにページネーションを追加」と依頼したところ、TanStack QueryのuseInfiniteQueryを提案し、バックエンドにpageパラメータを追加し、データベースクエリをOFFSETとLIMITで更新しました——すべて1回のFlowセッションで。Lovable-Devならアプリ全体を再生成し、以前の変更を失っていたでしょう。
実際の欠点(Lovable-Dev): 「既存コードの編集」という概念がありません。「ボタンの色を青に変更」と依頼すると、App.tsxファイル全体を再生成し、カスタマイズを上書きする可能性があります。再生成前にコミットしなかったため、2時間の作業を失いました。WindsurfのCascadeモードは特定の行のみを編集し、残りはそのままにします。