過去3週間、DevinとWindsurf(CodeiumのAIコーディングエージェント)の両方を徹底的に使い込みました。ドキュメントを読んだりデモを見たりするだけでなく、各ツールでフルスタックのEコマースダッシュボードを構築し、レガシーなPythonスクリプトをデバッグし、CI/CDパイプラインの自動化を試みました。実際に何が起こったかを説明します。
クイック判定(急いでいる方へ)
| 機能 | Devin | Windsurf (Codeium) |
|---|---|---|
| コアコンセプト | 自律型ソフトウェアエンジニアエージェント | AIコーディングアシスタント+エージェントモード |
| セットアップ時間 | 10〜15分(アカウント、プロジェクトインポート) | 2分(VS Code拡張機能) |
| IDE統合 | WebベースIDEのみ | VS Code、JetBrains、ターミナル |
| 自律性のレベル | 完全:計画、記述、テスト、デプロイ | 部分的:コードを書くが、あなたがガイドする |
| コンテキスト認識 | リポジトリ全体+ブラウザ+ターミナル | 現在のファイル+開いているタブ+プロジェクト |
| デバッグ | コードを実行、エラーを読み、反復的に修正 | 修正を提案、あなたが実行してテスト |
| デプロイ | クラウドにデプロイ可能(制限あり) | ネイティブデプロイなし |
| 価格 | 月額500ドル(早期アクセス) | 無料枠、Pro月額15ドル、Teamsユーザーあたり35ドル |
| 学習曲線 | 中程度(エージェントを信頼する必要がある) | 低い(強化されたオートコンプリートのような感覚) |
| 最適な用途 | 複雑なマルチステップタスク、手取り足取りが必要なジュニア開発者 | 日常的なコーディング、リファクタリング、迅速なプロトタイプ |
Devin:すべてをやろうとする自律型エンジニア
Devinの早期アクセスにサインアップしました。最初の印象:プラグインではありません。完全なWebベースのIDEです。Devinに「PostgreSQLデータベースからの売上データを示すチャート付きのReactダッシュボードを作成して」のようなプロンプトを与えると、Devinは…作業を開始します。
テストで起こったこと:
「3つのEコマースサイトから製品価格をスクレイピングし、MongoDBに保存し、エラーハンドリングとリトライ機構を備えたNode.js APIエンドポイントを作成して」と依頼しました。
Devinはターミナルを開き、cheerioとaxiosをインストールし、スクレイパーを作成し、MongoDBスキーマを作成し、指数バックオフ付きのリトライループを追加し、テストファイルも作成しました。テストを実行し、環境変数がないために1つ失敗したのを見て、.env.exampleファイルを追加し、テストを再実行しました。すべてキーボードに触れることなく。
不気味だった部分?ブラウザを開き、実際のEコマースサイトに移動してスクレイピングロジックが機能するか確認しました。User-Agentヘッダーを追加して403エラーをデバッグするのを見ました。
Devinが苦手だったこと:
- 実行時間が長い。 そのスクレイパータスクには23分かかりました。Devinはすべてのステップを考えます。インスタントなオートコンプリートに慣れていると、これはペンキが乾くのを見ているような感じです。
- 過剰エンジニアリング。 単純なスクリプトに対して、Devinは
src/、tests/、config/、Dockerfileを含む完全なプロジェクト構造を作成しました。私は単一ファイルが欲しかっただけです。 - ループに陥る。 一度、同じ関数を3回書き換えてTypeScriptの型エラーを修正しようとし続けました。私が介入しなければなりませんでした……
