私は机の前に座っている。時刻は午後10時47分。半分しか終わっていない四半期報告書と、緊急でありながら意味不明なSlackスレッドを睨んでいる。同僚が12ページの生の販売データPDFを共有ドライブに放り込み、上司は明日の朝までに1ページのエグゼクティブサマリーを要求している。そのPDFを、乱雑な顧客フィードバックのExcelエクスポートとクロスリファレンスし、パニックになっていないように見えるVP宛のメールを下書きする必要がある。2つのブラウザタブを開く:1つはClaude(ウェブアプリ経由)、もう1つはMicrosoft Copilot(Office 365スイートに組み込み)。次の3時間、両方を徹底的に試す——ベンチテストとしてではなく、実際の、手に汗握る仕事セッションとして。以下が私の見つけたものだ。
セットアップ:実際に行ったこと
私は中堅物流会社の中間管理職オペレーションマネージャーだ。今回のセッションでのタスク:
- 45ページの契約PDF(法律用語が多く、手書きの余白メモが画像としてスキャンされている)を要約する。
- その要約から5スライドのデッキを生成し、別のスプレッドシートから特定のデータポイントを抽出する。
- 支払いが3週間遅れているクライアントに、契約の特定の条項を引用して、丁寧だが断固としたメールを下書きする。
- 重量階級に基づいて配送コストを計算する壊れたExcel数式をデバッグする。
- 上司からの曖昧な質問に答える:「Q3のパフォーマンスはQ2と比較してどうか、ただし西海岸地域のみ」
私はウェブインターフェース経由でClaude(Sonnetモデル、有料版)を使用し、Word、Excel、Outlookに統合されたMicrosoft Copilot(M365 Copilot、エンタープライズライセンス)を使用した。両方とも私の仕事用ノートパソコン(Windows 11、16GB RAM、Office 2024)で動作している。
比較表:クイックナンバー
| 機能 | Claude (Sonnet, 有料版) | Microsoft Copilot (M365) |
|---|---|---|
| 価格 | $20/月 (Pro) または $25/月 (Team) | $30/ユーザー/月 (M365 Copilotアドオン、Business PremiumまたはE3/E5が必要) |
| コンテキストウィンドウ | 200,000トークン(約150ページのPDFを処理可能) | ~8,000トークン(実質的に約20ページのドキュメントに制限) |
| ファイルアップロード | PDF、DOCX、TXT、CSV、画像(OCR)、最大10ファイル | Officeファイル、PDF、画像(OCR)、プロンプトごとに1-2ファイルに制限 |
| 統合 | ウェブアプリ、API、モバイルアプリ | Word、Excel、Outlook、Teams、PowerPointに組み込み |
| データの正確性 | 構造化データに強い、テーブルで時々幻覚を見る | 生データ抽出に弱いが、Officeネイティブ形式では良好 |
| Excel/数式ヘルプ | ロジックを段階的に説明するが、アプリ内で実行できない | Excelセルに直接数式を書き、デバッグし、挿入できる |
| メール下書き | 一般的だが洗練されたトーン、手動でのコンテキストが必要 | Outlook受信トレイを読み、スレッド履歴に基づいて返信を提案する |
| マルチモーダル(画像) | 画像からテキストを読み取り(OCR)、ビジュアルを説明できる | 画像からテキストを読み取れるが、複雑な図には苦戦する |
| 速度 | 速い(短い回答2-5秒、長いドキュメント10-20秒) | 遅い(5-15秒、特にM365データと統合する場合) |
| 制限 | Office統合なし、アプリ内でファイルを変更できない | コンテキストウィンドウが小さい、マルチファイルタスクに失敗する、高価 |
深掘り:各ツールの得意分野(そして弱点)
Claude:ディープリーダー
45ページの契約PDFをアップロードした。Claudeの200Kトークンコンテキストウィンドウがキラーフィーチャーだ。ドキュメント全体を読み取った——手書きの余白メモも含めて(驚くべき精度でOCRしたが、あるメモで「net 60」を「net 50」と誤読した、私はそれに気づいた)。私は尋ねた:「終了条項を要約し、早期退出のペナルティを強調してください。」Claudeは正確なページ番号、セクション見出しを抽出し、逐語的に引用した:「セクション12.3(b):12ヶ月以内の早期終了には、残存契約価値の15%の手数料が発生します。」さらに、後の修正(38ページ)とクロスリファレンスし、6ヶ月連続で期限内に支払ったクライアントには10%に軽減されると示した。これは、私が20分かけてページをめくるようなクロスドキュメント推論だ。
しかし、Claudeの弱点は、契約書と一緒に顧客フィードバックのExcel CSVをアップロードしたときに現れた。私は尋ねた:「'配送遅延'に言及したすべての顧客をリストアップし、彼らの契約に不可抗力条項があるか確認してください。」ClaudeはCSVから顧客名を正しく抽出したが、その後幻覚を見た:3人の顧客が契約に不可抗力条項を持っていると主張したが、私がスポットチェックしたところ、実際には1人だけだった。モデルは実際のテキストではなく、業界パターンに基づいて推論しようとした。Claudeはアプリ内作業にも役立たない——配送コストシートの数式修正を手動でExcelにコピーする必要があった。正しい=IF(AND([@Weight]>50, [@Zone]="West"), [@Weight]*1.2, [@Weight]*0.8)をくれたが、自分で貼り付ける必要があった。
本当の欠点:Claudeは、構造化データ(CSV)と非構造化テキスト(PDF)を単一のプロンプトで混在させると苦戦する。アップロードされたファイルに厳密に従うのではなく、トレーニングデータから「空白を埋める」傾向がある。また、もし私が...