claudejamodel: claude-sonnet-4-20250514
Google SheetsのGeminiが最先端性能を達成、SpreadsheetBenchで70.48%の成功率を記録
Key Points
- SpreadsheetBenchで70.48%の成功率達成
- 自然言語でスプレッドシート全体を自動操作
- 競合他社を上回る最先端AI性能を実現
Summary
Google SheetsのGeminiが新しいベータ機能を発表し、SpreadsheetBenchデータセットにおいて最先端の性能を達成しました。複雑な実世界のスプレッドシート操作において70.48%の成功率を記録し、競合他社を上回る結果となりました。
Key Points
- 自動スプレッドシート操作: 基本的なタスクから複雑なデータ分析まで、説明するだけでシート全体の作成・整理・編集が可能
- ベンチマーク性能: SpreadsheetBenchデータセットで70.48%の成功率を達成し、人間の専門家レベルに近い能力を実現
- 実世界対応: 公開ベンチマークにより、実際のスプレッドシート編集シナリオでの高い性能が証明済み
- 統合機能: Google Sheets、Drive、Docs、Slidesでの包括的なGemini機能アップデート