
Sign up to save your podcasts
Or


OpenAIが発表したGDPval研究について解説。実際のビジネスタスクでAIがプロフェッショナルとどこまで競えるかを測定した画期的な評価システム。Claude Opus 4.1が47.6%の勝率を記録し、AIが人間の専門家に近づいている現実と、それが働き方に与える影響について考察します。
By ryosanOpenAIが発表したGDPval研究について解説。実際のビジネスタスクでAIがプロフェッショナルとどこまで競えるかを測定した画期的な評価システム。Claude Opus 4.1が47.6%の勝率を記録し、AIが人間の専門家に近づいている現実と、それが働き方に与える影響について考察します。