SpecOps:実際のGUI上で動くAIエージェントを完全自動でテストする仕組み | arXiv News