围绕 Harness Engineering 的落地方式,讲清楚如何把评测任务、评测集、评测报告抽象成 AI Agent 可操作的平台能力,让智能体自动生成用例、执行无 UI 与 UI 评测,并基于报告进行多轮系统优化。