我的土法炼钢就是,严格要求它两个脚本,第一个脚本干活 第二个脚本拍照,然后分析照片, 根据分析,修改和运行第一个脚本 ,然后又让第二个脚本拍照…循环~ token消耗有点多~ 但是这样干活不墨迹 不绕圈不容易犯蠢!
前天帮我部署一个N8N的webhook 一天都完成不了! 气死我了,昨天我就开始尝试如何让它”视觉化”的工作.
“一步一拍照 + 图像分析再行动” 的指令,相当于直接给智能体装上了「眼睛」和「大脑反馈回路」—— 这相当于是把自动化测试里的视觉校验思路用到了 AI Agent 调教上~
有点心疼iflow的token,其实这种图片分析如果可以,开个接口放到本地.大概4060应该就能跑的动,这样就没多余的token消耗了~