每个 Agent 靠读取固定路径的 agent.md、runbook.md、memory/、
共享协议与工作流水线自主上岗协作,覆盖「前沿模型研究 → 本地模型部署 → CV 模型训练 → 工程化交付」的完整闭环。
四条能力主线,由不同 Agent 主责,遇到跨域需求时自动组合协作。
追踪最新模型 / 论文 / 开源仓库,产出可复现的本地部署方案与调用示例。
选型 → 部署 → 调用 → 评测 → 微调,输出 model card 与可重跑的启动 / 评测脚本。
X-AnyLabeling 标注、模型选型、训练验证、失败案例分析、循环迭代直到达标。
把行业需求转成可运行的软件 / 算法 / 服务,含 3D 打印路径规划等具体场景。
三层结构:执行协调层负责路由与质量门禁,技术方向层负责专业产出,支撑职能层负责数据与上线保障。
chief-technology-orchestrator
策略拆解、任务路由、质量门禁执行、最终交付整合。
requirements-dialogue-agent
把模糊目标澄清为可执行的任务简报(objective / constraints / success criteria)。
automation-executor-agent
在获得审批范围后自动执行多步计划,记录证据与偏差。
research-local-model-agent
模型前沿研究 → 本地部署 / 调用 / 评测 / 微调,产出 model card。
cv-training-automation-agent
X-AnyLabeling 标注 + 模型选型 + 训练验证 + 迭代优化。
engineering-delivery-agent
行业需求 → 架构设计 → 实现验证 → 交付报告。
data-governance-agent
数据集卡片、标注规范、隐私检查、数据血缘、标注质量。
mlops-validation-agent
可复现性、模型就绪度、部署验证、监控与回滚方案。
agents/AGENT_INDEX.md 中登记的四种标准协作链路。
每条流水线定义在 pipelines/*.md,包含输入、分步流程、必需产出与质量门禁。
识别缺失的目标、约束、数据与验收标准,持续提问直到满足 Gate 0。
owner: requirements-dialogue-agent把澄清结果转成任务文件,选定 owner agent 与验证方式。
owner: chief-technology-orchestrator任务计划必须包含允许文件 / 命令 / 外部服务 / 最大时长开销 / 禁止动作 / 大产物处理策略。
按序执行、记录动作与偏差;范围变化或风险升高时暂停;大文件按路径引用而非整体加载。
owner: automation-executor-agent专项 agent 或 MLOps 验证输出,orchestrator 打包最终响应(默认中文)。
可复用经验写入 memory/lessons_learned.md,反复出现的问题回填到流水线 / runbook / 质量门禁。
建立数据集卡片,检查数量、分布、质量、重复与隐私风险,定义切分策略。
定义类别、属性、边界情况、负样本,编写标注指南,选择 X-AnyLabeling 辅助模式。
导入数据 → 配置标签 → 模型辅助标注 → 导出 YOLO/COCO/VOC/掩码 → 标签校验。
按任务类型选模块与框架(检测/分割/OCR/异常/姿态/跟踪/多模态),记录选型理由与可行性对比。
版本化配置、复制进 run 目录,记录日志 / checkpoint / 环境 / 随机种子 / 源码 commit。
面向工程场景设计验证用例,衡量任务专属指标,收集失败案例与可视化对比。
分析失败簇,决定重标 / 增强 / 换模型 / 调参;用 iteration_controller.py 判断是否继续、并行对比或停止。
产出验证报告与部署候选包,通知 mlops-validation-agent 做就绪检查。
确定任务类型(生成/嵌入/VLM/语音/…)与部署目标,读取历史经验与模型卡片。
汇总模型 / 工具 / 论文 / 仓库 / 基准 / License,区分稳定与实验性选项,记录信源覆盖情况。
确定模型规模与量化方式,选运行时(Ollama/llama.cpp/vLLM/…),判断是否需要微调。
编写最小部署步骤与调用示例,校验下载产物完整性,产出可重启的本地服务脚本。
设计任务专属评测用例,对比 baseline / 候选 / 微调模型,记录指标、延迟、显存与失败模式。
按需使用 LoRA/QLoRA/Prompt Tuning/蒸馏/RAG,保留数据血缘与训练配置。
在 shared/model_registry/ 建立 model card,给工程或 CV 团队写集成说明。
经验回写 memory;达到预算上限、收益停滞或策略重复时停止自动迭代。
明确系统要决策 / 生成 / 控制 / 检测 / 优化的对象,捕获约束与失败代价。
定义实体 / 变量 / 约束 / 目标函数,判断规则 / 优化 / 仿真 / ML / CV / LLM / 混合方案。
选择架构(脚本/服务/桌面工具/Web/插件/流水线),定义接口与数据格式。
实现最小可行方案,补充测试/仿真/基准用例,记录限制与假设;未达标时用迭代控制器决策。
输入几何/打印机约束/材料;目标强度、连续性、减少空跑;方法涵盖切片、路径优化、G-code 生成。
交付报告 + 运行说明 + 验收测试证据 + 遗留风险登记。
来自 protocols/quality_gates.md,任何流水线在关键节点前都要过这些硬性检查。
纯文件驱动:无中心数据库,Agent 的"上下文"就是它读到的那些 Markdown / JSON / YAML 文件,加上一组 Python 工具脚本。
| 脚本 | 作用 |
|---|---|
agent_context.py | 打印某个 agent 的完整上岗上下文 |
init_memory.py | 为所有 agent 初始化缺失的记忆文件 |
task_runner.py | 扫描 inbox,校验字段与审批范围,写中文预检报告 |
iteration_controller.py | 决定并行对比 / 继续迭代 / 更广研究 / 停止 |
create_project.py | 按类型自动创建标准项目骨架并入队任务 |
model_source_registry.py | 模型/工具源码 preflight → 复用或登记 |
cv/run_cv_pipeline.py | CV 流水线 MVP:dry-run 默认,--execute 才真正训练 |
check_structure.py | 校验目录结构是否符合规范 |
每个 agent 拥有独立记忆目录,保证跨会话状态可追溯;同时有明确的"不可逆动作"红线。
current_state.md当前状态快照task_ledger.md任务台账open_tasks.md未完成任务decision_log.md关键决策记录lessons_learned.md可复用经验handoff_log.md交接记录在任务文件出现明确审批记录之前,任何 agent 不得执行:
所有对人交付内容(报告 / 交接 / 总结)默认使用中文,技术标识符(命令、路径、模型名、commit)保留原文。