AI很强大,AI落地很急迫,这是很多企业和企业管理者越来越感受到的问题。前阵子听一个演讲说,某个企业如果目前还没有开启企业级的AI战略,企业的管理层是不合格的。在IT运维领域,虽然AI冲击波给大家的冲击不小,不过AI战略大多数也只是在某些人的脑子里,并未形成实质性的化学反应。这波龙虾潮的到来,一下子让很多企业的IT管理者不安起来,好像能够颠覆很多传统领域的势力已然出现,自己再不搞点AI要被时代抛弃了似的。
实际上别光顾着焦虑,龙虾只是一个机器人,先解决让机器人按照规矩帮你干活的问题才是关键。你必须规范机器人的行为,不瞎搞,按规矩,按业务逻辑来干活,只有达到了 这个目标,龙虾才是你的生产力,否则只能是个玩具或者一个隐患。现在的AI世界中,拥有高水平的大模型本身不是问题,问题是如何让模型在复杂业务环境中“可控地工作”,要解决这个问题,我们要理解一些事实。
LLM 是“能力”,不是“系统”,因此一切期望拥有一个模型就解决了当前问题的想法都是不现实的。模型能生成内容,但不能保证稳定性、可重复性、可审计性、可控性,也无法准确地调用工具去完成工作。
前阵子openAI提出一个观点,真正的 AI 系统 = LLM + Harness。Harness这个词的直译十分贴切,LLM就像一匹脱缰野马,如果没有马具束缚,它可能会失去控制。在AI应用中,Harness 负责输入控制、上下文管理、工具调用、任务规划、错误恢复、安全与审计和状态管理。Harness是解决“如何可靠地运行和管理复杂AI智能体”的基础设施。而之前,我们总是更加关注另外一个概念AI Scaffolding-AI脚手架,也就是解决“如何快速构建和迭代这些智能体”的开发框架。
Harness 是 AI 工程的核心,而不是 Prompt,Prompt 只是“指令”,有了Harness 才能成为“系统”。在AIOPS这种应用场景中,一些Harness能力是必须具备的。
首先是 Context Lifecycle Management(上下文生命周期管理),在多智能体协同完成某个复杂任务场景中,上下文是协调行为和流程的关键。只有解决了如何在多轮任务中保持一致性问题,才能整整构建出自动化系统。
其次是Execution Engine(执行引擎),一套真正能干活的AI系统不仅仅用于辅助人的思考,而是要真正帮人干活。龙虾机器人是一个十分优秀的执行引擎,能够调用模型、调用工具、调用外部 API、控制执行顺序、处理失败并自动进行重试,这是 Agent 的“心脏”。
第三是 Validation & Guardrails(验证与护栏),实现输出验证、类型检查、工具调用参数校验、安全过滤、合规检查,这是一个小型智能体成长为企业级 AI时必须具备的能力。
第四是 Persistence & State(持久化与状态),负责保存任务状态、保存 Agent 的记忆、保存执行日志、支持任务恢复,这是让 AI 能“持续工作”的关键。
第五是Observability(可观测性),AI应用不能成为黑匣子,必须能够通过日志、指标、trace等方式去进行监控,从而确保性能,控制成本。知识企业级AI治理的基础。虽然目前AI应用还处于浅水区,AI治理尚不急迫,但是随着AI应用日趋复杂,这些基础能力的缺失会埋下巨大的隐患。
第六是 Orchestration(编排),这是多Agent协作、工作流编排的核心,是让 AI 具备处理复杂任务的能力。
通过上面的描述,你可以把Harness理解为“AI 的控制台 + 调度器 + 安全带”。Harness让 AI 不再是“不可控的黑箱”,而是可管理、可调度、可治理的生产力组件。更直白地说,AI harness 就是驾驭 AI 的控制系统,让 AI 从“强但不可控”变成“可控、可调度、可治理”。这样的AI才是企业真正需要的AI。
AI很强大,AI落地很急迫,这是很多企业和企业管理者越来越感受到的问题。前阵子听一个演讲说,某个企业如果目前还没有开启企业级的AI战略,企业的管理层是不合格的。在IT运维领域,虽然AI冲击波给大家的冲击不小,不过AI战略大多数也只是在某些人的脑子里,并未形成实质性的化学反应。这波龙虾潮的到来,一下子让很多企业的IT管理者不安起来,好像能够颠覆很多传统领域的势力已然出现,自己再不搞点AI要被时代抛弃了似的。