自主 AI 集成商：I-Stack 技术

一个自主多代理系统，实现完整招聘周期——从需求分析到最终候选人评估——无需人工干预。

四大科学基础

平台建立在四个关键科学技术组件之上，使自主证据型招聘成为可能。

CALM 语义评分

上下文感知潜在匹配——按技能和经验的含义找到候选人，而非关键词重叠。

A2A / MCP 架构

去中心化多代理架构，专业代理自主协作：分析师、选拔者、面试官、评估者。

GRPO 策略优化

Group Relative Policy Optimization（arXiv:2402.03300）训练面试代理发展多步对话策略，而非仅记录回答。

ICONIC I-Stack v2.0

六向量证据评估模型，用真实职业活动的已验证工件替代简历自我报告。

arXiv:2402.03300（DeepSeekMath）

GRPO：自学习面试代理

现有 HR 系统具有静态逻辑，无法适应不断变化的市场需求。Iconicompany 引入 GRPO（Group Relative Policy Optimization）——来自 arXiv:2402.03300 的突破——用于训练自主多步面试策略。

对话策略优化

与仅记录和格式化静态回答的系统不同，GRPO 从语音记录转变为多步对话轨迹的优化。代理生成不同面试场景组，比较其效果，并选择最准确验证候选人技能的问题链。

基于结果的学习

GRPO 教导代理不断进化：它发现检测候选人"幻觉"或实时 AI 辅助作弊的独特方法。系统从真实结果中学习——候选人是否通过了试用期——而非昂贵的人工标注。

计算成本降低 30–40%

应用 arXiv:2402.03300 中的数学方法消除了对经典奖励模型的需求，这对于降低计算复杂性和消除昂贵的人工标注步骤至关重要。与国外同类产品相比，微调计算成本降低 30–40%。

无需奖励模型

GRPO 回路优化代理对话策略，无需构建经典奖励模型——这对于降低生产部署中的计算复杂性至关重要。

Citation: DeepSeekMath：推动开放语言模型数学推理的极限。arXiv:2402.03300

六向量证据评估架构

ICONIC I-Stack v2.0

传统招聘依赖简历自我呈现——一种不适合自动验证的非结构化文本文档。超过 70% 的简历包含夸大或不准确的技能声明（Mercor、HeroHunt）。Iconicompany 实施证据型招聘：原则性地拒绝将简历文本作为候选人信息的主要来源。取而代之的是，从真实职业活动工件中形成统一的数字身份。

I-Impulse

架构冲动

通过 C4 图表分析（Draw.io/Mermaid）评估系统思维。模型（Kimi 2.5）验证组件连接性、数据库选择和集成模式。提供架构能力验证。

I-Code

逻辑与构建

专家评估候选人批判性审查 AI 代理（DSPy）生成的具有故意架构和逻辑缺陷的 Pull Request 的能力。"Expert-as-a-Judge"模型（Kimi k2）不仅评估缺陷检测，还评估 PR 评论中论证的深度——这是在处理可能产生幻觉的 LLM 输出时认知警觉的精确信号。

I-Origin

来源完整性

验证候选人的真实思维：在现场会话中记录和语义分析推理链。系统评估解决问题的认知轨迹——带有错误最终结果的正确逻辑被评为正面信号。创建一个受控环境，实时验证真正的工程思维。

I-Nexus

能量评分

与公司技术栈的语义对齐：在潜在空间中找到候选人技术栈与公司技术债务/任务之间的语义连接——而非简单的技能列表交集。提供真正的上下文契合度测量。

I-Interview

技术智能

实时分析术语密度和答案深度（语音/文本流）。专业词汇的密度和上下文准确性作为实际能力水平的代理指标——无法用 AI 辅助伪造。

I-Climb

能力与成长

成长潜力和领导力：基于对话中的行为模式评估代码审查技能、导师能力和架构思维。识别高级就绪度和发展轨迹。

所有六个向量汇总为校准的合规指数™（0–100），Brier Score ≤ 0.15。这些组件共同形成一个封闭优化循环，每次完成的录用成为系统的训练信号。

自主代理流水线

四个专业代理按顺序工作，在 48 小时内交付经过验证的团队配置——每个阶段都有人类参与控制。

分析代理

在 0–10 分钟内将项目简报分解为工程角色、潜在技能向量和结构化需求图。

问题

需求以自由文本简报的形式到达。手动分解为角色和能力需要数天时间，并引入偏见。

解决方案

代理应用 CALM 语义评分解析简报，识别隐含的技能要求，并为每个职位生成带有潜在向量档案的结构化角色图。

核心优势

0–10 分钟内完成分解，而非手动需要的数天
潜在技能向量——而非仅仅是关键词列表
在寻源开始前进行人类审查

选拔代理

使用能量评分（I-Nexus）预筛选扫描 100 万+ 档案，在 10–60 分钟内自动找出最高相关性候选人。

问题

跨多个平台手动扫描市场速度慢、不完整，并且偏向可见（而非最合适）的候选人。

解决方案

选拔代理扫描聚合数据库，应用能量评分潜在空间匹配，并根据分析代理生成的角色向量对候选人进行预评分。

核心优势

在 60 分钟内扫描 100 万+ 档案
能量评分语义匹配——而非关键词筛选
只有高相关性候选人进入面试阶段

面试代理

使用 GRPO 优化的对话策略进行自主技术面试，在 1–24 小时内应用 I-Origin 和 I-Code 验证。

问题

人类面试官不一致、昂贵，可能被 AI 辅助答案欺骗。在规模上，人工面试成为瓶颈。

解决方案

GRPO 训练的面试代理进行多步技术会话，记录推理链（I-Origin），审计 PR 工件（I-Code），并验证术语密度（I-Interview）——实时检测 AI 辅助。

核心优势

GRPO 优化对话——随每次录用进化
实时检测 AI 辅助（I-Origin）
高级验证者仅在通过 MatrixRTC 对复杂能力进行最终验证时参与

合规指数™ 代理

将所有六个 I-Stack 向量汇总为校准的合规指数™（0–100，Brier Score ≤ 0.15）并生成最终团队配置报告。

问题

最终招聘决策基于不完整的主观数据。利益相关者缺乏单一权威文件来客观比较候选人。

解决方案

合规代理将 I-Impulse、I-Code、I-Origin、I-Nexus、I-Interview 和 I-Climb 评分汇总为校准指数，根据 Brier Score 阈值进行验证，并生成团队仓库配置报告。

核心优势

校准的 0–100 指数，Brier Score ≤ 0.15
在 24–48 小时内交付完整的团队仓库报告
每次完成的录用反馈回 GRPO 训练循环

产品路线图

自主 48 小时循环（现在 – 2026 年 Q2）

第一阶段：基础

分析代理：简报分解和潜在角色向量映射。
选拔代理：100 万+ 档案的能量评分预筛选。
面试代理（GRPO v1）：I-Origin 和 I-Code 自主会话。
合规指数™：六向量汇总和团队仓库报告。

GRPO 自学习循环（2026 年 Q3 – 2027 年 Q1）

第二阶段：校准

GRPO 反馈循环：试用期结果 → 策略再训练。
I-Climb 向量：规模化领导力和成长评估。
MatrixRTC 专家脉冲：复杂角色的高级验证者集成。
基于真实录用结果的合规指数™ Brier Score 校准。

供应商替换和完整生态系统（2027 年+）

第三阶段：企业规模化

完整供应商替换模式：端到端替换外部 IT 集成商。
CALM v2：跨公司潜在技能图，用于全市场基准测试。
预测性 I-Climb 分析：在未来技术领导者自我认知之前识别他们。
多客户 GRPO 联邦：跨企业共享策略优化。

准备好启动 48 小时循环了吗？

启动分析代理——描述您的项目并收到附带合规指数™ 报告的经过验证的团队配置。

自主多代理工程团队组建

四大科学基础

CALM 语义评分

A2A / MCP 架构

GRPO 策略优化

ICONIC I-Stack v2.0

GRPO：自学习面试代理

对话策略优化

基于结果的学习

计算成本降低 30–40%

无需奖励模型

ICONIC I-Stack v2.0

架构冲动

逻辑与构建

来源完整性

能量评分

技术智能

能力与成长

自主代理流水线

分析代理

核心优势

选拔代理

核心优势

面试代理

核心优势

合规指数™ 代理

核心优势

产品路线图

第一阶段：基础

第二阶段：校准

第三阶段：企业规模化

准备好启动 48 小时循环了吗？