一个自主多代理系统,实现完整招聘周期——从需求分析到最终候选人评估——无需人工干预。
四大科学基础
平台建立在四个关键科学技术组件之上,使自主证据型招聘成为可能。
CALM 语义评分
上下文感知潜在匹配——按技能和经验的含义找到候选人,而非关键词重叠。
A2A / MCP 架构
去中心化多代理架构,专业代理自主协作:分析师、选拔者、面试官、评估者。
GRPO 策略优化
Group Relative Policy Optimization(arXiv:2402.03300)训练面试代理发展多步对话策略,而非仅记录回答。
ICONIC I-Stack v2.0
六向量证据评估模型,用真实职业活动的已验证工件替代简历自我报告。
GRPO:自学习面试代理
现有 HR 系统具有静态逻辑,无法适应不断变化的市场需求。Iconicompany 引入 GRPO(Group Relative Policy Optimization)——来自 arXiv:2402.03300 的突破——用于训练自主多步面试策略。
对话策略优化
与仅记录和格式化静态回答的系统不同,GRPO 从语音记录转变为多步对话轨迹的优化。代理生成不同面试场景组,比较其效果,并选择最准确验证候选人技能的问题链。
基于结果的学习
GRPO 教导代理不断进化:它发现检测候选人"幻觉"或实时 AI 辅助作弊的独特方法。系统从真实结果中学习——候选人是否通过了试用期——而非昂贵的人工标注。
计算成本降低 30–40%
应用 arXiv:2402.03300 中的数学方法消除了对经典奖励模型的需求,这对于降低计算复杂性和消除昂贵的人工标注步骤至关重要。与国外同类产品相比,微调计算成本降低 30–40%。
无需奖励模型
GRPO 回路优化代理对话策略,无需构建经典奖励模型——这对于降低生产部署中的计算复杂性至关重要。
Citation: DeepSeekMath:推动开放语言模型数学推理的极限。arXiv:2402.03300
ICONIC I-Stack v2.0
传统招聘依赖简历自我呈现——一种不适合自动验证的非结构化文本文档。超过 70% 的简历包含夸大或不准确的技能声明(Mercor、HeroHunt)。Iconicompany 实施证据型招聘:原则性地拒绝将简历文本作为候选人信息的主要来源。取而代之的是,从真实职业活动工件中形成统一的数字身份。
架构冲动
通过 C4 图表分析(Draw.io/Mermaid)评估系统思维。模型(Kimi 2.5)验证组件连接性、数据库选择和集成模式。提供架构能力验证。
逻辑与构建
专家评估候选人批判性审查 AI 代理(DSPy)生成的具有故意架构和逻辑缺陷的 Pull Request 的能力。"Expert-as-a-Judge"模型(Kimi k2)不仅评估缺陷检测,还评估 PR 评论中论证的深度——这是在处理可能产生幻觉的 LLM 输出时认知警觉的精确信号。
来源完整性
验证候选人的真实思维:在现场会话中记录和语义分析推理链。系统评估解决问题的认知轨迹——带有错误最终结果的正确逻辑被评为正面信号。创建一个受控环境,实时验证真正的工程思维。
能量评分
与公司技术栈的语义对齐:在潜在空间中找到候选人技术栈与公司技术债务/任务之间的语义连接——而非简单的技能列表交集。提供真正的上下文契合度测量。
技术智能
实时分析术语密度和答案深度(语音/文本流)。专业词汇的密度和上下文准确性作为实际能力水平的代理指标——无法用 AI 辅助伪造。
能力与成长
成长潜力和领导力:基于对话中的行为模式评估代码审查技能、导师能力和架构思维。识别高级就绪度和发展轨迹。
所有六个向量汇总为校准的合规指数™(0–100),Brier Score ≤ 0.15。这些组件共同形成一个封闭优化循环,每次完成的录用成为系统的训练信号。
自主代理流水线
四个专业代理按顺序工作,在 48 小时内交付经过验证的团队配置——每个阶段都有人类参与控制。
分析代理
在 0–10 分钟内将项目简报分解为工程角色、潜在技能向量和结构化需求图。
需求以自由文本简报的形式到达。手动分解为角色和能力需要数天时间,并引入偏见。
代理应用 CALM 语义评分解析简报,识别隐含的技能要求,并为每个职位生成带有潜在向量档案的结构化角色图。
核心优势
- 0–10 分钟内完成分解,而非手动需要的数天
- 潜在技能向量——而非仅仅是关键词列表
- 在寻源开始前进行人类审查
选拔代理
使用能量评分(I-Nexus)预筛选扫描 100 万+ 档案,在 10–60 分钟内自动找出最高相关性候选人。
跨多个平台手动扫描市场速度慢、不完整,并且偏向可见(而非最合适)的候选人。
选拔代理扫描聚合数据库,应用能量评分潜在空间匹配,并根据分析代理生成的角色向量对候选人进行预评分。
核心优势
- 在 60 分钟内扫描 100 万+ 档案
- 能量评分语义匹配——而非关键词筛选
- 只有高相关性候选人进入面试阶段
面试代理
使用 GRPO 优化的对话策略进行自主技术面试,在 1–24 小时内应用 I-Origin 和 I-Code 验证。
人类面试官不一致、昂贵,可能被 AI 辅助答案欺骗。在规模上,人工面试成为瓶颈。
GRPO 训练的面试代理进行多步技术会话,记录推理链(I-Origin),审计 PR 工件(I-Code),并验证术语密度(I-Interview)——实时检测 AI 辅助。
核心优势
- GRPO 优化对话——随每次录用进化
- 实时检测 AI 辅助(I-Origin)
- 高级验证者仅在通过 MatrixRTC 对复杂能力进行最终验证时参与
合规指数™ 代理
将所有六个 I-Stack 向量汇总为校准的合规指数™(0–100,Brier Score ≤ 0.15)并生成最终团队配置报告。
最终招聘决策基于不完整的主观数据。利益相关者缺乏单一权威文件来客观比较候选人。
合规代理将 I-Impulse、I-Code、I-Origin、I-Nexus、I-Interview 和 I-Climb 评分汇总为校准指数,根据 Brier Score 阈值进行验证,并生成团队仓库配置报告。
核心优势
- 校准的 0–100 指数,Brier Score ≤ 0.15
- 在 24–48 小时内交付完整的团队仓库报告
- 每次完成的录用反馈回 GRPO 训练循环
产品路线图
第一阶段:基础
- 分析代理:简报分解和潜在角色向量映射。
- 选拔代理:100 万+ 档案的能量评分预筛选。
- 面试代理(GRPO v1):I-Origin 和 I-Code 自主会话。
- 合规指数™:六向量汇总和团队仓库报告。
第二阶段:校准
- GRPO 反馈循环:试用期结果 → 策略再训练。
- I-Climb 向量:规模化领导力和成长评估。
- MatrixRTC 专家脉冲:复杂角色的高级验证者集成。
- 基于真实录用结果的合规指数™ Brier Score 校准。
第三阶段:企业规模化
- 完整供应商替换模式:端到端替换外部 IT 集成商。
- CALM v2:跨公司潜在技能图,用于全市场基准测试。
- 预测性 I-Climb 分析:在未来技术领导者自我认知之前识别他们。
- 多客户 GRPO 联邦:跨企业共享策略优化。
