Core Technology

从经典视觉到大模型 · 全栈视觉感知能力

凌柒科技自研多路融合算法栈,把工业 AOI 从「规则匹配」推向「认知理解」。我们不强求一套打天下 — 按缺陷复杂度匹配最适合的工具,客户只为真正需要的复杂度付费。

// Neural Network in Action

神经网络如何识别瑕疵

从输入像素到分类输出 — 一次完整的前向推理,只用 ~52 ms。

DEEP CNN Conv · ReLU · MaxPool ×2 · Softmax · 10 hidden layers 6.3 MB · ~52 ms / image
input
(64, 64, 3)
conv_1_1
(62, 62, 10)
relu_1_1
(62, 62, 10)
conv_1_2
(60, 60, 10)
relu_1_2
(60, 60, 10)
max_pool_1
(30, 30, 10)
conv_2_1
(28, 28, 10)
relu_2_1
(28, 28, 10)
conv_2_2
(26, 26, 10)
relu_2_2
(26, 26, 10)
max_pool_2
(13, 13, 10)
output
(6)
  • missing_hole
  • mouse_bite
  • open_circuit
  • short
  • spur
  • spurious_copper
activation −1.56 0 +1.56
// Solution Matrix

三层级方案矩阵

L1 轻量 → L2 标准 → L3 大模型增强 — 同一团队提供从规则到大模型的全栈视觉方案。

L1
轻量方案
¥ · ~1 周
应用场景

装配缺失 / 尺寸超差 / 明显凹陷 / 标贴错位

技术栈

经典视觉算法 · 模板匹配 · 形态学处理

典型案例

汽车螺栓装配 · 家电外壳定位 · 包装合格性

L3
大模型增强
¥¥¥ · 2-3 周
应用场景

零样本检测 / 开放式描述 / 报告生成 / 异常解释

技术栈

视觉大模型 · 领域微调 · 知识增强检索

典型案例

医疗耗材冷启动 · 首件检测+工艺生成 · 新品类

// Universal Pipeline

通用底层架构 · 三阶段流水线

不变项 — 同一架构换数据集 + 微调模型即可服务多行业,新行业落地周期 4-6 周。

01

图像定位

自适应分割 → 形态学处理 → 透视校正 → 朝向自动判定。处理 8K×13K 大分辨率工业图像,~0.5s/张。

02

目标切割

深度检测分割模型,关键部件 bbox 输出。mAP50 = 99.2%,单图 ~52ms (CPU)。

03

缺陷判定

深度分类 + 基准对比 + 经典异常检测 + 频域分析 — 四路并行,任一触发即标 NG。

// Differentiation

技术壁垒 · 我们的差异化优势

多路融合算法

深度学习 + 基准对比 + 经典视觉 + 频域分析,四路并行,任一触发即标 NG。召回率 +18%,显著降低漏检。

浏览器端推理

自研浏览器推理引擎 · 零服务端部署,数据不出厂、不上云。同时支持 GPU 服务器和边缘盒子。

工业图像专精

8192×13000 大分辨率 TIF 端到端处理 3 秒级,这是非主流 VLM 难以做到的。

基准对比体系

部件 ID 识别 → 自动匹配基准模板 → 像素级差异检测,微小瑕疵召回率显著提升。

// Production Numbers

生产环境指标

97.5%
Top-1 缺陷分类准确率
99.2%
YOLO mAP50 目标检测
~3s
单张大图端到端 (CPU)
8K×13K
原生超大图处理
11
常见缺陷类别覆盖
7×24h
不间断运行 SLA

想看实际效果?

浏览我们落地的视觉 AI 案例,或者直接发起一次技术咨询。