“Canny”的版本间的差异
(未显示另一用户的1个中间版本) | |||
第5行: | 第5行: | ||
边缘的评估需要放在尺度空间进行,不同尺度空间边缘不同。 | 边缘的评估需要放在尺度空间进行,不同尺度空间边缘不同。 | ||
− | + | 像素的尺度空间特征为三维曲线特征(尺度,梯度强度,梯度方向)。 | |
分析和提取像素的关键尺度空间特征,是边缘检测,目标分类的重要工作。 | 分析和提取像素的关键尺度空间特征,是边缘检测,目标分类的重要工作。 | ||
第14行: | 第14行: | ||
也就是尺度轴需要按照图像的缩放进行校准,如此像素特征具备可比性。 | 也就是尺度轴需要按照图像的缩放进行校准,如此像素特征具备可比性。 | ||
与众不同的像素特征,可以作为匹配的瞄点。 | 与众不同的像素特征,可以作为匹配的瞄点。 | ||
+ | |||
+ | 如此,像素分类问题转变为三维曲线的分类问题。 | ||
+ | |||
+ | 和方向轴垂直的曲线为边缘(方向一致) | ||
+ | 可以在三维空间中进行像素的分类。 | ||
+ | 首先筛查出和方向轴垂直的曲线(边缘) | ||
+ | 然后根据尺度和梯度强度进行分类。 | ||
+ | |||
+ | |||
+ | 直线的边缘像素,由于梯度方向一致,尺度和梯度强度的关系一致,在三维空间呈现束形分布 (bundle-like distribution)。 | ||
+ | 圆形的边缘像素,梯度方向发生改变,但是尺度和梯度强度的关系一致,在三维空间呈现扁平分布 | ||
+ | |||
+ | 设计合成图像,测试能否从像素的尺度空间特征识别和分类边缘 | ||
+ | |||
+ | |||
+ | 像素轨迹流形 (Pixel Trajectory Manifold) | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | numpy多为数组,在多维数组空间实现尺度空间Canny算法 | ||
+ | |||
+ | 建立一个核心的、四维的**“状态数组(State Array)”,其维度为 (num_sigmas, height, width, num_features)。这个数组中的每个点 (s, y, x) 都不是一个简单的标量,而是一个描述该点在特定尺度下完整状态的特征向量**。 | ||
+ | |||
+ | 这个特征向量可以包含: | ||
+ | |||
+ | 梯度强度 (Magnitude) | ||
+ | 梯度方向 (Orientation) | ||
+ | 方向稳定性 (Stability) - 这需要一个巧妙的处理,我们稍后讨论 | ||
+ | ...未来还可以加入更多特征,如拉普拉斯响应、曲率等。 | ||
+ | |||
+ | |||
+ | 在这种范式下,尺度空间Canny算法的逻辑将变为: | ||
+ | |||
+ | 构建状态空间:一次性计算出这个包含所有信息的4D状态数组。 | ||
+ | 在空间中进行NMS:直接在3D的梯度强度“子空间” (s, y, x) 上执行非极大值抑制。 | ||
+ | 在空间中进行滞后阈值:直接在经过NMS筛选后的3D空间中,根据高、低阈值定义“强边”和“弱边”体素(Voxel)。 | ||
+ | 在空间中连接边缘:在3D空间中寻找与“强边”体素相连通的“弱边”体素。 | ||
+ | 投影到二维:最后,将3D空间中最终确定的边缘体素投影到一个2D平面上,形成最终的二值化图。 | ||
+ | |||
+ | 尺度可以用于边缘的分类。 | ||
+ | 原始图 | ||
+ | 二值化图(尺度空间Canny算法) | ||
+ | 稳定性图 | ||
+ | 特征强度图 | ||
+ | 尺度图 | ||
+ | 原始图+尺度图半透明叠加 | ||
+ | 稳定性图+尺度图半透明叠加 | ||
+ | 二值边缘+尺度图半透明叠加 | ||
+ | 特征强度图+尺度图半透明叠加 | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ## 四维向量尺度空间 | ||
+ | 建立一个核心的、四维的状态数组(State Array),其维度为 (num_sigmas, height, width, num_features)。 | ||
+ | num_features为特征向量,最基本特征包括像素值,梯度强度 (Magnitude),梯度方向 (Orientation) | ||
+ | 根据梯度矢量可以推导的纳入延伸特征场。 | ||
+ | 延伸特征包括方向稳定性 (Stability) ,特征尺度 (Characteristic Scale, σ_char),尺度显著性 (Scale Saliency),拉普拉斯响应 (Laplacian Response), 形状指数与曲度 (Shape Index & Curvedness)等 | ||
+ | |||
+ | 广义张量场 (Generalized Tensor Field) | ||
+ | |||
+ | 四维状态数组不仅仅是一个向量场,而是一个包含向量、标量和高阶导数(张量)信息的广义张量场 (Generalized Tensor Field)。 | ||
+ | |||
+ | 统一状态空间描述符 (Unified State-Space Descriptor, USSD) | ||
+ | |||
+ | 统一状态空间描述符 (USSD) 的设计哲学 | ||
+ | 核心思想:一个像素点的终极描述符,应该是在其最显著的时刻(特征尺度 σ_char),对其**所有内在属性(状态向量)**进行的一次全面、规范化的“快照”。 | ||
+ | |||
+ | 这个设计过程分为两个核心阶段: | ||
+ | |||
+ | 阶段一:尺度轴坍塌 (Scale-Axis Collapse) - 如何从一个像素点的3D轨迹中,提取出一个单一的、最具代表性的“原始特征向量”。 | ||
+ | 阶段二:向量组装与规范化 (Vector Assembly & Normalization) - 如何将这个原始特征向量,处理成一个对光照、对比度等变化具有鲁棒性的、固定长度的最终描述符。 | ||
+ | 阶段三: 宏伟蓝图 —— 完整的USSD生成算法 | ||
+ | 广义张量场 (The Generalized Tensor Field) |
2025年6月14日 (六) 16:07的最新版本
canny算法不能满足同时多尺度边缘提取。 不同尺度(边缘模糊程度)的边缘提取,需要不同尺度(sigma)高斯平滑。 多个不同尺度的canny 边缘合并能够改进效果。 问题的关键是尺度空间理论。 边缘的评估需要放在尺度空间进行,不同尺度空间边缘不同。
像素的尺度空间特征为三维曲线特征(尺度,梯度强度,梯度方向)。 分析和提取像素的关键尺度空间特征,是边缘检测,目标分类的重要工作。
这个问题涉及图像特征的提取。
理论上,图像的缩小和放大,会引起像素尺度空间特征的缩放,主要是尺度轴的缩放。
也就是尺度轴需要按照图像的缩放进行校准,如此像素特征具备可比性。 与众不同的像素特征,可以作为匹配的瞄点。
如此,像素分类问题转变为三维曲线的分类问题。
和方向轴垂直的曲线为边缘(方向一致) 可以在三维空间中进行像素的分类。 首先筛查出和方向轴垂直的曲线(边缘) 然后根据尺度和梯度强度进行分类。
直线的边缘像素,由于梯度方向一致,尺度和梯度强度的关系一致,在三维空间呈现束形分布 (bundle-like distribution)。
圆形的边缘像素,梯度方向发生改变,但是尺度和梯度强度的关系一致,在三维空间呈现扁平分布
设计合成图像,测试能否从像素的尺度空间特征识别和分类边缘
像素轨迹流形 (Pixel Trajectory Manifold)
numpy多为数组,在多维数组空间实现尺度空间Canny算法
建立一个核心的、四维的**“状态数组(State Array)”,其维度为 (num_sigmas, height, width, num_features)。这个数组中的每个点 (s, y, x) 都不是一个简单的标量,而是一个描述该点在特定尺度下完整状态的特征向量**。
这个特征向量可以包含:
梯度强度 (Magnitude) 梯度方向 (Orientation) 方向稳定性 (Stability) - 这需要一个巧妙的处理,我们稍后讨论 ...未来还可以加入更多特征,如拉普拉斯响应、曲率等。
在这种范式下,尺度空间Canny算法的逻辑将变为:
构建状态空间:一次性计算出这个包含所有信息的4D状态数组。 在空间中进行NMS:直接在3D的梯度强度“子空间” (s, y, x) 上执行非极大值抑制。 在空间中进行滞后阈值:直接在经过NMS筛选后的3D空间中,根据高、低阈值定义“强边”和“弱边”体素(Voxel)。 在空间中连接边缘:在3D空间中寻找与“强边”体素相连通的“弱边”体素。 投影到二维:最后,将3D空间中最终确定的边缘体素投影到一个2D平面上,形成最终的二值化图。
尺度可以用于边缘的分类。 原始图 二值化图(尺度空间Canny算法) 稳定性图 特征强度图 尺度图 原始图+尺度图半透明叠加 稳定性图+尺度图半透明叠加 二值边缘+尺度图半透明叠加 特征强度图+尺度图半透明叠加
- 四维向量尺度空间
建立一个核心的、四维的状态数组(State Array),其维度为 (num_sigmas, height, width, num_features)。 num_features为特征向量,最基本特征包括像素值,梯度强度 (Magnitude),梯度方向 (Orientation) 根据梯度矢量可以推导的纳入延伸特征场。 延伸特征包括方向稳定性 (Stability) ,特征尺度 (Characteristic Scale, σ_char),尺度显著性 (Scale Saliency),拉普拉斯响应 (Laplacian Response), 形状指数与曲度 (Shape Index & Curvedness)等
广义张量场 (Generalized Tensor Field)
四维状态数组不仅仅是一个向量场,而是一个包含向量、标量和高阶导数(张量)信息的广义张量场 (Generalized Tensor Field)。
统一状态空间描述符 (Unified State-Space Descriptor, USSD)
统一状态空间描述符 (USSD) 的设计哲学 核心思想:一个像素点的终极描述符,应该是在其最显著的时刻(特征尺度 σ_char),对其**所有内在属性(状态向量)**进行的一次全面、规范化的“快照”。
这个设计过程分为两个核心阶段:
阶段一:尺度轴坍塌 (Scale-Axis Collapse) - 如何从一个像素点的3D轨迹中,提取出一个单一的、最具代表性的“原始特征向量”。 阶段二:向量组装与规范化 (Vector Assembly & Normalization) - 如何将这个原始特征向量,处理成一个对光照、对比度等变化具有鲁棒性的、固定长度的最终描述符。 阶段三: 宏伟蓝图 —— 完整的USSD生成算法 广义张量场 (The Generalized Tensor Field)