三圆柱散射与可微超表面优化研究记录

研究目标

围绕“三圆柱散射体 + 超表面优化”建立一套可计算、可微、可对照的研究流程，主要回答两个问题：

当前 3D multi-slice 可微模型能否稳定完成三圆柱散射场的优化抑制。
当前近似模型与更严格的圆柱解析散射 benchmark 相比，主要误差集中在哪里。

当前研究形成了两条并行路线：

主模型：G:\SIM\SIM_DNN\differentiable_scattering_toy
- 用于三圆柱 3D 标量多切片散射建模与超表面相位优化。
对照模型：G:\SIM\SIM_DNN\mie_multi_cylinder_compare
- 用于 2D 无限长圆柱解析散射与 2D reduced multi-slice 数值近似对照。

模型路线

1. 3D Multi-Slice 可微散射主模型

主模型使用有限长度三圆柱，圆柱轴沿 y 方向，三圆柱沿 x 方向排列，传播方向取 z。整体链路为：

入射平面波 -> 2D 超表面相位调制 -> 自由空间传播 -> 三圆柱体散射 -> 观察面场 -> 远场角谱/后向散射损失

特点：

支持 PyTorch 自动求导，可直接优化超表面相位。
散射体采用 3D 标量多切片近似，适合快速原型验证。
可输出几何图、体内传播图、观察面场图和远场角谱对比。

2. 2D 无限长圆柱解析模型

解析对照模型在 xoz 平面中使用圆柱波展开求解多圆柱耦合散射。它不包含有限长度效应，也不包含超表面优化，作用是提供更严格的多体散射 benchmark。

3. 2D Reduced Numeric 对照模型

Reduced Numeric 模型在与解析模型一致的 xoz 几何中使用“局部复透射 + 多切片传播”的数值近似。它不是严格解，而是与主模型思路一致的二维桥接模型。

几何与参数

圆柱数量：3
圆柱半径：60 mm
圆柱轴向长度：240 mm
圆柱中心位置：x = [-180, 0, 180] mm
圆柱中心：y = 0 mm, z = 0 mm
源面到散射体入口：80 mm
散射体深度：180 mm
散射体出口到观察面：120 mm
工作频率：10 GHz

实验过程总览

这组实验不是一次单独的训练，而是按“先跑通可微链路，再建立物理对照，最后引入 CST 教师数据校准”的顺序推进。

阶段一：搭建可微散射主链路

目标是先验证当前 PyTorch 框架能不能把“超表面相位优化”和“三圆柱散射”串成一个可训练闭环。

实验做法：

构建二维超表面相位面，输入为平面波。
使用角谱传播把入射场送到三圆柱散射区域。
用 3D multi-slice 标量体模型近似三圆柱散射过程。
在观察面得到复场，再转到远场角谱。
以后向散射区域能量作为 loss，对超表面相位进行梯度优化。

这一阶段的关键判断不是“模型已经完全物理精确”，而是先确认它是否能稳定反传、是否能把目标函数压下去、是否能作为后续逆向设计的快速平台。

阶段二：建立解析 benchmark

主模型能优化以后，需要回答一个更重要的问题：它优化出来的散射场是否可信。为此建立了 mie_multi_cylinder_compare 对照分支。

实验做法：

在 xoz 截面建立 2D 无限长圆柱解析模型。
使用圆柱波展开求解单圆柱和三圆柱多体耦合散射。
在同一几何条件下建立 2D reduced multi-slice 数值近似。
比较解析解、Reduced Numeric 和主 3D 模型在 backscatter、近场分布和远场角谱上的差异。

这一阶段的核心是把误差从“感觉不准”变成可定位的问题：到底是整体幅值偏差，还是后向阴影区、角谱分布、多体干涉结构出了问题。

阶段三：引入 CST 教师数据

解析 benchmark 能说明二维理想圆柱问题中的差异，但实际研究还需要和更接近全波仿真的 CST 数据接上。因此做了 CST 教师-学生散射层校准。

实验做法：

使用现有三圆柱 CST 导出场作为教师数据。
将教师场切成统一补丁数据集。
只取能量占比主导的 Ex 分量，训练学生散射层学习 输入侧复场 -> 输出侧复场。
用恒等映射、未训练物理层和训练后学生层做定量对比。

这一阶段的目标是跑通“可信仿真场 → 可微散射层”的校准链路，为后续把散射层放回聚焦/优化任务做准备。

主模型优化结果

结果目录：

G:\SIM\SIM_DNN\differentiable_scattering_toy\results\three_cylinder_main\20260406_164146

主模型优化总览：

关键指标：

指标	数值
baseline backscatter	35998.7227
final backscatter	1.1776
初始 loss	35998.7188
最终 loss	1.2758
epoch 数	100
优化耗时	3.77 s

结论：

三圆柱 3D multi-slice 主模型训练过程稳定。
loss 在前 20 到 30 个 epoch 快速下降，后续进入细调阶段。
后向散射从 3.60e4 降到 1.18，约压低 3.06e4 倍，对应约 44.85 dB 改善。
说明该近似模型已经适合做“可微优化”和“目标函数压低”的快速原型。

这一结果的意义在于：当前框架的优化能力已经成立。也就是说，超表面相位确实可以通过梯度更新重排观察面场和远场角谱，使指定后向区域被压低。后面真正要解决的问题不再是“能不能优化”，而是“优化所依赖的散射模型够不够真实”。

解析与近似模型对照

单圆柱

模型	backscatter
单圆柱解析	70795.8750
单圆柱 Reduced Numeric	25200.2500

判断：从单圆柱开始，Reduced Numeric 已经明显低估后向散射。

三圆柱

模型	backscatter
三圆柱解析	315404.8438
三圆柱 Reduced Numeric	24743.2988
主 3D 模型未优化	35998.7227

比例关系：

解析 / Reduced Numeric ~= 12.75x
解析 / 主 3D ~= 8.76x

判断：当前近似模型无论是二维 Reduced Numeric 还是三维主模型，都系统性低估了严格解析 benchmark 下的后向散射水平。

这个对照说明，当前近似模型的误差不是三维主模型独有的偶然现象，而是“多切片传播 + 局部复透射”这类近似在圆柱散射问题中的共同倾向：它能给出某种趋势，但会削弱严格边界散射中的后向能量。

三圆柱解析、Reduced Numeric 与主 3D 模型综合对照：

误差集中区域

解析解与 Reduced Numeric 差异最大的区域不在散射体前方，而在三圆柱后方阴影区。

最大差异位置：

x = -193.125 mm
z = -135.0 mm
解析归一化场幅：0.0059
Reduced Numeric 归一化场幅：0.7310

解释：

解析模型在该位置预测了很深的干涉零点。
Reduced Numeric 在同一位置仍保持较高场强。
当前近似模型没有正确复现三圆柱后方由多重散射形成的深干涉消零结构。

区域 MAE：

区域	MAE
前向区域 front	0.2136
后向区域 rear	0.3205
阴影核心 shadow	0.2905

结论：主要问题不是整体场分布都不对，而是后向散射区和阴影区的多体干涉结构不够准确。

角谱差异

模型	最强离轴峰角度
解析	`-138 deg`
Reduced Numeric	`-6 deg`
主 3D	`-180 deg`

解释：

解析解会把能量明显分配到侧后向。
Reduced Numeric 更接近前向主瓣附近的轻微偏移。
主 3D 模型更偏向正后向。

这说明差异不只是振幅缩放问题，更关键的是当前近似模型对多圆柱耦合导致的角向散射结构刻画不足。

实验思路梳理

当前思路可以概括成三层判断。

第一层：可微优化链路是通的。主模型能够稳定反传，并能把后向散射目标函数压到很低。这说明它适合做快速逆向设计、结构搜索和相位面优化。

第二层：物理保真度还有明显短板。解析 benchmark 显示，当前近似模型从单圆柱开始就低估后向散射；到了三圆柱，多体耦合导致的差异进一步放大。最明显的问题集中在后向阴影区、深干涉零点和侧后向角谱结构。

第三层：CST 校准是下一步提高可信度的桥。解析模型提供了清晰的物理诊断，但它是二维无限长圆柱假设；CST 教师数据更接近实际全波仿真。学生散射层已经能学习到一部分 CST 场映射规律，所以后续可以把它作为校准版散射层接入优化流程。

因此，这条路线暂时不应该直接宣称“当前模型已经准确预测真实散射”，更合适的表述是：当前模型已经具备可微优化能力；解析对照指出了保真度短板；CST 教师-学生链路提供了修正这个短板的可行入口。

CST 教师模型校准

结果目录：

G:\SIM\SIM_DNN\differentiable_scattering_toy\results\cst_teacher_three_cylinder\20260417_015526

本轮目标是利用现有三圆柱 CST 场结果构建教师数据，训练一个只负责 输入侧复场 -> 输出侧复场 的学生散射层，用来评估当前可微散射层是否接近可信仿真结果。

三圆柱散射环境与高度矩阵示意：

教师输入/输出场示例：

数据设置：

教师父样本数量：4
训练/验证/测试补丁数量：24 / 8 / 8
有效学生分量：Ex

分量判断：

当前教师样本中输入与输出侧的 Ex 能量占比主导。
阶段一只训练 Ex 分量，使问题保持在和原始散射层训练更接近的复场映射形式。

分量能量占比：

训练结果：

训练集最终损失：2.669804
验证集最终损失：15.903975

训练曲线：

与教师输出的定量比较：

指标	恒等映射基线	未训练物理层基线	训练后学生层
复场均方根误差	1.465679	1.493103	1.036170
幅度 MAE	0.200848	0.184927	0.184927
幅度 RMSE	0.257212	0.226130	0.226137
相位 MAE / rad	2.034948	2.015366	1.248787
相对 L2 误差	1.717056	1.749129	1.214224

判断：

学生散射层相较恒等映射和未训练物理层基线有明确收敛。
当前学生层已经可用于后续聚焦优化前的可信初始化或校准。
但它还不能被认为已经等价于真实全波散射层。

教师-学生测试样本对比：

限制：

当前三圆柱 CST 工程没有直接给出端口式 S11/S21，双基准校验仍不完整。
现阶段数据仍是平面切片级教师样本，尚未覆盖更丰富的入射条件和几何变化。

当前阶段总判断

三圆柱 3D multi-slice 主模型已经可以稳定运行，并支持二维超表面相位可微优化。
在当前目标函数下，主模型能够显著压低后向散射，适合做快速迭代和逆向设计。
严格解析 benchmark 表明，当前近似模型系统性低估三圆柱后向散射。
最大误差集中在散射体后方阴影区和后向区域，核心原因是多体散射干涉结构复现不足。
解析解与近似模型在离轴峰方向上差异很大，说明侧后向能量重分布仍需增强。
CST 教师数据链路已经跑通，学生层可以作为校准版散射层继续推进，但还需要更完整的 S 参数或矢量散射基准来提高可信度。

当前问题定位

目前最值得优先处理的问题不是训练不收敛，而是散射层的物理表达能力不足。

具体表现：

后向散射被系统性低估。
三圆柱后方阴影区的深干涉零点没有被正确复现。
角谱中侧后向能量分布和解析结果差异明显。
CST 数据链路可用，但缺少 S11/S21 这类端口式基准，可信度校验还不完整。

可能原因：

multi-slice 近似更擅长描述逐层传播和相位累积，但对强边界散射、多重反射和圆柱绕射的描述不足。
局部复透射假设可能弱化了严格圆柱边界条件下的后向散射。
当前主模型是标量近似，尚未处理全矢量电磁耦合。
CST 教师样本数量还少，入射条件和几何变化覆盖不足。

下一步

近期任务

增加双圆柱对照实验，形成单圆柱、双圆柱、三圆柱的误差增长曲线。
固定几何和频率，分别比较 backscatter、近场 MAE、阴影区误差和最强离轴峰角度。
把误差拆成三个来源：有限长度效应、多切片近似误差、边界条件近似误差。
在 CST 工程中补充或重新导出可用于校验的 S11/S21 或等价能量指标。
扩充 CST 教师样本，加入更多入射角、窗口大小、圆柱位置或高度矩阵变化。

模型改进方向

改进主模型散射核，让后向阴影区更接近解析解。
增强三圆柱后方多重散射与深干涉零点结构的表达能力。
尝试在可微框架中加入更强的边界散射修正项，例如解析散射启发的角向核或非局部耦合项。
将 CST 学生散射层作为校准版模块，替换或修正当前纯物理近似散射层。
在保留可微性的前提下，提高对侧后向散射和多体耦合角谱的保真度。

写作和论文组织建议

第五章可以按“可微优化能力”和“物理可信度边界”两条线展开。
主模型优化结果用于证明框架可训练、可优化。
解析 benchmark 用于说明当前近似模型的误差来源和适用边界。
CST 教师模型用于承接下一阶段：从近似可微模型走向仿真校准可微模型。
结论里应避免把当前 3D multi-slice 直接描述成高保真全波求解器，更稳妥的定位是“快速可微近似模型 + 可通过解析/CST 继续校准的逆向设计框架”。

我的笔记

探索

三圆柱散射与可微超表面优化研究记录

三圆柱散射与可微超表面优化研究记录

研究目标

模型路线

1. 3D Multi-Slice 可微散射主模型

2. 2D 无限长圆柱解析模型

3. 2D Reduced Numeric 对照模型

几何与参数

实验过程总览

阶段一：搭建可微散射主链路

阶段二：建立解析 benchmark

阶段三：引入 CST 教师数据

主模型优化结果

解析与近似模型对照

单圆柱

三圆柱

误差集中区域

角谱差异

实验思路梳理

CST 教师模型校准

当前阶段总判断

当前问题定位

下一步

近期任务

模型改进方向

写作和论文组织建议

相关文件索引

关系图谱

目录

反向链接