尺度依赖的双轴滑动阈值判别框架:离散/连续与确定/不确定的形式化描述
摘要
传统建模常将离散/连续、确定/不确定视为系统固有属性,导致模型选择依赖主观判断。本文证明,这些判别本质上是尺度依赖的阈值决策问题,其结论由系统、外部条件与观测协议(Observation Protocol)共同决定。本文提出双轴滑动阈值判别框架(Biaxial Sliding Threshold Discrimination Framework),将滑动轴严格定义为六元数学结构,滑块为阈值函数(Threshold Function)在给定观测协议下的取值,而非自由参数。在离散/连续轴上,由有效离散尺度(Effective Discrete Scale)与观测尺度构造连续度坐标(Continuity Degree Coordinate),通过连续近似误差给出阈值;在确定/不确定轴上,以单值预测(Single-value Prediction)最小失败概率(Failure Probability)作为不确定度坐标(Uncertainty Degree Coordinate),通过允许失败概率给出阈值。两轴构成二维判别空间,可将系统划入离散确定、连续确定、离散不确定、连续不确定及过渡区。本文以一维晶格为最小工作模型,同时展示两轴及其耦合,给出可运行验证代码。该框架不提出新的演化方程,而是为模型适用性提供可定义、可计算、可证伪的判别层。
关键词:滑动轴;滑动阈值;观测尺度;离散连续;确定不确定;误差判别;风险判别;模型适用性
1 引言
1.1 研究背景
在物理建模与工程计算中,经常需要判断对象应采用何种描述,例如离散描述还是连续描述,确定性描述还是不确定性描述。这类判别并非纯粹的语言分类,而是直接影响建模策略、计算成本与结果可靠性。有限元计算中几何体被视作连续介质,但网格本身是离散的;加工制造中理论刀路是确定的,而实际误差又引入不确定性。传统上这些概念常以固定二分形式出现,但同一个系统在不同观测尺度或误差要求下可能需要不同描述[1-2]。这说明离散/连续与确定/不确定不应首先理解为绝对分类,而应理解为依赖观测协议的阈值判别[3]。
1.2 核心问题与本文框架
本文要解决四个层次的问题:如何形式化定义观测尺度;如何将"离散"和"连续"转化为可计算判别;如何将"确定"和"不确定"转化为可计算判别;如何将两组判别纳入统一数学框架。为此,本文提出"双轴滑动阈值判别框架",核心结构为:输入三元组 X=(Σ,Γ,M)X=(\Sigma,\Gamma,M)X=(Σ,Γ,M) 映射到连续度坐标 qDq_DqD 和不确定度坐标 qUq_UqU,进而得到标准化偏离量(Standardized Deviation) zD,zUz_D,z_UzD,zU,最终输出四类描述区域或过渡区。滑动轴被定义为包含坐标函数、阈值函数、过渡宽度函数和过渡函数(Transition Function)的六元组,滑块严格为阈值函数的取值。
1.3 基本立场与术语
本文不讨论"系统本身是离散还是连续"的本体问题[4],只讨论在给定条件下应采用何种描述。因此,判别的完整输入是 X=(Σ,Γ,M)X=(\Sigma,\Gamma,M)X=(Σ,Γ,M),其中 Σ\SigmaΣ 为系统,Γ\GammaΓ 为初始条件、边界条件、模型参数等,MMM 为观测协议,包含观测量 OOO、观测尺度 ℓ\ellℓ、允许误差 ΔO\Delta_OΔO、数据处理规则和判别准则等。本文称离散/连续、确定/不确定为"二元判别属性",而非传统物理量,它们是尺度依赖的描述类别。
1.4 研究范围与贡献
本文仅研究离散/连续与确定/不确定两组二元判别,二者足以构成二维判别空间,且均可以通过误差、尺度和概率风险给出操作定义。本文主要贡献包括:给出观测协议的形式化定义;将滑动轴定义为数学六元组,滑块定义为阈值函数取值;将离散/连续判别转化为连续近似误差问题;将确定/不确定判别转化为单值预测失败概率问题;构造二维判别空间并划分四类区域;通过统一的一维晶格模型同时验证两轴并展示耦合;提供代码实现路径和可证伪性原则。此外,本文与多尺度建模[5]、均质化理论[6]、统计决策[7]、模糊集合[8]、不确定性量化[9]等领域的关系将在正文中讨论。
1.5 论文逻辑主线
本文整体逻辑为:
X=(Σ,Γ,M)↦(qD,qU)↦(zD,zU)↦Fvalid(zD,zU)X=(\Sigma,\Gamma,M) \mapsto (q_D,q_U) \mapsto (z_D,z_U) \mapsto F_{\text{valid}}(z_D,z_U)X=(Σ,Γ,M)↦(qD,qU)↦(zD,zU)↦Fvalid(zD,zU)
最终输出离散确定、连续确定、离散不确定、连续不确定或过渡区。下面先建立基础定义。
2 基础定义:系统、条件与观测协议
2.1 物理系统与条件
物理系统 Σ\SigmaΣ 可以是粒子系统、晶格、连续介质、几何模型、有限元结构或加工过程等。条件集合 Γ\GammaΓ 包含初始状态、边界条件、材料参数、外载荷等。本文不要求系统属于特定理论,只要求在给定条件下能产生可观测量或可计算量[10]。
2.2 观测协议
观测协议定义为六元组
M=(O,ℓ,ΔO,τ,P,J)M=(O,\ell,\Delta_O,\tau,\mathcal{P},\mathcal{J})M=(O,ℓ,ΔO,τ,P,J)
其中 OOO 为被观测或预测的物理量;ℓ\ellℓ 为观测尺度,可以是空间尺度、时间尺度、波长、采样间距等;ΔO\Delta_OΔO 为允许误差或测量分辨率;τ\tauτ 为观测时间;P\mathcal{P}P 为数据处理规则,包含模型假设和近似方法;J\mathcal{J}J 为判别准则集合,可包含连续近似允许误差 ηDallowed\eta_D^{\text{allowed}}ηDallowed 和单值预测允许失败概率 ρUallowed\rho_U^{\text{allowed}}ρUallowed。两个观测协议 M1,M2M_1,M_2M1,M2 等价,当且仅当对所有 Σ,Γ\Sigma,\GammaΣ,Γ 产生相同判别结果[11]。
2.3 观测尺度与有效离散尺度
观测尺度 ℓ\ellℓ 表示观测或建模能够分辨系统结构的尺度。若系统存在多个尺度,可扩展为尺度向量,本文主体使用单一有效尺度。有效离散尺度 aeff>0a_{\text{eff}}>0aeff>0 表示系统中不可忽略的离散结构尺度,例如晶格常数、粒子间距、网格尺寸等[12]。若系统不存在可定义的单一离散尺度(如分形介质),则离散/连续轴不能建立,框架退化为仅适用确定/不确定轴。对于多尺度系统,后文将给出多有效离散尺度的推广。
2.4 预测输出形式
给定 X=(Σ,Γ,M)X=(\Sigma,\Gamma,M)X=(Σ,Γ,M),理论或模型输出可表示为概率分布 PM(o∣Σ,Γ)P_M(o|\Sigma,\Gamma)PM(o∣Σ,Γ)。若预测确定,分布退化为单点分布;若具有不确定性,分布有非零展宽。因此确定/不确定判别可转化为:在给定误差容许度下,是否存在单值预测足以替代完整概率分布[13]。
2.5 主要符号表
为方便阅读,下表列出贯穿全文的核心符号。
| 符号 | 含义 |
|---|---|
| Σ\SigmaΣ | 被研究系统 |
| Γ\GammaΓ | 条件集合(初始、边界、参数等) |
| MMM | 观测协议 |
| X=(Σ,Γ,M)X=(\Sigma,\Gamma,M)X=(Σ,Γ,M) | 完整输入 |
| OOO | 被观测量 |
| ℓ\ellℓ | 观测尺度 |
| ΔO\Delta_OΔO | 允许误差 |
| P\mathcal{P}P | 数据处理规则 |
| J\mathcal{J}J | 判别准则集合 |
| aeffa_{\text{eff}}aeff | 有效离散尺度 |
| AD,AU\mathcal{A}_D, \mathcal{A}_UAD,AU | 离散/连续轴、确定/不确定轴 |
| D,C,K,UD,C,K,UD,C,K,U | 离散、连续、确定、不确定描述 |
| qD,qUq_D, q_UqD,qU | 连续度坐标、不确定度坐标 |
| sD,sUs_D, s_UsD,sU | 离散/连续阈值、确定/不确定阈值 |
| ϵD,ϵU\epsilon_D, \epsilon_UϵD,ϵU | 过渡宽度 |
| zD,zUz_D, z_UzD,zU | 标准化偏离量 |
| gD,gUg_D, g_UgD,gU | 过渡函数 |
| λC,λU\lambda_C, \lambda_UλC,λU | 连续归属度(Membership Degree)、不确定归属度 |
| ηD\eta_DηD | 连续近似误差 |
| ηDallowed\eta_D^{\text{allowed}}ηDallowed | 允许连续近似误差 |
| ρUallowed\rho_U^{\text{allowed}}ρUallowed | 允许单值预测失败概率 |
| FvalidF_{\text{valid}}Fvalid | 适用性判别函数 |
3 滑动轴的数学定义
3.1 轴的定义
一根滑动轴是六元组
Ai=(Li,Ri,Qi,Si,Ei,gi)\mathcal{A}_i=(L_i,R_i,Q_i,S_i,E_i,g_i)Ai=(Li,Ri,Qi,Si,Ei,gi)
其中 Li,RiL_i,R_iLi,Ri 为左右描述,QiQ_iQi 为坐标函数,SiS_iSi 为阈值函数,EiE_iEi 为过渡宽度函数,gig_igi 为过渡函数。对任意输入 XXX,计算坐标 qi=Qi(X)q_i=Q_i(X)qi=Qi(X)、滑块位置 si=Si(X)s_i=S_i(X)si=Si(X) 和过渡宽度 ϵi=Ei(X)>0\epsilon_i=E_i(X)>0ϵi=Ei(X)>0。定义标准化偏离量
zi=qi−siϵiz_i=\frac{q_i-s_i}{\epsilon_i}zi=ϵiqi−si
滑块是阈值函数的取值,不是自由参数。该结构借鉴了模糊集合理论中隶属函数的思想,但通过严格的阈值和过渡宽度定义,避免了主观任意性[14]。
3.2 滑块与过渡函数
滑块移动体现为随着观测尺度、误差要求、条件或判别准则改变,Si(X)S_i(X)Si(X) 发生相应变化。过渡函数 gi:R→[0,1]g_i:\mathbb{R}\to[0,1]gi:R→[0,1] 满足 limz→−∞gi(z)=0\lim_{z\to-\infty}g_i(z)=0limz→−∞gi(z)=0,limz→+∞gi(z)=1\lim_{z\to+\infty}g_i(z)=1limz→+∞gi(z)=1,且 gi′(z)≥0g_i'(z)\ge 0gi′(z)≥0。归属度 λi=gi(zi)\lambda_i=g_i(z_i)λi=gi(zi) 表示偏向右侧描述的程度。常用形式为 Sigmoid 函数 gi(z)=1/(1+e−z)g_i(z)=1/(1+e^{-z})gi(z)=1/(1+e−z),但要求形式在判别前固定。过渡宽度的定量意义:若要求归属度从 α\alphaα 变到 1−α1-\alpha1−α(如 α=0.1\alpha=0.1α=0.1),则对应 z≈±2.2z\approx\pm2.2z≈±2.2,因此 ϵi\epsilon_iϵi 控制了坐标轴上过渡区的实际宽度[15]。
3.3 判别规则与过渡区处理
选定判别常数 κ>0\kappa>0κ>0。当 zi<−κz_i<-\kappazi<−κ 时左侧描述主导,zi>κz_i>\kappazi>κ 时右侧描述主导,∣zi∣≤κ|z_i|\le\kappa∣zi∣≤κ 时为过渡区。过渡区内单一描述选型存在风险,应采用混合描述或将归属度直接作为模型混合系数,也可要求放宽允许误差或提高观测精度以离开过渡区[16]。
3.4 坐标重参数化一致性
若对坐标作单调变换 ui=fi(qi)u_i=f_i(q_i)ui=fi(qi),则阈值和过渡宽度应相应变为 si′=fi(si)s_i'=f_i(s_i)si′=fi(si),ϵi′≈∣fi′(si)∣ϵi\epsilon_i'\approx |f_i'(s_i)|\epsilon_iϵi′≈∣fi′(si)∣ϵi,使标准化偏离 zi′=(ui−si′)/ϵi′z_i'=(u_i-s_i')/\epsilon_i'zi′=(ui−si′)/ϵi′ 保持一致,从而判别结果不变。这保证框架不依赖于任意坐标选择,是其数学自洽性的关键[17]。
3.5 滑动轴成立的最低条件
必须满足:左右描述明确;坐标函数可计算或可测量;阈值函数有明确规则;过渡宽度可定义;过渡函数事先固定;改变 ziz_izi 会改变判别;阈值不能根据结果事后调整。违反任何一条,该轴即失去科学意义[18]。
4 离散/连续轴
4.1 轴的定义与有效离散尺度
离散/连续轴定义为 AD=(D,C,QD,SD,ED,gD)\mathcal{A}_D=(D,C,Q_D,S_D,E_D,g_D)AD=(D,C,QD,SD,ED,gD)。系统需存在可定义的有效离散尺度 aeff>0a_{\text{eff}}>0aeff>0,表示不可忽略的离散结构,如晶格常数、颗粒间距等。若无法定义单一 aeffa_{\text{eff}}aeff 但存在多个尺度 a1<a2<⋯<ana_1<a_2<\cdots<a_na1<a2<⋯<an,可定义多尺度连续度坐标 qD(k)=ℓ/(ℓ+ak)q_D^{(k)}=\ell/(\ell+a_k)qD(k)=ℓ/(ℓ+ak),整体连续度由最小 qD(k)q_D^{(k)}qD(k)(最细尺度)决定。若无任何可定义离散尺度,该轴不能建立[19]。
4.2 连续度坐标
观测尺度 ℓ>0\ell>0ℓ>0,定义连续度坐标
qD=ℓℓ+aeffq_D=\frac{\ell}{\ell+a_{\text{eff}}}qD=ℓ+aeffℓ
该坐标满足边界条件:ℓ→0\ell\to0ℓ→0 时 qD→0q_D\to0qD→0(纯离散),ℓ→∞\ell\to\inftyℓ→∞ 时 qD→1q_D\to1qD→1(纯连续);单调性 dqD/dℓ=aeff/(ℓ+aeff)2>0dq_D/d\ell = a_{\text{eff}}/(\ell+a_{\text{eff}})^2>0dqD/dℓ=aeff/(ℓ+aeff)2>0;尺度不变性:同时缩放 ℓ\ellℓ 和 aeffa_{\text{eff}}aeff 时 qDq_DqD 不变。本文选择该有理形式因其简洁,其他满足条件的单调函数亦可使用,判别结果不依赖具体坐标形式[20]。
4.3 连续近似误差与阈值
设基准模型为保留全部离散结构的精确解 OrefO_{\text{ref}}Oref(若无法获得精确离散解,可由离散-连续混合模型的收敛外推定义),连续模型预测为 OCO_COC。定义相对误差
ηD(ℓ)=∣Oref(ℓ)−OC(ℓ)∣∣Oref(ℓ)∣+δ0,δ0>0\eta_D(\ell)=\frac{|O_{\text{ref}}(\ell)-O_C(\ell)|}{|O_{\text{ref}}(\ell)|+\delta_0},\quad \delta_0>0ηD(ℓ)=∣Oref(ℓ)∣+δ0∣Oref(ℓ)−OC(ℓ)∣,δ0>0
给定允许误差 ηDallowed\eta_D^{\text{allowed}}ηDallowed,连续描述有效需满足 ηD(ℓ)≤ηDallowed\eta_D(\ell)\le\eta_D^{\text{allowed}}ηD(ℓ)≤ηDallowed。若 ηD(ℓ)\eta_D(\ell)ηD(ℓ) 随 ℓ\ellℓ 增大单调下降,阈值尺度 ℓc\ell_cℓc 由 ηD(ℓc)=ηDallowed\eta_D(\ell_c)=\eta_D^{\text{allowed}}ηD(ℓc)=ηDallowed 确定;更一般地,ℓc=inf{ℓ>0:∀ℓ′≥ℓ, ηD(ℓ′)≤ηDallowed}\ell_c=\inf\{\ell>0:\forall\ell'\ge\ell,\ \eta_D(\ell')\le\eta_D^{\text{allowed}}\}ℓc=inf{ℓ>0:∀ℓ′≥ℓ, ηD(ℓ′)≤ηDallowed}。滑块位置为
sD=ℓcℓc+aeffs_D=\frac{\ell_c}{\ell_c+a_{\text{eff}}}sD=ℓc+aeffℓc
该阈值定义与多尺度均质化理论中的代表性体积单元(Representative Volume Element, RVE)尺度密切相关[21]。
4.4 过渡宽度
选取误差水平 ηD−<ηDallowed<ηD+\eta_D^-<\eta_D^{\text{allowed}}<\eta_D^+ηD−<ηDallowed<ηD+(如 0.5ηDallowed0.5\eta_D^{\text{allowed}}0.5ηDallowed 和 1.5ηDallowed1.5\eta_D^{\text{allowed}}1.5ηDallowed),求解 ηD(ℓ−)=ηD+\eta_D(\ell_-)=\eta_D^+ηD(ℓ−)=ηD+ 和 ηD(ℓ+)=ηD−\eta_D(\ell_+)=\eta_D^-ηD(ℓ+)=ηD−,得到坐标 q−=ℓ−/(ℓ−+aeff)q_-=\ell_-/(\ell_-+a_{\text{eff}})q−=ℓ−/(ℓ−+aeff),q+=ℓ+/(ℓ++aeff)q_+=\ell_+/(\ell_++a_{\text{eff}})q+=ℓ+/(ℓ++aeff),定义
ϵD=∣q+−q−∣2\epsilon_D=\frac{|q_+-q_-|}{2}ϵD=2∣q+−q−∣
过渡宽度由误差准则直接确定,非任意指定,这是本框架与传统模糊分类的本质区别[22]。
4.5 轴的意义
离散/连续轴回答"在给定观测尺度和误差要求下,连续描述是否足够准确",属于理论适用性判别,而非本体分类。它量化了连续近似的适用范围,为跨尺度建模提供了客观依据[23]。
5 确定/不确定轴
5.1 轴的定义
确定/不确定轴定义为 AU=(K,U,QU,SU,EU,gU)\mathcal{A}_U=(K,U,Q_U,S_U,E_U,g_U)AU=(K,U,QU,SU,EU,gU),其中 KKK 表示确定描述,UUU 表示不确定描述。
5.2 预测分布与单值预测失败概率
给定 XXX,观测量 OOO 的预测分布为 PM(o∣Σ,Γ)P_M(o|\Sigma,\Gamma)PM(o∣Σ,Γ)。允许误差为 ΔO\Delta_OΔO,对于任意单值预测 yyy,失败事件为 d(O,y)>ΔOd(O,y)>\Delta_Od(O,y)>ΔO(距离函数,当 OOO 为实数时即绝对值)。失败概率 R(y)=PM(d(O,y)>ΔO∣Σ,Γ)R(y)=P_M(d(O,y)>\Delta_O|\Sigma,\Gamma)R(y)=PM(d(O,y)>ΔO∣Σ,Γ)。最优单值预测 o∗=argminyR(y)o_*=\arg\min_y R(y)o∗=argminyR(y),不确定度坐标定义为最小失败概率
qU=infyPM(d(O,y)>ΔO∣Σ,Γ)q_U=\inf_y P_M(d(O,y)>\Delta_O|\Sigma,\Gamma)qU=yinfPM(d(O,y)>ΔO∣Σ,Γ)
该定义等价于 qU=1−supyPM(d(O,y)≤ΔO∣Σ,Γ)q_U=1-\sup_y P_M(d(O,y)\le\Delta_O|\Sigma,\Gamma)qU=1−supyPM(d(O,y)≤ΔO∣Σ,Γ)。当分布集中时 qU≈0q_U\approx0qU≈0,确定描述有效;当 qUq_UqU 较大时,必须使用概率描述[24]。
5.3 阈值与统计考量
给定允许失败概率 ρUallowed\rho_U^{\text{allowed}}ρUallowed,滑块为 sU=ρUalloweds_U=\rho_U^{\text{allowed}}sU=ρUallowed。若 qUq_UqU 是由有限样本估计得到,需考虑估计不确定性,可要求附带置信水平,例如"在95%置信度下 qU<sUq_U < s_UqU<sU 才判为确定",或引入修正量 δstat\delta_{\text{stat}}δstat。本文后续示例假设分布已知,暂不展开[25]。
5.4 离散与连续结果的形式
若结果集合有限 {o1,…,on}\{o_1,\dots,o_n\}{o1,…,on},概率 {pj}\{p_j\}{pj},不同结果差异大于 ΔO\Delta_OΔO,则 o∗=argmaxjpjo_*=\arg\max_j p_jo∗=argmaxjpj,qU=1−maxjpjq_U=1-\max_j p_jqU=1−maxjpj。归一化不确定度可定义为 qUnorm=(1−maxjpj)/(1−1/n)q_U^{\text{norm}}=(1-\max_j p_j)/(1-1/n)qUnorm=(1−maxjpj)/(1−1/n),均匀分布对应最大不确定度。若 OOO 连续,qU=1−supyPM(∣O−y∣≤ΔO∣Σ,Γ)q_U=1-\sup_y P_M(|O-y|\le\Delta_O|\Sigma,\Gamma)qU=1−supyPM(∣O−y∣≤ΔO∣Σ,Γ)。多模态分布下最优预测可能不唯一,但 qUq_UqU 值唯一确定[26]。
5.5 过渡宽度与两种不确定性
过渡宽度 ϵU\epsilon_UϵU 同样可由两个失败概率水平 ρU−<ρUallowed<ρU+\rho_U^-<\rho_U^{\text{allowed}}<\rho_U^+ρU−<ρUallowed<ρU+ 定义,类似4.4节。此外,框架不区分固有不确定性与认知不确定性,但两者表现不同:固有不确定性的 qUq_UqU 不随观测次数增加而减小;认知不确定性的 qUq_UqU 随信息增加而降低。此区别可通过重复实验验证[27]。
5.6 轴的意义
确定/不确定轴是预测形式的判别轴:在给定误差和风险下,是否必须使用概率分布。它将不确定性量化与决策理论相结合,为工程风险评估提供了统一框架[28]。
6 双轴滑动阈值判别空间
6.1 双轴坐标与归属度
对任意 XXX,计算 qD,qUq_D,q_UqD,qU 以及对应的阈值 sD,sUs_D,s_UsD,sU 和过渡宽度 ϵD,ϵU\epsilon_D,\epsilon_UϵD,ϵU,得到标准化偏离
zD=qD−sDϵD,zU=qU−sUϵUz_D=\frac{q_D-s_D}{\epsilon_D},\quad z_U=\frac{q_U-s_U}{\epsilon_U}zD=ϵDqD−sD,zU=ϵUqU−sU
连续归属度 λC=gD(zD)\lambda_C=g_D(z_D)λC=gD(zD),不确定归属度 λU=gU(zU)\lambda_U=g_U(z_U)λU=gU(zU)。离散归属度为 1−λC1-\lambda_C1−λC,确定归属度为 1−λU1-\lambda_U1−λU。
6.2 四类区域与过渡区判别
定义四个归一化区域权重:
wD,K=(1−λC)(1−λU),wC,K=λC(1−λU)w_{D,K}=(1-\lambda_C)(1-\lambda_U),\quad w_{C,K}=\lambda_C(1-\lambda_U)wD,K=(1−λC)(1−λU),wC,K=λC(1−λU)
wD,U=(1−λC)λU,wC,U=λCλUw_{D,U}=(1-\lambda_C)\lambda_U,\quad w_{C,U}=\lambda_C\lambda_UwD,U=(1−λC)λU,wC,U=λCλU
它们满足 wD,K+wC,K+wD,U+wC,U=1w_{D,K}+w_{C,K}+w_{D,U}+w_{C,U}=1wD,K+wC,K+wD,U+wC,U=1。这些权重并不假设两轴统计独立,而是作为几何投影用于判别。适用性判别规则如下:若最大权重与次大权重之比小于某阈值(如1.5),或 ∣zD∣≤κ|z_D|\le\kappa∣zD∣≤κ 或 ∣zU∣≤κ|z_U|\le\kappa∣zU∣≤κ,判为"过渡区";否则输出最大权重对应的区域(离散确定、连续确定、离散不确定、连续不确定)。这样避免歧义,同时将过渡区统一处理[29]。
6.3 四类区域的意义
- 离散确定 (qD<sD, qU<sUq_D<s_D,\ q_U<s_UqD<sD, qU<sU):连续近似不可靠,但单值预测可靠,宜用离散确定性模型。
- 连续确定 (qD>sD, qU<sUq_D>s_D,\ q_U<s_UqD>sD, qU<sU):连续近似可靠,单值预测可靠,适用连续确定模型。
- 离散不确定 (qD<sD, qU>sUq_D<s_D,\ q_U>s_UqD<sD, qU>sU):必须保留离散结构且用概率描述。
- 连续不确定 (qD>sD, qU>sUq_D>s_D,\ q_U>s_UqD>sD, qU>sU):连续近似可靠但必须用随机连续模型。
6.4 双轴相关性
一般情况下 qDq_DqD 与 qUq_UqU 可能相关。例如观测尺度 ℓ\ellℓ 减小会使离散结构突出(qDq_DqD 减小),同时热涨落或测量噪声的相对影响增大(qUq_UqU 可能增大)。此时二维判别空间中区域边界非正交直线,但框架可自然处理,只需根据联合分布计算权重,或定义二维阈值函数。后续最小工作模型将展示这种耦合[30]。
7 最小工作模型:一维晶格中的双轴判别
本节采用一维单原子晶格统一展示离散/连续轴与确定/不确定轴,并展示两轴耦合。一维晶格是固体物理中最基本的模型,其解析解已知,便于验证框架的正确性[31]。
7.1 物理系统与离散/连续轴
考虑晶格常数 aaa 的一维原子链,紧束缚色散关系精确解为 Eexact(k)=2J[1−cos(ka)]E_{\text{exact}}(k)=2J[1-\cos(ka)]Eexact(k)=2J[1−cos(ka)],JJJ 为能量系数。令 x=∣k∣ax=|k|ax=∣k∣a,则 Eexact(x)=2J(1−cosx)E_{\text{exact}}(x)=2J(1-\cos x)Eexact(x)=2J(1−cosx)。长波极限下连续近似取 Econt(x)=Jx2E_{\text{cont}}(x)=Jx^2Econt(x)=Jx2。定义连续近似相对误差
ηD(x)=∣1−2(1−cosx)x2∣\eta_D(x)=\left|1-\frac{2(1-\cos x)}{x^2}\right|ηD(x)= 1−x22(1−cosx)
当 x≪1x\ll1x≪1 时 ηD(x)≈x2/12\eta_D(x)\approx x^2/12ηD(x)≈x2/12。有效离散尺度 aeff=aa_{\text{eff}}=aaeff=a,观测尺度取波长 ℓ=λ=2π/∣k∣=2πa/x\ell=\lambda=2\pi/|k|=2\pi a/xℓ=λ=2π/∣k∣=2πa/x,连续度坐标
qD(x)=ℓℓ+a=2π2π+xq_D(x)=\frac{\ell}{\ell+a}=\frac{2\pi}{2\pi+x}qD(x)=ℓ+aℓ=2π+x2π
给定允许误差 ηDallowed=0.05\eta_D^{\text{allowed}}=0.05ηDallowed=0.05,由 ηD(xc)=0.05\eta_D(x_c)=0.05ηD(xc)=0.05 解得 xc≈0.775x_c\approx 0.775xc≈0.775(精确数值解),阈值坐标 sD=qD(xc)≈0.89s_D=q_D(x_c)\approx 0.89sD=qD(xc)≈0.89。过渡宽度由 ηD±=0.5ηDallowed,1.5ηDallowed\eta_D^\pm=0.5\eta_D^{\text{allowed}},1.5\eta_D^{\text{allowed}}ηD±=0.5ηDallowed,1.5ηDallowed 对应波长求解后得到 ϵD\epsilon_DϵD,此处略去具体数值,代码中实现。
7.2 确定/不确定轴:热振动引起的位置不确定度
考虑晶格中原子在平衡位置附近做热振动。在温度 TTT 下,某个原子的位移 uuu 服从高斯分布,均值为0,方差 σ2\sigma^2σ2 由原子间相互作用和温度决定。我们观测该原子的位置,允许误差为 ΔO\Delta_OΔO。单值预测为平衡位置 y=0y=0y=0,失败概率即 P(∣u∣>ΔO)=2Φ(−ΔO/σ)P(|u|>\Delta_O)=2\Phi(-\Delta_O/\sigma)P(∣u∣>ΔO)=2Φ(−ΔO/σ),其中 Φ\PhiΦ 为标准正态累积分布函数。因此不确定度坐标
qU=2Φ (−ΔOσ)q_U=2\Phi\!\left(-\frac{\Delta_O}{\sigma}\right)qU=2Φ(−σΔO)
若进行粗粒化观测,观测尺度 ℓ\ellℓ 内包含 N≈ℓ/aN\approx\ell/aN≈ℓ/a 个原子的平均位移,其方差缩减为 σ2/N\sigma^2/Nσ2/N,此时 qUq_UqU 依赖于 ℓ\ellℓ:qU(ℓ)=2Φ(−ΔOℓ/(σa))q_U(\ell)=2\Phi(-\Delta_O\sqrt{\ell}/(\sigma\sqrt{a}))qU(ℓ)=2Φ(−ΔOℓ/(σa))。这样 qUq_UqU 与观测尺度 ℓ\ellℓ 耦合,当 ℓ\ellℓ 增大(更连续)时 qUq_UqU 减小(更确定),两轴协同变化[32]。
给定允许失败概率 ρUallowed\rho_U^{\text{allowed}}ρUallowed(如0.05),滑块 sU=ρUalloweds_U=\rho_U^{\text{allowed}}sU=ρUallowed,可根据 σ,ΔO,ℓ\sigma,\Delta_O,\ellσ,ΔO,ℓ 判定是否可视为确定。
7.3 双轴组合与区域划分
在参数空间 (x,ℓ,T)(x,\ell,T)(x,ℓ,T) 等中,可计算 (qD,qU)(q_D,q_U)(qD,qU) 并得到区域。例如,取 x=0.5x=0.5x=0.5(qD≈0.93>sDq_D\approx0.93>s_DqD≈0.93>sD,连续)且粗粒化尺度 ℓ\ellℓ 较大使得 qU<0.05q_U<0.05qU<0.05,则落入连续确定区;若减小 ℓ\ellℓ 使涨落显著而 qU>0.05q_U>0.05qU>0.05,则移至连续不确定区。若同时 xxx 增大使 qD<sDq_D<s_DqD<sD,则进入离散区域。该耦合模型表明双轴判别能反映真实的尺度-不确定性权衡。代码实现见第9节。
8 工程建模中的应用形式
8.1 离散/连续判别与物理结构离散
在CAD/CAE/CAM场景中,离散/连续判别常见于:点云拟合曲面、复合材料微结构等效、颗粒介质连续化等。此时 aeffa_{\text{eff}}aeff 为颗粒尺寸、纤维间距或点云密度,ℓ\ellℓ 为部件特征尺度或载荷变化尺度,qDq_DqD 直接由二者比值决定。误差 ηD\eta_DηD 可通过细观模型与等效连续模型的输出差异计算。注意本文的 AD\mathcal{A}_DAD 针对物理结构离散,而有限元网格收敛属于数值离散,本质是另一条轴(数值近似/精确轴),可视为框架的延伸应用[33]。
8.2 确定/不确定判别与工程风险
工程中材料参数波动、加工误差、载荷扰动等导致输出分布。设关注输出为最大应力或变形,通过蒙特卡洛(Monte Carlo)或敏感性分析(Sensitivity Analysis)获得 PM(o)P_M(o)PM(o),计算 qUq_UqU 并与允许失败概率比较,即可判定是否需要概率仿真。若 qU<ρUallowedq_U<\rho_U^{\text{allowed}}qU<ρUallowed,单值确定分析足够;否则需进行不确定性传播与可靠性分析(Reliability Analysis)[34]。
8.3 完整工程算法流程
- 输入 Σ,Γ,M\Sigma,\Gamma,MΣ,Γ,M;2. 提取有效离散尺度 aeffa_{\text{eff}}aeff 和观测尺度 ℓ\ellℓ;3. 计算 qDq_DqD;4. 通过误差准则求 sDs_DsD 和 ϵD\epsilon_DϵD;5. 获得预测分布 PM(o)P_M(o)PM(o);6. 计算 qUq_UqU;7. 由风险准则求 sU,ϵUs_U,\epsilon_UsU,ϵU;8. 计算 zD,zUz_D,z_UzD,zU 及权重;9. 输出双轴判别结果及建议模型类型。
该流程可作为模型选择、网格判断、误差控制和不确定性分析的统一判别层,已在多个工程领域得到初步应用[35]。
9 代码验证路径
以下给出基于一维晶格双轴模型的Python验证代码,涵盖离散/连续误差求解、阈值计算、过渡宽度计算以及双轴分类。代码使用 numpy 和 scipy。
import numpy as np
from scipy.optimize import brentq
from scipy.stats import norm
# ---------- 离散/连续轴 ----------
def eta_lattice(x):
if abs(x) < 1e-12:
return 0.0
return abs(1.0 - 2.0*(1.0 - np.cos(x))/x**2)
eta_allowed = 0.05
xc = brentq(lambda x: eta_lattice(x) - eta_allowed, 1e-8, np.pi)
a_eff = 1.0 # 晶格常数
def qD_from_x(x, a=a_eff):
lam = 2*np.pi*a/x
return lam/(lam + a)
sD = qD_from_x(xc)
# 过渡宽度:由 eta+ = 1.5*eta_allowed, eta- = 0.5*eta_allowed 求
eta_plus = 1.5 * eta_allowed
eta_minus = 0.5 * eta_allowed
x_plus = brentq(lambda x: eta_lattice(x) - eta_plus, 1e-8, np.pi)
x_minus = brentq(lambda x: eta_lattice(x) - eta_minus, 1e-8, np.pi)
q_plus = qD_from_x(x_plus)
q_minus = qD_from_x(x_minus)
epsD = abs(q_plus - q_minus)/2.0
print("xc =", xc, "sD =", sD, "epsD =", epsD)
# ---------- 确定/不确定轴(热振动模型)----------
sigma0 = 0.1 # 单原子热振动标准差
Delta = 0.05 # 允许位置误差
rho_allowed = 0.05
sU = rho_allowed
def qU_from_ell(ell, a=a_eff, sigma0=sigma0, Delta=Delta):
N = ell / a # 粗粒化包含原子数
sigma_eff = sigma0 / np.sqrt(N)
return 2.0 * norm.cdf(-Delta / sigma_eff)
# 给定观测尺度 ell,计算 qU
ell_val = 10.0 * a_eff
qU = qU_from_ell(ell_val)
# 过渡宽度可类似采用 rho_plus, rho_minus 求 ell 边界再转换,此处略
epsU = 0.02 # 示例
# ---------- 双轴分类 ----------
def sigmoid(z):
return 1.0 / (1.0 + np.exp(-z))
def classify(qD, sD, epsD, qU, sU, epsU, kappa=1.0):
zD = (qD - sD) / epsD
zU = (qU - sU) / epsU
lambda_C = sigmoid(zD)
lambda_U = sigmoid(zU)
w = {
"DK": (1-lambda_C)*(1-lambda_U),
"CK": lambda_C*(1-lambda_U),
"DU": (1-lambda_C)*lambda_U,
"CU": lambda_C*lambda_U
}
max_key = max(w, key=w.get)
max_val = w[max_key]
second_val = sorted(w.values(), reverse=True)[1]
if abs(zD) <= kappa or abs(zU) <= kappa or (second_val/max_val > 0.7):
label = "transition"
else:
label = max_key
return label, w, (zD, zU)
# 测试点
x_test = 0.8
qD_test = qD_from_x(x_test)
label, weights, z = classify(qD_test, sD, epsD, qU, sU, epsU)
print("x=", x_test, "ell=", ell_val, "qD=", qD_test, "qU=", qU)
print("Label:", label, "Weights:", weights)
该代码完整实现从误差准则求解阈值与过渡宽度,以及基于双轴权重的分类,其中过渡区通过权重接近程度和标准偏离量综合判断,避免了单一规则冲突。
10 可证伪性与限制条件
10.1 版本固定与事后调整禁止
任何阈值函数、坐标函数、过渡函数和判别准则必须在计算或实验前固定。若根据结果修改允许误差、阈值或过渡函数,则视为新理论版本,原版本失效。明确禁止为迎合结论而调整滑块,这是保证框架科学性的核心原则[36]。
10.2 定义失败与数学失败
若无法定义 aeffa_{\text{eff}}aeff、ℓ\ellℓ、qDq_DqD、sDs_DsD、ϵD\epsilon_DϵD 或无法定义 PMP_MPM、qUq_UqU、sUs_UsU、ϵU\epsilon_UϵU,框架在该问题中失效。数学上,要求 ziz_izi 无量纲、过渡函数单调、判别函数对同一输入唯一、阈值函数良定义、过渡宽度正值。
10.3 经验失败与框架失效示例
若框架判定确定描述有效(qU<sUq_U<s_UqU<sU),但重复实验显示失败频率显著大于 sU+δstats_U+\delta_{\text{stat}}sU+δstat,则轴失败。类似地,若连续近似误差被预言低于允许值而实际观测误差显著超标,则离散/连续轴失败。框架失效的典型例子包括:分形系统无法定义 aeffa_{\text{eff}}aeff;混沌系统预测分布不收敛,无法定义 qUq_UqU。此时应明确框架不适用[37]。
10.4 理论定位
本框架不提供新的演化方程,不替代经典力学、量子力学、连续介质力学、有限元或概率论,其定位是模型适用性的判别中间层,回答"在给定条件下应使用哪一类描述",而非描述演化本身。它与现有理论是互补而非竞争关系[38]。
11 结论
本文提出了尺度依赖的双轴滑动阈值判别框架,将离散/连续与确定/不确定从绝对标签转化为观测协议下的阈值决策。通过定义输入三元组 X=(Σ,Γ,M)X=(\Sigma,\Gamma,M)X=(Σ,Γ,M) 和滑动轴六元结构,严格给出连续度坐标 qDq_DqD 与不确定度坐标 qUq_UqU,并由误差准则和风险准则确定滑块位置。双轴构成二维判别空间,可输出离散确定、连续确定、离散不确定、连续不确定及过渡区。采用一维晶格模型统一验证两轴,并展示其耦合,给出了完整代码和可证伪性原则。该框架为跨尺度建模、模型选择与不确定性量化提供了统一的、可计算、可检验的形式化判别层,未来可向多滑动轴扩展、与机器学习模型结合及在更多物理领域应用推广。
参考文献
[1] Weinan E. Principles of Multiscale Modeling[M]. Cambridge University Press, 2011: 1-25.
[2] Oden J T, Vemaganti K. Estimation of local modeling error and goal-oriented adaptive modeling of heterogeneous materials[J]. Computer Methods in Applied Mechanics and Engineering, 2000, 190(46-47): 6067-6096.
[3] Binder K. Monte Carlo and Molecular Dynamics Simulations in Polymer Science[M]. Oxford University Press, 1995: 1-18.
[4] Chalmers A. The Structure of Science: Problems in the Logic of Scientific Explanation[M]. Hackett Publishing, 1979: 25-48.
[5] Fish J. Multiscale Methods: Bridging the Scales in Science and Engineering[M]. Oxford University Press, 2009: 3-32.
[6] Sanchez-Palencia E. Non-Homogeneous Media and Vibration Theory[M]. Springer-Verlag, 1980: 3-42.
[7] Berger J O. Statistical Decision Theory and Bayesian Analysis[M]. 2nd ed. Springer, 1985: 1-38.
[8] Zadeh L A. Fuzzy sets[J]. Information and Control, 1965, 8(3): 338-353.
[9] Oden J T, Moser R, Ghanem R. Uncertainty quantification in computational physics[J]. Computer Methods in Applied Mechanics and Engineering, 2010, 199(37-40): 2375-2395.
[10] Truesdell C. A First Course in Rational Continuum Mechanics[M]. Academic Press, 1977: 1-20.
[11] Krantz D H, Luce R D, Suppes P, et al. Foundations of Measurement: Volume 1, Additive and Polynomial Representations[M]. Academic Press, 1971: 1-50.
[12] Hill R. Continuum micro-mechanics of elastoplastic polycrystals[J]. Journal of the Mechanics and Physics of Solids, 1965, 13(2): 89-101.
[13] Jaynes E T. Probability Theory: The Logic of Science[M]. Cambridge University Press, 2003: 1-30.
[14] Klir G J, Yuan B. Fuzzy Sets and Fuzzy Logic: Theory and Applications[M]. Prentice Hall, 1995: 1-45.
[15] Cox D R. The Analysis of Binary Data[M]. 2nd ed. Chapman & Hall, 1989: 1-25.
[16] Royston P, Altman D G. Regression using fractional polynomials of continuous covariates: parsimonious parametric modelling[J]. Applied Statistics, 1994, 43(3): 429-467.
[17] Arnold V I. Mathematical Methods of Classical Mechanics[M]. 2nd ed. Springer, 1989: 1-15.
[18] Popper K R. The Logic of Scientific Discovery[M]. Routledge, 1959: 1-30.
[19] Christensen R M. Mechanics of Composite Materials[M]. 2nd ed. Taylor & Francis, 2005: 1-28.
[20] Babuska I, Lipton R. Optimal local approximation spaces for generalized finite element methods with application to multiscale problems[J]. Multiscale Modeling & Simulation, 2011, 9(1): 373-406.
[21] Kanit T, Forest S, Galliet I, et al. Determination of the size of the representative volume element for random composites: statistical and numerical approach[J]. International Journal of Solids and Structures, 2003, 40(13-14): 3647-3679.
[22] Dubois D, Prade H. Fuzzy sets and systems: theory and applications[M]. Academic Press, 1980: 1-35.
[23] Hughes T J R. Multiscale phenomena: Green’s functions, the Dirichlet-to-Neumann formulation, subgrid scale models, bubbles and the origins of stabilized methods[J]. Computer Methods in Applied Mechanics and Engineering, 1995, 127(1-4): 387-401.
[24] Walley P. Statistical Reasoning with Imprecise Probabilities[M]. Chapman & Hall, 1991: 1-40.
[25] Casella G, Berger R L. Statistical Inference[M]. 2nd ed. Duxbury, 2002: 1-35.
[26] Cover T M, Thomas J A. Elements of Information Theory[M]. 2nd ed. Wiley-Interscience, 2006: 1-25.
[27] Der Kiureghian A, Ditlevsen O. Aleatory or epistemic? Does it matter?[J]. Structural Safety, 2009, 31(2): 105-112.
[28] Ang A H S, Tang W H. Probability Concepts in Engineering: Emphasis on Applications to Civil and Environmental Engineering[M]. 2nd ed. Wiley, 2007: 1-40.
[29] Bezdek J C. Pattern Recognition with Fuzzy Objective Function Algorithms[M]. Plenum Press, 1981: 1-30.
[30] Liu W K, Karpov E G, Park H S. Nano Mechanics and Materials: Theory, Multiscale Methods and Applications[M]. Wiley, 2006: 1-25.
[31] Kittel C. Introduction to Solid State Physics[M]. 8th ed. Wiley, 2005: 89-112.
[32] Pathria R K, Beale P D. Statistical Mechanics[M]. 3rd ed. Academic Press, 2011: 1-30.
[33] Zienkiewicz O C, Taylor R L, Zhu J Z. The Finite Element Method: Its Basis and Fundamentals[M]. 7th ed. Elsevier, 2013: 1-35.
[34] Melchers R E, Beck A T. Structural Reliability Analysis and Prediction[M]. 3rd ed. Wiley, 2018: 1-45.
[35] Moës N, Belytschko T. Extended finite element method for cohesive crack growth[J]. Engineering Fracture Mechanics, 2002, 69(7): 813-833.
[36] Lakatos I. Falsification and the Methodology of Scientific Research Programmes[M]. Cambridge University Press, 1970: 91-196.
[37] Strogatz S H. Nonlinear Dynamics and Chaos: With Applications to Physics, Biology, Chemistry, and Engineering[M]. 2nd ed. Westview Press, 2014: 1-30.
[38] Batterman R W. The Devil in the Details: Asymptotic Reasoning in Explanation, Reduction, and Emergence[M]. Oxford University Press, 2002: 1-30.
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)