有很多人可能很疑惑R的mclust里所求的BIC为什么是越大越好,实际上包里是作者自己定义了一个BIC公式:

\mathrm{BIC} \equiv 2 \operatorname{loglik}_{\mathcal{M}}\left(y, \theta_{k}^{*}\right)-(\# \text { params })_{\mathcal{M}} \log (n)

是模型与数据对应的对数似然函数的最大值, 是模型 中待估计的独立参数个数, n是数据中的观测值个数。

从哪里知道有什么参考文献:R: Model-Based Clustering

参考文献:Fraley, Chris, and Adrian E. Raftery. “Bayesian Regularization for Normal Mixture Estimation and Model-Based Clustering.” Journal of Classification, vol. 24, no. 2, Aug. 2007, pp. 155–81.

---------------------------------------------

这与我们日常所见的贝叶斯准则实际是不矛盾的,普通BIC(定义源自百度):

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐