概率PCA模型各参数对压印字符集本征维数估计的影响及其估计方法研究
Probabilistic PCA parameters’ influence on intrinsic dimension estimation of protuberant characters and the relevant estimation method research
投稿时间:2009-09-25  修订日期:2009-09-25
DOI:
中文关键词:  主分量分析  概率主分量分析  本征维数  维数估计  压印字符图像
英文关键词:Principal component analysis  probabilistic principal component analysis (PPCA)  intrinsic dimensions  dimension estimation  protuberant character image
基金项目:国家教育部博士点基金
作者单位E-mail
宋怀波 西北农林科技大学机械与电子工程学院 songyangfeifei@163.com 
路长厚 山东大学机械工程学院 luchh@sdu.edu.cn 
邱化冬 山东大学机械工程学院  
摘要点击次数: 5162
全文下载次数: 0
中文摘要:
      确定观测数据集的本征维数是主分量分析的一个核心问题,然而目前的研究仍然多采用经验方式来进行估计,所得到的结果往往不是最优的。提出了一种基于概率主分量分析模型(PPCA)的压印字符图像子空间维数的确定方法,该方法首先建立观测数据的概率PCA模型,然后采用仿真数据进行仿真,对影响维数判别的各种因素进行了分析并给出了三种准则的适用范围,最后对压印字符数据集协方差矩阵的特征值曲线得到本征维数的大致区间范围,通过AIC、BIC和CAIC模型选择准则分别进行最优维数确定。实验表明,该方法可以提高算法的鲁棒性,有效的降低算法的运行时间。
英文摘要:
      A central issue in PCA is choosing the number of principal components to retain. However, most studies assume a known dimension or determine it heuristically, though there have a number of model selection criteria. In this paper, the probabilistic reformulation of PCA is used and a model selection criterion for determining the intrinsic dimensionality of data including Akaike’s information criterion (AIC), the consistent Akaika’s information criterion (CAIC), and the Bayesian inference criterion (BIC) is derived. These parameters which could affect the model selection are analyzed in detail. Aimed at estimating the intrinsic dimension of protuberant character images, a two-step method is used; we got rough ranges of the intrinsic dimension in the first step and estimated the optimum dimension in the second step. Experimental result shows that this algorithm is robust and could effectively decrease the running time.
  查看/发表评论  下载PDF阅读器
关闭

版权所有:《光电子·激光》编辑部  津ICP备12008651号-1
主管单位:天津市教育委员会 主办单位:天津理工大学
中国光学学会 地址:中国天津市西青区宾水西道391号
技术支持:北京勤云科技发展有限公司