tensorflow ctc_beam_search_decoder
·
tensorflow ctc_beam_search_decoder
以lstm 获得的ocr结果为例,为了方便讨论,假设被识别的符号只有3个类,图片是 宽*高=10*3,即time step 是3,特征数是10。通过lstm,乘以weight matrix 加bias后的结果shape是[time_step,num_calss]=[3,3],假设值为
[
[0.1,0.8,0.1],
[0.6,0.3,0.1],
[0.1,0.7,0.2],
]
这结果的意思是,time_step 1 认为二号符号的概率最高为0.8,time_step 2 认为一号符号的概率最高为0.6,time_step 3 认为二号符号的概率为最高为0.7.
如果假设1,2,3号符号分别为a,b,c则用bean decoder 解出来的序列为2,1,2即b,a,b.
我知道,以上说法有问题,因为ctc_beam_decoder解出的序列长度是不定的,而上述方法解出的序列长度与time_step 相等,不知ctc_beam_decoder 如何决定序列长度的?
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐




所有评论(0)