tensorflow ctc_beam_search_decoder

白大力 · 2017-07-07 10:14:48 发布

以lstm 获得的ocr结果为例，为了方便讨论，假设被识别的符号只有3个类，图片是宽*高=10*3，即time step 是3，特征数是10。通过lstm，乘以weight matrix 加bias后的结果shape是[time_step,num_calss]=[3,3],假设值为

[

[0.1,0.8,0.1],

[0.6,0.3,0.1],

[0.1,0.7,0.2],

]

这结果的意思是,time_step 1 认为二号符号的概率最高为0.8，time_step 2 认为一号符号的概率最高为0.6，time_step 3 认为二号符号的概率为最高为0.7.

如果假设1，2，3号符号分别为a，b，c则用bean decoder 解出来的序列为2，1，2即b，a，b.

我知道，以上说法有问题，因为ctc_beam_decoder解出的序列长度是不定的，而上述方法解出的序列长度与time_step 相等，不知ctc_beam_decoder 如何决定序列长度的？

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

仓颉迁移实战：将 Node.js 微服务移植到 Cangjie 的工程化评测

AI 浪潮终章奏凯！GitCode & 文心大模型 & 智源研究院 AI 应用开发大赛圆满落幕

GitCode 10月：G-Star Landscape 3.0 更新。AtomGit 全新升级暨人工智能开源社区发布会举行。

查看更多评论

已为社区贡献2条内容