Bert模型系列一：输入到底是什么东西呢？

bert

TensorFlow code and pre-trained models for BERT

项目地址：https://gitcode.com/gh_mirrors/be/bert

免费下载资源

Bonyin

5343人浏览 · 2020-03-16 00:20:43

Bonyin · 2020-03-16 00:20:43 发布

bert的输入是什么。

首先放上bert论文的地址：添加链接描述

在这里插入图片描述

上图是论文中给出的bert的输入的结构图:
- 输入由三部分组成：
- 1.token embedding
- 2 segment embedding 段向量, 其中端对应的就是inputs的一句话，句子末尾都有加[SEP]结尾符，两句拼接开头有[CLS]符号。是因为BERT里面的下一句的预测任务，所以会有两句拼接起来，上句与下句，上句有上句段向量，下句则有下句段向量，也就是图中A与B。
- 3 position embedding：是因为 Transformer 模型不能记住时序，所以人为加入表示位置的向量
  之后这三个向量拼接起来的输入会喂入BERT模型，输出各个位置的表示向量

后面继续研读大佬的论文，在总结bert的其他东西

GitHub 加速计划 / be / bert

下载

TensorFlow code and pre-trained models for BERT

最近提交(Master分支：18 天前 )

eedf5716 Add links to 24 smaller BERT models. 5 年前

8028c045 - 5 年前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

沁言学术 vs Grammarly：中文学术写作与语料库本地化支持的表现剖析

Grammarly是全球写作工具，语料库以英文为主，支持基本中文检查；沁言学术是本土AI平台，语料库深度本地化，针对中文学术设计。中文学术写作：Grammarly基础语法/拼写（本地化弱），沁言学术AI生成/优化（深度支持）。语料库本地化：Grammarly通用库（英文主导），沁言学术本土库（CNKI等集成）。整体：Grammarly免费版通用，付费版高级；沁言学术免费版入门，AI付费优化。表现亮