第1章 语义表达 1
1.1 词向量与语义信息 1
1.1.1 稀疏词向量 2
1.1.2 分布式语义假设 2
1.1.3 稠密词向量 3
1.2 溢出词表词的处理方法 6
1.3 分词方法的区别与影响 11
1.3.1 词(word) 11
1.3.2 子词(subword) 12
1.3.3 字符(char) 16
1.4 词向量与语义相似度 17
1.5 构建句子向量 19
1.6 预训练的位置编码 22
1.7 BERT的不同嵌入类型 25
1.8 大模型语义建模的典型架构 27
第 2章 大模型的数据 31
2.1 大模型训练开源数据集 31
2.2 大模型不同训练环节与数据量 35
2.3 大模型数据预处理 39
2.3.1 数据的质量 39
……