《自然语言处理入门》勘误表

作者好,在62页,是不是将“非h和非s字符”改为“非h且非s的字符”会更好呢?

同意,我是把编程的&&翻译为和,其实想表达且的意思。

%E9%94%99%E8%AF%AF

惩罚错误的方法是不是应该用\hat y

是的,感谢指出错误。

第 330 页

标签 英文全称 中文简称
\color{red}{elf} classifier modifier 类别修饰

\color{red}{elf} 应为 \color{blue}{clf}

1 Like

作者好,第96页第1行:深度学习带了一种递归神经网络语言模型。“带”后面少个字,感觉不通顺。

1 Like

感谢指出!

感谢指正!

谢谢你的书,让我从零开始学习自然语言处理:)

p9,图1-4 自然语言处理的历史,感觉和文字描述的时间段不符。
图1-4 显示规则系统开始于20世纪80年代。但书中的文字描述为“20世纪80年代以前的主流方法都是规则系统…”

感谢指出。不过这张图和介绍里的时间点都是大概的,毕竟没有约定80年代之后就不能研究规则系统了。规则系统可以说是贯穿整个时间线的,图1-4看上去规则系统时间点在1980年,不过只是排版方便(毕竟边框加在右边还是很丑的),还请以介绍为准。

在P318有个笔误,公式(11.18)上的“几何间隔”误写成“集合间隔

1 Like

的确如此,感谢指正!

您好,第271页,最下面计算信息熵的公式中第一行是不是少个负号?

感谢指出,这个错误已经有读者朋友提出并反馈给出版社了。

hankcs老师好,P181 奖励正确答案触发的特征函数的权重 w <-- w + phi(x(i), y) 是否应该改为 w <-- w + phi(x(i), y(i)),下面的“奖惩可以合并到一个式子里”以及“可以调整学习率”后面公式的相应地方是否也应该这样修改?谢谢~

P187 中间部分 “PerceptronTrainer,提供训练接口也评测接口” --> “训练接口与评测接口” 有一个错别字

感谢指正。其实这句话里的 {\mathbf{y} \in Y} 是个泛指的变量,当它是正确时,指的是 \mathbf{y}^{(i)} ;当它是错误时,指的是 \mathbf{\hat y} 。排版时把上标弄丢了没发现,正确排版是这样子的:

结构化感知机算法

  1. 读入样本 (\mathbf{x}^{(i)},\mathbf{y}^{(i)}) ,执行结构化预测 \mathbf{\hat y} = \arg\max_{\mathbf{y} \in Y}\left(\mathbf{w}\cdot\phi(\mathbf{x}^{(i)},\mathbf{y})\right)
  2. 与正确答案对比,若 \mathbf{\hat y}\neq \mathbf{y}^{(i)} ,则更新参数:奖励正确答案触发的特征函数 \mathbf{w}\leftarrow\mathbf{w}+\phi(\mathbf{x}^{(i)},\mathbf{y}^{(i)}) ,惩罚错误结果触发的特征函数 \mathbf{w}\leftarrow\mathbf{w}-\phi(\mathbf{x}^{(i)},\mathbf{\hat y}) 。奖惩可以合并到一个式子里: \mathbf{w}\leftarrow\mathbf{w}+\phi(\mathbf{x}^{(i)},\mathbf{y}^{(i)})-\phi(\mathbf{x}^{(i)},\mathbf{\hat y}) ,还可以调整学习率: \mathbf{w}\leftarrow\mathbf{w}+\alpha\left(\phi(\mathbf{x}^{(i)},\mathbf{y}^{(i)})-\phi(\mathbf{x}^{(i)},\mathbf{\hat y})\right)

感谢指正,都反馈给出版社了。

Page 277页,9.2.1 词频统计,对应代码运行,得不到最后一行的’[女排,观众,欢呼]’,这行的结果是运行:

根据词频提取关键词

print(TermFrequencyCounter.getKeywordList(“女排夺冠,观众欢呼女排女排女排!”, 3))
得到的结果

感谢反馈,应当删掉最后一行: