《自然语言处理入门》勘误表

虽然水平有限,但我对改进内容的热情是无限的。此处专门收集勘误,欢迎大家的斧正,谢谢。

页码 原文 修改 提出者
41 孙松茂 孙茂松 戴斌
86 result += text[offset] result += text[offset:] @zzuruichao
94 n 越大 k 越大 @hankcs
95 p(\text{EOS} \mid 服务)=\frac{1}{1} p(\text{EOS} \mid 服务) = \frac{1}{2} @booynal
95 每个单词的概率仅取决于前n个单词 每个单词的概率仅取决于前n-1个单词 @booynal
106 pair[index / 2 + 1] pair[index * 2 + 1] @jingbiao
132 下标 i 和 j 分别代表观测和状态的,i=1 下标 i 和 j 分别代表状态和观测的,j=1 @zzuruichao
152 W+=c。若 y=B or S,则切断,L+=W,W []。 若y=B or S且W非空,则切断,即L+=W,W=[]。将字符x存入缓冲区,即W+=x。 @zkws
181 平均感知机的不同点 结构化感知机的不同点 @qidiao
204 图 6-5 分解为个小型最大团 图 6-5 分解为3个小型最大团 @Jiayuforfreeo
271 {\text{H(X) }} = p(x =正)\log p(x = 正) + p(x = 反)\log p(x = 反) {\text{H(X) }} = -\left(p(x =正)\log p(x = 正) + p(x = 反)\log p(x = 反)\right)
273 所以不必计算期望,或者说期望为 1 所以不必计算期望,或者说期望为 1 linmm
6 Likes

页码应该是41页吧?我看我的书中是在41页的。:smiley:

1 Like

的确,感谢指正。

作者大大,在书的181页结构化感知机算法那里,我感觉承接上文的意思,应该是“相较于感知机算法,结构化感知机的不同点无非在于…",而不是平均感知机吧:sweat_smile:

的确如此,感谢指正!

作者老大,您好,在152页,4.6.5预测一节中的切分规则里的(2)是否应该改为如下格式更容易和代码逻辑对应:

逐个读入字符x与标签y, 若y = B or S,则切断,L.add(W), W="", W+= x

这样的确好一些。

106页,有两处pair[index /2 +1] 应改为pair[index * 2 +1];

的确如此,感谢指正。

老师,58页的 “检查父节点p的子列表”,是不是应该改为 “检查父节点b的子列表”?

作者好 第86页replace_stropwrods_text函数中倒数第二行 result += text[offset] 如果最后一个停用词后面有多个字符会导致只输出最后一个停用词后面的一个字符,应该写成result += text[offset:]

的确如此,感谢指正!


Hankcs,你好!感谢你的书,带我进入来NLP的世界。
我看到95的时候,有些疑问,但又不确定,还请大神指点。如图的红圈圈所示。

感谢指出,你是对的。

第四章隐马尔可夫模型发射概率矩阵B下面一行
“其中,第i行j列的元素下标i和j分别代表观测和状态的第i种和第j种取值” 这里的观测和状态是不是写反了
因为状态y一共是N种 观测x一共是M种 ,矩阵是N×M

是的,感谢指正。

那下一行的i=1也应该改成j=1了

对的,已经向编辑部反馈了。