1、对以下句子进行手动分词。(a) “I’m a student.” (b) “He didn’t return Mr. Smith’s book.” (c) “We have no useful information on whether users are at risk, said James A. Talcott of Boston’s Dana - Farber Cancer Institute.”
- (a) I’m a student.
- (b) He didn’t return Mr. Smith’s book.
- (c) We have no useful information on whether users are at risk, said James A. Talcott of Boston’s Dana-Farber Cancer Institute.
2、为句子“They can fish.”分配词性标签。可以分配多少种有效的词性序列?画出每种解释的依存树结构。
对于句子 “They can fish.” ,有两种有效的词性序列分配:
-
“They/PRP can/MD fish/VB”
-“can”是情态动词,
-“fish”是动词。
依存树结构 :
- “They” 是主语(nsubj),依赖于 “fish”
- “can” 是情态动词(aux),修饰 “fish”
- “fish” 是句子的核心动词(root),为根节点
-
“They/PRP can/VB fish/NN”
-“can”是实义动词,
-“fish”是名词。
依存树结构 :
- “They” 是主语(nsubj),依赖于 “can”
- “can” 是核心动词(root),为根节点
- “fish” 是 “can” 的宾语(obj),依赖于 “can”
所以,有两种有效的词性序列,每种解释对应一种依存树结构。
3、查阅字典查找“bank”和“saw”这两个单词的词义,并注意词义和词性之间的关联。字典中每个单词的引用形式称为词元,它可能与句子中的单词形式不同。单词形式“saw”可以有多少个词元?
“saw”可以有两个词元:
- 动词“see”的过去式 ,意为“看见”。
- 名词或动词原形 :
- 作名词时,意为“锯子”。
- 作动词时,意为“锯、锯开”。
4、画出句子“Mary went to Chicago, and visited John.”的谓词 - 论元结构。句子中有多少个谓词?谓词 - 论元关系在句子上是否形成树结构?讨论谓词 - 论元结构和依存树结构的异同。
在句子“Mary went to Chicago, and visited John.”中,有两个谓词,分别是“went”和“visited”。
对于谓词“went”,其论元为:
- 主语“Mary”(语义角色为 施事 )
- 宾语“Chicago”(语义角色为 地点 )
对于谓词“visited”,其论元为:
- 主语“Mary”(语义角色为 施事 )
- 宾语“John”(语义角色为 受事 )
关于谓词-论元关系是否形成树结构:
谓词-论元关系通常不是严格的树结构,因为一个论元可能同时与多个谓词相关,存在多对多的情况。
谓词-论元结构 和 依存树结构 的相似点在于:
二者都用于分析句子的结构和成分关系,帮助理解句子语义。
不同点在于 :
- 依存树结构着重展示词与词之间的 句法依存关系 ,强调语法层面的结构;
- 而谓词-论元结构侧重于明确谓词和其论元之间的 语义关系 ,关注事件意义的表达。
5、推导掷骰子的最大似然估计量。
掷骰子有六种可能结果,对应骰子上的数字,其概率可分别参数化为 $ (p_1, p_2, p_3, p_4, p_5, p_6) $,且
$$
\sum_{i = 1}^{6} p_i = 1
$$
(本质上是五个参数)。
给定数据集 $ D $,其中各结果的计数分别为 $ (n_1, n_2, n_3, n_4, n_5, n_6) $,数据似然函数可根据此构建。
与抛硬币类似,最大似然估计(MLE)也会导向通过计算相对频率的训练方法。具体而言,最大化相关数据似然函数会得到
$$
\hat{p} i = \frac{n_i}{\sum {j = 1}^{6} n_j}
$$


7477

被折叠的 条评论
为什么被折叠?



