自然语言处理与机器学习基础习题解析

1、对以下句子进行手动分词。(a) “I’m a student.” (b) “He didn’t return Mr. Smith’s book.” (c) “We have no useful information on whether users are at risk, said James A. Talcott of Boston’s Dana - Farber Cancer Institute.”

  • (a) I’m a student.
  • (b) He didn’t return Mr. Smith’s book.
  • (c) We have no useful information on whether users are at risk, said James A. Talcott of Boston’s Dana-Farber Cancer Institute.

2、为句子“They can fish.”分配词性标签。可以分配多少种有效的词性序列?画出每种解释的依存树结构。

对于句子 “They can fish.” ,有两种有效的词性序列分配:

  1. “They/PRP can/MD fish/VB”
    - “can” 是情态动词,
    - “fish” 是动词。

依存树结构
- “They” 是主语(nsubj),依赖于 “fish”
- “can” 是情态动词(aux),修饰 “fish”
- “fish” 是句子的核心动词(root),为根节点

  1. “They/PRP can/VB fish/NN”
    - “can” 是实义动词,
    - “fish” 是名词。

依存树结构
- “They” 是主语(nsubj),依赖于 “can”
- “can” 是核心动词(root),为根节点
- “fish” “can” 的宾语(obj),依赖于 “can”

所以,有两种有效的词性序列,每种解释对应一种依存树结构。

3、查阅字典查找“bank”和“saw”这两个单词的词义,并注意词义和词性之间的关联。字典中每个单词的引用形式称为词元,它可能与句子中的单词形式不同。单词形式“saw”可以有多少个词元?

“saw”可以有两个词元:

  1. 动词“see”的过去式 ,意为“看见”。
  2. 名词或动词原形
    - 作名词时,意为“锯子”。
    - 作动词时,意为“锯、锯开”。

4、画出句子“Mary went to Chicago, and visited John.”的谓词 - 论元结构。句子中有多少个谓词?谓词 - 论元关系在句子上是否形成树结构?讨论谓词 - 论元结构和依存树结构的异同。

在句子“Mary went to Chicago, and visited John.”中,有两个谓词,分别是“went”和“visited”。

对于谓词“went”,其论元为:
- 主语“Mary”(语义角色为 施事
- 宾语“Chicago”(语义角色为 地点

对于谓词“visited”,其论元为:
- 主语“Mary”(语义角色为 施事
- 宾语“John”(语义角色为 受事

关于谓词-论元关系是否形成树结构:
谓词-论元关系通常不是严格的树结构,因为一个论元可能同时与多个谓词相关,存在多对多的情况。

谓词-论元结构 依存树结构 的相似点在于:
二者都用于分析句子的结构和成分关系,帮助理解句子语义。

不同点在于
- 依存树结构着重展示词与词之间的 句法依存关系 ,强调语法层面的结构;
- 而谓词-论元结构侧重于明确谓词和其论元之间的 语义关系 ,关注事件意义的表达。

5、推导掷骰子的最大似然估计量。

掷骰子有六种可能结果,对应骰子上的数字,其概率可分别参数化为 $ (p_1, p_2, p_3, p_4, p_5, p_6) $,且
$$
\sum_{i = 1}^{6} p_i = 1
$$
(本质上是五个参数)。

给定数据集 $ D $,其中各结果的计数分别为 $ (n_1, n_2, n_3, n_4, n_5, n_6) $,数据似然函数可根据此构建。

与抛硬币类似,最大似然估计(MLE)也会导向通过计算相对频率的训练方法。具体而言,最大化相关数据似然函数会得到
$$
\hat{p} i = \frac{n_i}{\sum {j = 1}^{6} n_j}
$$

6、以下哪些是句子“Tim bought a book for $1.”的 n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值