社交媒体上的恶意言论:整理与调查
1. 恶意言论用户与非恶意言论用户的活动差异
在社交媒体中,用户的活动程度可以通过状态数量和社交年龄等特征来衡量。一般来说,较长的社交年龄意味着用户在特定社交媒体平台上有更多的经验,且更为活跃。
通过比较恶意言论用户和非恶意言论用户的活动情况,我们发现:
|用户类型|平均状态数量|平均社交年龄|
| ---- | ---- | ---- |
|恶意言论用户|约 7464|约 497 天|
|非恶意言论用户|约 9231|约 1472 天|
从这些数据可以看出,尽管恶意言论用户的平均状态数量略低于非恶意言论用户,但他们的社交年龄明显更短。这表明恶意言论用户在社交媒体上的活跃度低于其他用户。
2. 最易遭受恶意言论攻击的目标群体
我们对遭受恶意言论攻击的用户进行了调查。恶意言论的定义侧重于那些忽略目标用户帖子实质内容,而使用尖刻或腐蚀性语言的用户。
在数据集中,我们发现恶意言论用户虽然常常忽略帖子的实质内容,但会关注目标用户的社会身份。以下是被恶意言论攻击超过 100 次的前几位用户类别占比情况:
|类别|占比|
| ---- | ---- |
|政治家|31%|
|新闻媒体|26%|
|记者|12%|
考虑到政治、新闻和观点在很多人之间存在分歧,这个结果并不意外。
3. 恶意言论检测的特征
为了区分恶意言论推文和非恶意言论推文,以及恶意言论用户和其他用户,我们采用了以下四类特征:
超级会员免费看
订阅专栏 解锁全文

5694

被折叠的 条评论
为什么被折叠?



