Hugging Face Transformers 支持中文的命名实体识别(NER)任务。你可以使用预训练的中文模型,例如 BERT、RoBERTa、MacBERT 等,它们经过中文数据的微调,可以用于实体识别任务。
1. 常见支持中文 NER 的 Hugging Face 模型
以下是一些适合中文 NER 任务的模型:
(1) bert-base-chinese
- 适用于中文基础任务。
- 未专门针对 NER 微调,需要自定义微调。
(2) uer/roberta-base-finetuned-cluener2020
- 针对 CLUENER2020 数据集微调的 RoBERTa 模型。
- 支持识别中文中的人名、地名、时间等实体。
(3) hfl/chinese-bert-wwm-ext
- 全词掩码预训练的中文 BERT,适合迁移到 NER 任务。
(4) hfl/chinese-roberta-wwm-ext
- 类似于上面的 BERT,全词掩码预训练,适合 NER。
2. 使用 Hugging Face 提取中文 NER
安装依赖
确保安装了 transformers 和 torch:
pip install transformers torch


8万+

被折叠的 条评论
为什么被折叠?



