该库是自然处理处理的库,有如下功能:
中文分词
词性标注
关键词提取
文本摘要
依存句法分析
短语提取
1 安装
直接使用pip install pyhanlp进行安装,安装后在第一次使用时,当运行from pyhanlp import *时,会下载hanlp的数据文件,如图:

但这个文件比较大,通常下载失败,可以进行手动下载并放到要求的路径下。去官网下载data-for-1.7.5.zip(会一直更新,下载最新版的即可),下载链接:
https://github.com/hankcs/HanLP/releases

找到 data-for-1.7.2.zip 进行下载,然后把下载的文件放到该目录下:
F(某盘):\Anaconda3\Lib\site-packages\pyhanlp\static
再执行from pyhanlp import *,完成自动解压。

本文介绍了Python的自然语言处理库PyHanLP,包括安装方法和主要功能:中文分词、词性标注、关键词提取、文本摘要、依存句法分析和短语提取。例如,分词功能可以将句子‘异地贷款需要具备哪些条件’准确切分并标注词性;关键词提取能从文本中找出核心词汇;文本摘要能提取关键句子;依存句法分析能展示句子结构;短语提取则能抓取重要短语。此外,还提供了相关的可视化工具辅助理解。
&spm=1001.2101.3001.5002&articleId=123284247&d=1&t=3&u=b9cd162b60fb4006b745e09e9600b531)
1213

被折叠的 条评论
为什么被折叠?



