1.数据分析包
numpy
scipy
pandas
matplotlib
Scikit-Learn
2.文本处理包
NLTK
TextBlob
Pattern
Gensim
推荐的ipython+notebook是啥??
3.文本挖掘
基本特征:MI值,卡方检验,信息增益,频率,交叉熵
文本分类
文本聚类
情感分析
python与数据科学
最新推荐文章于 2025-04-13 21:55:40 发布
本文介绍了数据科学中常用的数据分析包,如numpy、pandas、Scikit-Learn等,以及文本处理包如NLTK、Gensim。此外,还探讨了文本挖掘的基本特征和方法,包括文本分类、聚类及情感分析。

189

被折叠的 条评论
为什么被折叠?



