Python数据分析概述
数据分析的概述
数据分析:用适当的统计分析方法将收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
数据分析的类别:描述性数据分析、探索性数据分析、验证性数据分型。
广义的数据分析包括狭义数据分析和数据挖掘。
1、Jupyter Notebook简介

Jupyter Notebook是以网页形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会在代码块下显示的程序;如在编码过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。
2、Jupyter Notebook的键盘输入模式
(1)编辑模式
当条框单元为绿色时,此时处于编辑模式。编辑模式下我们主要记住代码补全、代码提示和运行单元的快捷键。

3、Jupyter Notebook的主要特点
① 编程时具有语法高亮、缩进、tab补全的功能。
② 可直接通过浏览器运行代码,同时在代码块下方展示运行结果。
③ 以富媒体格式展示计算结果。富媒体格式包括:HTML,LaTeX,PNG,SVG等。
④ 对代码编写说明文档或语句时,支持Markdown语法。
⑤ 支持使用LaTeX编写数学性说明。
4、组成部分
① 网页应用
网页应用即基于网页形式的、结合了编写说明文档、数学公式、交互计算和其他富媒体形式的工具。简言之,网页应用是可以实现各种功能的工具。
② 文档
即Jupyter Notebook中所有交互计算、编写说明文档、数学公式、图片以及其他富媒体形式的输入和输出,都是以文档的形式体现的。
这些文档是保存为后缀名为.ipynb的JSON格式文件,不仅便于版本控制,也方便与他人共享。
此外,文档还可以导出为:HTML、LaTeX、PDF等格式。
2.操作安装
最简单的安装方式就是通过 Anaconda 进行安装,Anaconda 是使用最广泛的环境管理工具,并且它可以预先安装很多常用的第三方库,包括 numpy 、pandas 、matplotlib 等。
除了通过 Anaconda 安装,也可以直接采用 pip
![]()
一、列表定义
1.列表定义:能装东西的东西
2.通过一个变量存储大量信息
二、列表方法—增
2.1 插入
插入(insert(插入的位置(下标), 插入的数据))


2.2 追加
append(),把元素插入到列表最后面

2.3 合并
extend (),把两个列表进行合并,添加到最后

2.4 嵌套
列表的嵌套(多为数组)

三、列表方法—删
3.1del()
del():根据下标进行删除


3.2 remove()
remove():通过元素名称进行删除
1.通过指定元素名删除,会删除从左开始找到的第⼀个元素,如果有多个,则只删除找到的第⼀个
2.如果元素不存在在列表中则会报错

3.3 pop()
pop():
1.当列表中没有数据时使用pop会报错
2.默认删除最后一个元素并返回被删除的值


3.4 clear()
clear():清空

四、列表方法—改
根据下标直接修改


五、列表方法—查
5.1 in
in:使用in判断元素是否存在在列表中

5.2 index()
index():查询列表的下标,查询到从左往右的第一个下标(如果元素不在列表会报错)

5.3 count ()
count():查询到列表元素的个数

5.4 命令嵌套
一条语句删除查询到的元素(命令嵌套)

六、列表方法—切片
6.1 切片
切片取出列表中的某一段:列表名[start:end],不包含end值,顾头不顾尾

6.2 步长
跳着打印

七、列表方法—排序
7.1 反转
reverse():没有返回值只是把列表逆转


7.2 排序
sort():排序数组里的数据类型一致

7.3 列表循环
for

&spm=1001.2101.3001.5002&articleId=139460403&d=1&t=3&u=a3c65a2db1ae47599c1a3f8cdc1a2f78)
536

被折叠的 条评论
为什么被折叠?



