NumPy 入门：科学计算的核心库

原创已于 2025-07-31 16:19:43 修改 · 751 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#numpy

于 2025-07-31 16:19:42 首次发布

NumPy（Numerical Python）是 Python 中用于科学计算的核心库，专为处理数组和矩阵设计。它能直接对整个数组执行数学运算，大幅减少循环语句的使用，同时提供了丰富的数学函数，让数据处理和数值计算变得高效简洁。

无论是数据分析、机器学习还是科学计算，NumPy 都是基础工具 —— 后续的 Pandas、Matplotlib 等库都依赖于它的数据结构。

NumPy 不是 Python 标准库，需手动安装，推荐使用国内源加速：

# 方法1：使用pip
pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple

# 方法2：使用conda（适合Anaconda环境）
conda install numpy

惯例是导入时起别名np，方便后续使用：

import numpy as np

Ndarray 是 NumPy 的核心数据结构，代表 “N 维数组”，是一系列同类型数据的集合，以 0 为起始下标索引。它的关键特点：

NumPy 提供了多种创建数组的函数，覆盖不同场景需求：

NumPy 的random模块提供了多种随机数生成函数，适合模拟和抽样：

函数	作用	示例
`np.random.rand(d0,d1...)`	生成 [0,1) 之间的随机数（均匀分布）	`np.random.rand(2,3)` → 2x3 随机数组
`np.random.random(size)`	生成 [0,1) 随机数（一维数组）	`np.random.random(5)` → 长度 5 的一维随机数组
`np.random.randint(low, high, size)`	生成 [low, high) 的整数随机数	`np.random.randint(1,10,(2,2))` → 2x2 的 1-9 整数
`np.random.randn(d0,d1...)`	生成标准正态分布（均值 0，标准差 1）的随机数	`np.random.randn(3)` → 3 个符合标准正态分布的数
`np.random.normal(loc, scale, size)`	生成高斯分布随机数	`np.random.normal(loc=1, scale=2, size=5)` → 均值 1、标准差 2 的 5 个数

通过属性可以快速了解数组的基本信息：

Ndarray 的索引和切片与 Python 列表类似，但支持多维操作，语法简洁：

arr = np.arange(15).reshape(5,3)  # 创建5行3列的数组
print(arr[2][1])  # 第3行第2列（下标从0开始）→ 7
print(arr[2,1])   # 等价写法 → 7

# 取第3行及之后的所有行
print(arr[2:])  # → [[6 7 8], [9 10 11], [12 13 14]]

# 取第2-4行（不含第5行），第2列及之后
print(arr[1:4, 1:])  # → [[4 5], [7 8], [10 11]]

用于简化多维数组的索引，自动补全维度：

# 取所有行的第2列
print(arr[..., 1])  # → [1 4 7 10 13]

# 取第2行的所有列
print(arr[1, ...])  # → [3 4 5]

生成一个 3×3 的对角矩阵（对角线为 1，其余为 0）：
```
np.eye(3)
```
创建长度为 10 的数组，值在 0~1 之间（不含 0 和 1）：
```
np.random.random(10)  # 或 np.linspace(0,1,12)[1:-1]
```
创建长度为 10 的全 0 数组，第 5 个元素为 1（下标从 0 开始）：
```
arr = np.zeros(10)
arr[4] = 1  # 第5个元素下标为4
```

NumPy 是数据科学的基石，掌握其数组创建、属性和索引操作，能为后续数据分析和机器学习打下坚实基础。后续可进一步学习数组的数学运算、广播机制等高级特性～