hash算法总结

最新推荐文章于 2025-08-26 17:32:05 发布

原创最新推荐文章于 2025-08-26 17:32:05 发布 · 407 阅读

9 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#算法 #哈希算法

哈希算法是将任意长度数据转换为固定长度唯一值（哈希值）的算法，核心特性包括：

确定性：相同输入必产生相同输出
高效性：快速计算哈希值
抗碰撞性：难以找到不同输入产生相同输出
不可逆性：无法从哈希值反推原始数据

哈希算法分类

类型	典型算法	应用场景
加密哈希	SHA-256, MD5	数据完整性校验、数字签名
非加密哈希	MurmurHash, CRC32	哈希表、缓存键值计算
一致性哈希	Ketama	分布式系统数据分片

经典算法实现原理

4.1 MD5（128位）

def md5(message):
    # 1. 填充至512bit的倍数
    # 2. 分块处理（每512bit）
    # 3. 每块进行64轮位运算
    # 4. 最终输出128位哈希值
    return hash_value

问题：已知可构造碰撞，不推荐安全场景使用

4.2 SHA-256（256位）

void SHA256_Transform(uint32_t state[8], const uint8_t block[64]) {
    // 消息扩展为64个32位字
    // 64轮加密运算
    // 更新哈希状态
}

优势：目前无可行碰撞攻击

4.3 MurmurHash（非加密）

int murmur32(String key, int seed) {
    // 混合位运算
    // 最终 avalanche（雪崩处理）
    return hash; 
}

特点：计算速度比加密哈希快10倍以上

安全攻防案例

攻击类型	防御措施	受影响算法
碰撞攻击	改用SHA-3	MD5, SHA-1
彩虹表攻击	加盐+慢哈希（如PBKDF2）	所有加密哈希
长度扩展攻击	使用HMAC结构	MD5, SHA-1, SHA-2

加密场景
- 推荐：SHA-256/512, SHA-3, BLAKE3
- 弃用：MD5, SHA-1
非加密场景
- 高速需求：xxHash, MeowHash
- 一致性：CRC32（网络校验）, CityHash（大数据）
密码存储
- 必须使用：PBKDF2, bcrypt, scrypt, Argon2

8. 性能测试对比

算法	速度（MB/s）	碰撞率	适用场景
MD5	900	高	遗留系统校验
SHA-256	300	极低	区块链/数字证书
MurmurHash	1500	中	哈希表、缓存
xxHash	5000	低	大数据处理

总结

哈希算法是一种将任意长度数据转换为固定长度唯一值的算法，具有确定性、高效性、抗碰撞性和不可逆性，广泛应用于数据校验（如文件完整性验证）、密码存储（需加盐和慢哈希）、区块链（如比特币的双SHA-256）和哈希表优化（如Java的扰动函数）等场景，其中安全场景推荐使用SHA-256/SHA-3，高性能需求可选xxHash/MurmurHash，密码存储必须采用PBKDF2/bcrypt等专用算法，而MD5/SHA-1等老旧算法因存在碰撞风险应避免在安全场景使用。