加密哈希函数详解：MD5、SHA-256 与安全实践

更新于 2026-03-12 · 阅读约 9 分钟

加密哈希函数是信息安全的基石之一。从文件完整性校验到密码存储、数字签名，哈希函数无处不在。本文将深入讲解哈希函数的工作原理、主流算法对比以及安全使用的最佳实践。

什么是哈希函数？

哈希函数（Hash Function）是一种将任意长度的输入数据映射为固定长度输出的数学函数。其输出被称为哈希值（Hash Value）、摘要（Digest）或指纹（Fingerprint）。

加密哈希函数需要满足以下关键特性：

确定性：相同的输入永远产生相同的输出
快速计算：对任意输入能高效计算哈希值
雪崩效应：输入的微小变化导致输出剧烈变化
单向性：从哈希值无法还原出原始输入
抗碰撞性：几乎不可能找到两个不同输入产生相同哈希值

// 雪崩效应示例（SHA-256）
"Hello"  → 185f8db32271fe25f561a6fc938b2e264306ec304eda518007d1764826381969
"hello"  → 2cf24dba5fb0a30e26e83b2ac5b9e29e1b161e5c1fa7425e73043362938b9824
"hellp"  → 5f3efc4ead0462a94d72e73c985ccffc2a861fddaf57ed9e0b537f0780d4d594

// 仅改变一个字符，哈希值完全不同

主流哈希算法对比

算法	输出长度	安全状态	速度	典型用途
MD5	128 位 (32 字符)	❌ 已被破解	最快	文件校验和（非安全场景）
SHA-1	160 位 (40 字符)	❌ 已被破解	较快	已弃用，不推荐使用
SHA-256	256 位 (64 字符)	✅ 安全	中等	数字签名、区块链、TLS
SHA-512	512 位 (128 字符)	✅ 安全	中等	高安全需求场景
SHA-3	可变	✅ 安全	中等	SHA-2 的替代方案

MD5：经典但已不安全

MD5 由 Ron Rivest 于 1991 年设计，输出 128 位（16 字节）哈希值。2004 年，中国密码学家王小云团队首次展示了 MD5 碰撞攻击，证明 MD5 在安全场景中已不可靠。

# MD5 哈希示例
echo -n "Hello, World!" | md5
# 65a8e27d8879283831b664bd8b7f0ad4

# Python
import hashlib
hashlib.md5(b"Hello, World!").hexdigest()
# '65a8e27d8879283831b664bd8b7f0ad4'

🚫 安全警告：MD5 已被证明存在碰撞漏洞，不应用于密码存储、数字签名或任何依赖抗碰撞性的安全场景。仅可用于非安全用途的文件校验和。

SHA-256：当前推荐标准

SHA-256 属于 SHA-2 系列，由 NSA 设计，2001 年发布。它输出 256 位（32 字节）哈希值，目前没有已知的实际碰撞攻击。

# SHA-256 哈希示例
echo -n "Hello, World!" | shasum -a 256
# dffd6021bb2bd5b0af676290809ec3a53191dd81c7f70a4b28688a362182986f

# JavaScript (Web Crypto API)
async function sha256(message) {
  const msgBuffer = new TextEncoder().encode(message);
  const hashBuffer = await crypto.subtle.digest('SHA-256', msgBuffer);
  const hashArray = Array.from(new Uint8Array(hashBuffer));
  return hashArray.map(b => b.toString(16).padStart(2, '0')).join('');
}

await sha256("Hello, World!");
// "dffd6021bb2bd5b0af676290809ec3a53191dd81c7f70a4b28688a362182986f"

哈希函数的应用场景

1. 文件完整性校验

下载文件后，对比文件的哈希值与发布者提供的哈希值，可以验证文件未被篡改：

# 计算文件的 SHA-256
shasum -a 256 ubuntu-24.04.iso
# 3b6c89... ubuntu-24.04.iso

# 与官网提供的哈希值对比

2. 数据去重

将数据的哈希值作为唯一标识，快速检测重复内容。Git 就使用 SHA-1（正在迁移到 SHA-256）来标识每个 commit 和文件。

3. 数字签名

签名流程：先对文档计算哈希值，再用私钥加密哈希值。验证时用公钥解密，对比哈希值是否一致。

密码存储最佳实践

⚠️ 重要：绝对不要直接存储用户密码的 MD5 或 SHA-256 值！即使加盐的 SHA-256 也不够安全，因为通用哈希函数的计算速度太快，容易被暴力破解。

正确的密码存储应该使用专门设计的密码哈希函数，它们具有可调节的计算成本：

算法	推荐度	特点
Argon2id	⭐⭐⭐ 首选	2015 年 PHC 竞赛冠军，抗 GPU 和 ASIC 攻击
bcrypt	⭐⭐⭐ 推荐	久经考验，广泛支持，自动加盐
scrypt	⭐⭐ 推荐	内存密集型，抗硬件攻击
PBKDF2	⭐⭐ 可用	NIST 推荐，但不如上述算法安全

# Python 使用 bcrypt 存储密码
import bcrypt

# 注册：哈希密码
password = b"MySecurePassword123"
salt = bcrypt.gensalt(rounds=12)
hashed = bcrypt.hashpw(password, salt)
# b'$2b$12$LJ3m4ys3Lk0TSwMPdGE...'

# 登录：验证密码
if bcrypt.checkpw(password, hashed):
    print("密码正确")
else:
    print("密码错误")

常见安全陷阱

不加盐：相同密码产生相同哈希值，容易被彩虹表攻击
使用通用哈希函数：MD5/SHA-256 速度太快，GPU 可以每秒计算数十亿次
盐值太短或硬编码：每个用户应该有独立的随机盐值
自己实现加密算法：务必使用经过审计的加密库

💡 最佳实践总结：文件校验用 SHA-256，密码存储用 Argon2id 或 bcrypt，数字签名用 SHA-256 + RSA/ECDSA。永远不要自己造轮子。

🛠️ 在线哈希生成工具

打开 Hash 工具 →

加密哈希函数详解：MD5、SHA-256 与安全实践

什么是哈希函数？

主流哈希算法对比

MD5：经典但已不安全

SHA-256：当前推荐标准

哈希函数的应用场景

1. 文件完整性校验

2. 数据去重

3. 数字签名

密码存储最佳实践

常见安全陷阱

延伸阅读