理解 SHA-256 哈希：原理与重要性

什么是 SHA-256？

SHA-256（安全哈希算法 256 位）是一种密码学哈希函数，它可以从任意输入生成固定大小的 256 位（32 字节）摘要。它属于 SHA-2 家族，由 NSA 设计并于 2001 年由 NIST 发布。无论输入大小——一个字符还是一个 TB 的文件——SHA-256 总是输出一个 64 字符的十六进制字符串。

SHA-256("hello") = 2cf24dba5fb0a30e26e83b2ac5b9e29e1b161e5c1fa7425e73043362938b9824
SHA-256("Hello") = 185f8db32271fe25f561a6fc938b2e264306ec304eda518007d1764826381969

注意输入的微小变化（大小写不同）会产生完全不同的哈希值。这就是所谓的雪崩效应——密码学哈希函数的基本特性。

SHA-256 的关键特性

确定性：相同的输入始终产生相同的哈希值
单向性：从哈希值反推输入在计算上不可行
抗碰撞性：找到两个不同输入产生相同哈希值的可能性极低
雪崩效应：输入的微小变化会导致输出的剧烈变化
固定输出大小：始终为 256 位，与输入大小无关

SHA-256 的工作原理（简化版）

SHA-256 以 512 位块为单位处理数据，通过 64 轮数学运算完成。以下是简化概述：

预处理：对消息进行填充，使其长度为 512 位的倍数
初始化哈希值：使用前 8 个素数平方根的小数部分导出的八个 32 位常量
处理每个块：对每个 512 位块：
- 将 16 个字扩展为 64 个字
- 使用位运算（AND、XOR、ROTR、SHR）和模加法运行 64 轮压缩
- 更新哈希值
输出：将八个 32 位哈希值连接起来，产生 256 位摘要

// 在浏览器中计算 SHA-256
async function sha256(message) {
  const encoder = new TextEncoder();
  const data = encoder.encode(message);
  const hashBuffer = await crypto.subtle.digest('SHA-256', data);
  const hashArray = Array.from(new Uint8Array(hashBuffer));
  return hashArray.map(b => b.toString(16).padStart(2, '0')).join('');
}

sha256('hello').then(hash => console.log(hash));
// "2cf24dba5fb0a30e26e83b2ac5b9e29e1b161e5c1fa7425e73043362938b9824"

你可以使用 CodeKit 上的哈希生成器工具即时计算 SHA-256 哈希值。

SHA-256 vs MD5

MD5 曾经是最流行的哈希函数，但现在已被认为是不安全的。以下是 SHA-256 与 MD5 的对比：

特性	MD5	SHA-256
输出大小	128 位	256 位
哈希长度	32 个十六进制字符	64 个十六进制字符
碰撞攻击	已有实际攻击	不可行
速度	更快	较慢
安全状态	已破解	安全
是否推荐	否	是

为什么 MD5 已不安全

2004 年，研究人员演示了对 MD5 的实际碰撞攻击——找到两个不同输入产生相同的哈希值。这意味着攻击者可以创建一个与合法文件具有相同 MD5 哈希值的恶意文件。

// MD5 碰撞示例（概念性）
// 以下两个不同输入可以产生相同的 MD5 哈希值：
// md5(input1) === md5(input2) — 在 MD5 中这是可能的！

// SHA-256：从未发现过实际碰撞

切勿将 MD5 用于安全目的。如果需要与遗留系统兼容，请考虑使用 SHA-256 作为替代。

实际应用场景

1. 密码哈希

永远不要以明文存储密码。使用专用的密码哈希函数配合盐值进行哈希：

// 推荐：使用 bcrypt、scrypt 或 Argon2 处理密码
// 单独使用 SHA-256 不适合密码（速度太快，容易被暴力破解）

// 如果必须使用 SHA-256，至少使用带盐值的 HMAC：
const crypto = require('crypto');
const salt = crypto.randomBytes(16);
const hash = crypto.pbkdf2Sync('password', salt, 100000, 64, 'sha512');

2. 数据完整性验证

SHA-256 非常适合验证文件是否被篡改：

// 验证下载的文件
const fileBuffer = fs.readFileSync('downloaded-file.zip');
const hash = crypto.createHash('sha256').update(fileBuffer).digest('hex');

if (hash === expectedHash) {
  console.log('文件完整性验证通过！');
} else {
  console.log('文件已被修改！');
}

3. 数字签名

SHA-256 用于 SSL/TLS 证书、代码签名和文档签名，确保真实性。

4. 区块链

比特币和许多其他加密货币使用 SHA-256 作为工作量证明和交易验证的核心哈希算法。

5. Git 提交哈希

Git 使用 SHA-1（历史上）并正在过渡到 SHA-256，用于标识提交、树和对象。

哈希碰撞详解

哈希碰撞是指两个不同的输入产生相同的哈希输出。根据鸽巢原理，任何哈希函数都必然存在碰撞——可能的输入是无限的，但输出是有限的。

然而，对于 SHA-256，找到碰撞需要大约 2^128 次运算（根据生日悖论），这在当前和可预见的未来技术条件下是计算上不可行的。打个比方，如果地球上每台计算机每秒检查 10 亿个哈希值，找到碰撞所需的时间仍远超宇宙年龄。

性能考量

SHA-256 比 MD5 慢，但对于大多数应用来说速度足够。以下是在现代硬件上的近似速度：

操作	速度
小字符串	< 1ms
1 MB 文件	~2ms
1 GB 文件	~2 秒

对于密码哈希，SHA-256 的速度实际上还不够慢——应使用 bcrypt 或 Argon2 等专用函数，它们故意设计得很慢以抵抗暴力破解攻击。

总结

SHA-256 是一种稳健、广泛可信的密码学哈希函数，在现代安全基础设施中扮演着关键角色。无论你是在验证文件完整性、实现身份认证，还是构建分布式系统，理解 SHA-256 都是必要的。只需记住：哈希用于完整性和验证，不是用来存储密码的——密码存储请使用专用的密码哈希函数。

准备好计算哈希值了吗？试试 CodeKit 上的哈希生成器——支持 SHA-256、MD5、SHA-1 等，所有计算都在浏览器本地完成。