一文读懂 base64：编码原理、使用场景与性能代价

如果你曾在发送邮件附件、内嵌图片或将二进制数据塞进 JSON 时遇到乱码，base64 编码一定会出现在解决方案清单里。本文用简明的技术视角剖析其历史渊源、使用时机与隐藏开销，并给出可落地的场景指南。

什么是 base64 编码？

base64 编码是一套把任意二进制序列转换为 64 个“安全字符”的算法。这里的 64 个字符固定为：

A-Z、a-z、0-9、+ 与 /

看起来是一堆“乱码”，却能在只接受纯文本的环境中被视为合法输入。

工作流程：

最终长度膨胀约 33%，换来在受限系统中的顺畅通行。

一句话总结：base64 通过可打印字符包裹原始数据，给老协议“遮丑”。

RFC 4648 明文规定：base64 仅用于 storage 或 transport 受限于 ASCII 的环境。常见场景：

若不满足以上条件，使用 base64 只会让系统更慢、更重。

Q1：base64 算加密吗？
A：绝对不是。任何人拿到编码结果都能立即解码，它只是视觉混淆而非安全保障。

Q2：能否压缩后再 base64？
A：可以。先 gzip/brotli 可以减少膨胀；缺点是 CPU 压力和浏览器解码复杂度同步提高。

上世纪 80 年代，SMTP 只能承载 7-bit ASCII 文本，非英文字符与二进制附件统统被拦下。于是 BASE64 被引入，作为 MIME 标准的一部分：

现代邮箱已支持 8BIT-MIME，但 仍有老旧服务器拒绝新规范，因此 base64 至今仍是邮件系统的保底方案。

ASCII 共有 128 个码位，为什么不全用？

最终只能选出 64 个在所有主流系统都“安全”的字符，再通过填充 = 来解决长度不整除。

许多人误以为 HTTP 必须把所有二进制转成 base64。事实正好相反：

简记：只有报文头部需要顾虑 ASCII 兼容性；报文体可视具体业务自由选择。

浏览器支持 data:image/png;base64,... 的初衷是：

但是随着 33% 体积暴增 带来的首包增大、无法压缩、无法缓存，总耗时经常 大于级联请求。

目前没有更好替代方案的原因：

结论：Data URL 适合 1 KB 左右的小精灵图；大图一律走传统外链。

Q3：除 base64 外还有其他文本编码可选吗？
A：base58、base85 体积更小，但缺乏浏览器原生支持，需额外 JS 解码，成本往往更高。

Q4：Cookie 能存 base64 吗？
A：可以，但要使用 base64url 变体，把 +/= 换成 -_ 并省略末尾填充，避免与 URI 保留字符冲突。

Q5：服务端如何节省 base64 CPU？
A：可提前在构建阶段把静态资源编码，遇到 Accept-Encoding 兼容时再发送原始文件，避免运行时解码。

如果当下环境不再受 7-bit 或 ASCII 限制，优先使用原生二进制传输，让 base64 编码回归其历史角色——“最后的兼容桥梁”，而非“默认方案”。