Rust 中的自定义序列化逻辑：从原理到实践的深度探索

lxy20070920

466人浏览 · 2025-10-30 21:57:21

lxy20070920 · 2025-10-30 21:57:21 发布

Rust 中的自定义序列化逻辑：从原理到实践的深度探索

引言

在 Rust 生态中，serde 框架凭借其零成本抽象和类型安全的特性，成为了序列化与反序列化的事实标准。然而，在实际工程实践中，我们经常会遇到需要突破 derive 宏默认行为的场景。深入理解自定义序列化逻辑，不仅能够让我们应对复杂的业务需求，更能够帮助我们理解 Rust 类型系统与 trait 系统的精妙设计。

为什么需要自定义序列化

标准的派生宏虽然便捷，但在某些场景下显得力不从心。比如处理遗留系统的非标准 JSON 格式、实现敏感数据的加密序列化、优化大型数据结构的性能，或是在序列化过程中进行数据验证与转换。这些场景要求我们对序列化过程拥有细粒度的控制能力。

核心机制剖析

Serde 的设计哲学体现了 Rust 的核心理念：通过 trait 抽象实现灵活性，通过泛型与关联类型保证类型安全。Serialize trait 定义了序列化的契约，而 Serializer trait 则抽象了不同格式（JSON、YAML、MessagePack 等）的底层实现。这种分离使得我们可以编写格式无关的序列化逻辑。

自定义序列化的关键在于理解状态机模型。当序列化一个复杂结构时，serializer 需要维护嵌套状态，这通过 SerializeStruct、SerializeSeq 等关联类型实现。这种设计既保证了类型安全，又避免了运行时开销。

实践案例：金融数据的精确序列化

在金融领域，浮点数的精度问题至关重要。让我们看一个将浮点数序列化为固定精度字符串的实现：

use serde::{Serialize, Serializer};
use serde::ser::SerializeStruct;

#[derive(Debug)]
struct MoneyAmount {
    value: f64,
    currency: String,
}

impl Serialize for MoneyAmount {
    fn serialize<S>(&self, serializer: S) -> Result<S::Ok, S::Error>
    where
        S: Serializer,
    {
        let mut state = serializer.serialize_struct("MoneyAmount", 2)?;
        // 关键：将浮点数格式化为固定2位小数的字符串
        let formatted_value = format!("{:.2}", self.value);
        state.serialize_field("value", &formatted_value)?;
        state.serialize_field("currency", &self.currency)?;
        state.end()
    }
}

进阶实践：条件序列化与数据脱敏

更复杂的场景是根据上下文动态决定序列化策略。例如，在日志系统中，我们需要对敏感字段进行脱敏：

use serde::{Serialize, Serializer};

struct User {
    id: u64,
    username: String,
    email: String,
    phone: String,
}

impl Serialize for User {
    fn serialize<S>(&self, serializer: S) -> Result<S::Ok, S::Error>
    where
        S: Serializer,
    {
        use serde::ser::SerializeStruct;
        let mut state = serializer.serialize_struct("User", 4)?;
        
        state.serialize_field("id", &self.id)?;
        state.serialize_field("username", &self.username)?;
        
        // 邮箱脱敏：只保留前缀和域名
        let masked_email = mask_email(&self.email);
        state.serialize_field("email", &masked_email)?;
        
        // 手机号脱敏：只显示后四位
        let masked_phone = mask_phone(&self.phone);
        state.serialize_field("phone", &masked_phone)?;
        
        state.end()
    }
}

fn mask_email(email: &str) -> String {
    if let Some(at_pos) = email.find('@') {
        let (prefix, domain) = email.split_at(at_pos);
        if prefix.len() > 2 {
            format!("{}***{}", &prefix[..2], domain)
        } else {
            format!("***{}", domain)
        }
    } else {
        "***".to_string()
    }
}

fn mask_phone(phone: &str) -> String {
    let len = phone.len();
    if len > 4 {
        format!("{}****", &phone[len-4..])
    } else {
        "****".to_string()
    }
}