AWS Lambda函数开发

闲人编程

475人浏览 · 2026-03-13 07:00:00

闲人编程 · 2026-03-13 07:00:00 发布

『宝藏代码胶囊开张啦！』—— 我的 CodeCapsule 来咯！✨写代码不再头疼！我的新站点 CodeCapsule 主打一个 “白菜价”+“量身定制”！无论是卡脖子的毕设/课设/文献复现，需要灵光一现的算法改进，还是想给项目加个“外挂”，这里都有便宜又好用的代码方案等你发现！低成本，高适配，助你轻松通关！速来围观 👉 CodeCapsule官网

AWS Lambda函数开发实战指南：从入门到生产最佳实践

引言

在上一篇文章中，我们深入探讨了Serverless架构模式的核心理念。作为Serverless生态中最核心的计算服务，AWS Lambda自2014年推出以来，已经彻底改变了无数开发者和企业的应用构建方式。开发者只需编写代码并将其上传到AWS，剩下的所有事情——服务器的预置、容量规划、自动扩缩容、安全补丁更新——都交给AWS处理。

本文将聚焦于AWS Lambda函数的实际开发，特别是使用Python进行函数构建的全流程。我们将从基础概念入手，逐步深入到函数结构、事件处理、性能优化、调试监控等生产环境必须掌握的技能，并通过完整的代码示例帮助您快速上手。

1. AWS Lambda 基础概念

1.1 什么是Lambda函数？

AWS Lambda是一种事件驱动的无服务器计算服务，允许开发者运行代码而无需预置或管理服务器。Lambda函数的核心是包含一段粒度很细的代码，用于执行特定任务。函数可以通过多种机制触发，包括AWS SDK、HTTP端点或其他AWS服务的配置事件。

Lambda函数的执行模型可以用下图表示：

1.2 执行环境生命周期

理解Lambda的执行环境生命周期是编写高效函数的关键。当您首次调用函数时，Lambda服务会创建一个执行环境，这个过程包括：

创建微型虚拟机：Lambda服务创建一个Linux主机环境
启动语言运行时：例如Python解释器
初始化运行时组件：加载Lambda提供的运行时库
加载函数代码：导入您的模块和执行初始化代码
执行处理程序：运行您的函数处理程序

这个完整的初始化过程被称为冷启动。如果函数在短时间内被再次调用，Lambda会复用已有的执行环境，这称为热启动，可以显著降低延迟。

2. Python Lambda函数开发基础

2.1 支持的Python运行时

AWS Lambda支持多个Python版本，包括3.9到3.14等。每个运行时都预装了AWS SDK for Python（Boto3）和Botocore，您可以直接在代码中导入使用。

要查看当前运行时中包含的SDK版本，可以使用以下代码：

import boto3
import botocore

def lambda_handler(event, context):
    print(f"boto3 version: {boto3.__version__}")
    print(f"botocore version: {botocore.__version__}")
    return {
        'statusCode': 200,
        'body': 'SDK versions logged'
    }

2.2 函数基本结构

一个标准的Python Lambda函数包含三个核心部分：导入语句、全局初始化代码和处理程序函数。

import json
import os
import boto3
from datetime import datetime

# 全局初始化（在执行环境生命周期内只执行一次）
dynamodb = boto3.resource('dynamodb')
table_name = os.environ.get('TABLE_NAME', 'default-table')
table = dynamodb.Table(table_name)

def lambda_handler(event, context):
    """
    Lambda函数入口点
    
    Parameters:
    - event: 触发事件的数据（字典类型）
    - context: 运行时信息对象
    
    Returns:
    - 响应对象（将被序列化为JSON）
    """
    # 记录请求信息
    print(f"Received event: {json.dumps(event)}")
    print(f"Request ID: {context.aws_request_id}")
    
    try:
        # 解析事件数据
        http_method = event.get('httpMethod', 'GET')
        path = event.get('path', '/')
        
        # 业务逻辑处理
        if http_method == 'GET':
            result = handle_get_request(event)
        elif http_method == 'POST':
            result = handle_post_request(event)
        else:
            result = {
                'statusCode': 405,
                'body': json.dumps({'error': 'Method not allowed'})
            }
        
        return result
        
    except Exception as e:
        print(f"Error processing request: {str(e)}")
        return {
            'statusCode': 500,
            'body': json.dumps({'error': 'Internal server error'})
        }

def handle_get_request(event):
    """处理GET请求"""
    # 业务逻辑实现
    return {
        'statusCode': 200,
        'headers': {'Content-Type': 'application/json'},
        'body': json.dumps({
            'message': 'GET request processed successfully',
            'timestamp': datetime.now().isoformat()
        })
    }

def handle_post_request(event):
    """处理POST请求"""
    # 解析请求体
    body = json.loads(event.get('body', '{}'))
    
    # 业务逻辑实现
    return {
        'statusCode': 201,
        'body': json.dumps({
            'message': 'POST request processed',
            'received_data': body
        })
    }

2.3 事件与上下文对象详解

事件对象（event） 是一个字典，包含触发函数的数据。不同事件源的数据结构各不相同：

# API Gateway事件示例
api_gateway_event = {
    "httpMethod": "POST",
    "path": "/users",
    "headers": {
        "Content-Type": "application/json",
        "Authorization": "Bearer token123"
    },
    "queryStringParameters": {
        "page": "1",
        "limit": "10"
    },
    "body": "{\"name\":\"John\",\"email\":\"john@example.com\"}",
    "isBase64Encoded": False
}

# S3事件示例
s3_event = {
    "Records": [
        {
            "eventSource": "aws:s3",
            "eventName": "ObjectCreated:Put",
            "s3": {
                "bucket": {"name": "my-bucket"},
                "object": {"key": "path/to/file.jpg"}
            }
        }
    ]
}

# DynamoDB流事件示例
dynamodb_event = {
    "Records": [
        {
            "eventName": "INSERT",
            "dynamodb": {
                "Keys": {"userId": {"S": "123"}},
                "NewImage": {
                    "userId": {"S": "123"},
                    "name": {"S": "John Doe"},
                    "email": {"S": "john@example.com"}
                }
            }
        }
    ]
}

上下文对象（context） 提供了函数运行时信息：

def lambda_handler(event, context):
    # 获取请求ID（用于追踪）
    request_id = context.aws_request_id
    
    # 获取函数信息
    function_name = context.function_name
    function_version = context.function_version
    memory_limit = context.memory_limit_in_mb
    
    # 获取剩余执行时间（毫秒）
    remaining_time = context.get_remaining_time_in_millis()
    
    # 获取日志相关
    log_group = context.log_group_name
    log_stream = context.log_stream_name
    
    print(f"Function: {function_name}:{function_version}")
    print(f"Remaining time: {remaining_time}ms")
    
    return {"status": "ok"}

2.4 响应格式与Unicode处理

从Python 3.12开始，Lambda函数的JSON响应会直接返回Unicode字符，而不是转义序列。例如：

# Python 3.11及更早版本
def lambda_handler(event, context):
    return {"message": "こんにちは"}
# 实际响应: {"message": "\u3053\u3093\u306b\u3061\u306f"}

# Python 3.12及以上版本
def lambda_handler(event, context):
    return {"message": "こんにちは"}
# 实际响应: {"message": "こんにちは"}  (节省存储空间)

这一变化可以减小响应大小，让更大的响应能够适应同步函数6MB的最大负载限制。

3. 高级开发模式与最佳实践

3.1 客户端复用模式

在Lambda函数中，永远不要在handler内部创建新的AWS服务客户端。正确的做法是在handler外部初始化客户端，这样可以在多次调用间复用连接，显著提升性能。

import boto3
from botocore.config import Config

# ✅ 正确：在全局作用域初始化客户端（复用）
config = Config(
    retries={'max_attempts': 3, 'mode': 'adaptive'},
    connect_timeout=5,
    read_timeout=10
)
dynamodb = boto3.resource('dynamodb', config=config)
s3_client = boto3.client('s3')
table = dynamodb.Table(os.environ['TABLE_NAME'])

def lambda_handler(event, context):
    try:
        # ✅ 正确：复用全局客户端
        response = table.get_item(Key={'id': event['id']})
        
        # ✅ 正确：复用S3客户端
        s3_client.get_object(
            Bucket='my-bucket',
            Key='config.json'
        )
        
        return {'statusCode': 200, 'body': 'Success'}
    except Exception as e:
        print(f"Error: {str(e)}")
        raise

# ❌ 错误：在handler内初始化客户端（每次调用都新建）
def bad_lambda_handler(event, context):
    # 每次调用都创建新连接，导致性能下降
    dynamodb = boto3.resource('dynamodb')  # 不要这样做！
    table = dynamodb.Table('my-table')
    # ...

3.2 优雅关闭与资源清理

Python 3.12及更高版本的运行时支持通过SIGTERM信号进行优雅关闭。当Lambda关闭执行环境时，会发送SIGTERM信号，您可以在函数中捕获此信号并清理数据库连接等资源。

import signal
import sys
import time

# 全局资源
db_connection = None

def cleanup_resources(signum, frame):
    """优雅关闭时清理资源"""
    print("Received SIGTERM, cleaning up resources...")
    global db_connection
    if db_connection:
        db_connection.close()
        print("Database connection closed")
    sys.exit(0)

# 注册信号处理器
signal.signal(signal.SIGTERM, cleanup_resources)

def init_db_connection():
    """初始化数据库连接"""
    # 模拟数据库连接
    print("Initializing database connection...")
    time.sleep(1)
    return {"connection": "db-connection-object"}

def lambda_handler(event, context):
    global db_connection
    
    # 延迟初始化连接
    if db_connection is None:
        db_connection = init_db_connection()
    
    # 业务逻辑
    print("Processing request...")
    time.sleep(2)
    
    return {
        'statusCode': 200,
        'body': 'Request processed successfully'
    }

3.3 错误处理与重试策略

Lambda函数支持三种调用类型，错误处理行为各不相同：

import json
import time
from botocore.exceptions import ClientError

class RetryableError(Exception):
    """可重试的自定义异常"""
    pass

class NonRetryableError(Exception):
    """不可重试的自定义异常"""
    pass

def lambda_handler(event, context):
    """
    演示不同错误类型的处理
    """
    try:
        # 1. 输入验证
        if 'id' not in event:
            # 语法错误：立即失败，不可重试
            raise NonRetryableError("Missing required field: id")
        
        # 2. 业务逻辑
        result = process_data(event['id'])
        
        # 3. 调用外部服务
        try:
            external_result = call_external_service(result)
        except ClientError as e:
            if e.response['Error']['Code'] == 'ThrottlingException':
                # 节流错误：可重试
                raise RetryableError("Service throttled, retry later") from e
            else:
                # 其他AWS错误：根据情况决定
                raise
        
        return {
            'statusCode': 200,
            'body': json.dumps({'result': external_result})
        }
        
    except NonRetryableError as e:
        # 不可重试错误：记录并返回错误，不触发重试
        print(f"Non-retryable error: {str(e)}")
        return {
            'statusCode': 400,
            'body': json.dumps({'error': str(e)})
        }
        
    except RetryableError as e:
        # 可重试错误：重新抛出异常以触发Lambda重试
        print(f"Retryable error: {str(e)}")
        raise  # Lambda会根据函数的重试策略重新调用
        
    except Exception as e:
        # 未知错误：根据业务逻辑决定
        print(f"Unexpected error: {str(e)}")
        # 如果是异步调用，可以抛出异常让Lambda重试
        if context.invoked_function_arn.endswith(':async'):
            raise
        # 同步调用则返回错误
        return {
            'statusCode': 500,
            'body': json.dumps({'error': 'Internal server error'})
        }

def process_data(item_id):
    """业务逻辑处理"""
    # 模拟处理
    return {"id": item_id, "processed": True}

def call_external_service(data):
    """调用外部服务"""
    # 模拟外部调用
    time.sleep(0.5)
    # 模拟随机失败
    import random
    if random.random() < 0.3:
        raise ClientError(
            error_response={'Error': {'Code': 'ThrottlingException'}},
            operation_name='CallService'
        )
    return {"external": "success"}

3.4 环境变量与配置管理

切勿在代码中硬编码配置信息。使用环境变量、AWS Secrets Manager或Parameter Store管理配置。

import os
import json
import boto3
from botocore.exceptions import ClientError

# 从环境变量获取配置
TABLE_NAME = os.environ.get('TABLE_NAME', 'default-table')
REGION = os.environ.get('AWS_REGION', 'us-east-1')
LOG_LEVEL = os.environ.get('LOG_LEVEL', 'INFO')
ENVIRONMENT = os.environ.get('ENVIRONMENT', 'dev')

# 初始化Secrets Manager客户端
secrets_client = boto3.client('secretsmanager', region_name=REGION)
ssm_client = boto3.client('ssm', region_name=REGION)

def get_secret(secret_name):
    """从Secrets Manager获取密钥"""
    try:
        response = secrets_client.get_secret_value(SecretId=secret_name)
        return json.loads(response['SecretString'])
    except ClientError as e:
        print(f"Error getting secret {secret_name}: {str(e)}")
        raise

def get_parameter(param_name, with_decryption=True):
    """从Parameter Store获取参数"""
    try:
        response = ssm_client.get_parameter(
            Name=param_name,
            WithDecryption=with_decryption
        )
        return response['Parameter']['Value']
    except ClientError as e:
        print(f"Error getting parameter {param_name}: {str(e)}")
        raise

def lambda_handler(event, context):
    """
    演示配置管理最佳实践
    """
    # 1. 从环境变量获取基础配置
    environment = ENVIRONMENT
    table_name = TABLE_NAME
    
    # 2. 从Parameter Store获取动态配置
    feature_flags = json.loads(
        get_parameter(f"/{environment}/app/features", False)
    )
    
    # 3. 从Secrets Manager获取敏感信息
    if feature_flags.get('use_database', False):
        db_credentials = get_secret(f"{environment}/db/credentials")
        
    # 4. 根据配置执行业务逻辑
    return {
        'statusCode': 200,
        'body': json.dumps({
            'environment': environment,
            'table': table_name,
            'features': feature_flags
        })
    }

3.5 依赖管理与部署包优化

Lambda函数需要将所有依赖项打包在一起。以下是一个优化的打包策略：

# requirements.txt (示例依赖)
# boto3>=1.28.0  # Lambda运行时已包含，无需打包！
# requests>=2.28.0
# python-jose>=3.3.0
# pandas>=2.0.0

# 优化后的代码结构
import json
import os

# ✅ 尝试延迟加载大依赖
_requests = None
def get_requests():
    """延迟导入requests库"""
    global _requests
    if _requests is None:
        import requests
        _requests = requests
    return _requests

_pandas = None
def get_pandas():
    """延迟导入pandas（大依赖）"""
    global _pandas
    if _pandas is None:
        import pandas as pd
        _pandas = pd
    return _pandas

def lambda_handler(event, context):
    """
    使用延迟加载减少冷启动时间
    """
    # 只在需要时才导入大依赖
    if event.get('use_pandas', False):
        pd = get_pandas()
        # 使用pandas处理数据
        df = pd.DataFrame(event['data'])
        result = df.to_dict()
    else:
        # 使用标准库处理
        result = {"processed": event.get('data', [])}
    
    # 如果需要HTTP请求
    if event.get('make_request', False):
        requests = get_requests()
        response = requests.get('https://api.example.com/data')
        result['external'] = response.json()
    
    return {
        'statusCode': 200,
        'body': json.dumps(result)
    }

4. 性能优化与监控

4.1 内存配置与CPU性能

Lambda函数的内存配置直接影响CPU性能。更高的内存会带来更快的CPU性能，但也会增加成本。找到最优配置需要在性能和成本间取得平衡。

import time
import psutil  # 需要添加到requirements.txt

def lambda_handler(event, context):
    """
    监控内存使用情况以优化配置
    """
    start_time = time.time()
    
    # 记录初始内存
    process = psutil.Process()
    mem_start = process.memory_info().rss / 1024 / 1024  # MB
    
    # 执行主要逻辑
    result = process_data(event)
    
    # 记录结束内存
    mem_end = process.memory_info().rss / 1024 / 1024
    duration = time.time() - start_time
    
    # 打印性能指标
    print(f"Memory usage: {mem_start:.2f}MB -> {mem_end:.2f}MB")
    print(f"Duration: {duration*1000:.2f}ms")
    print(f"Max memory used: {max(mem_start, mem_end):.2f}MB")
    print(f"Allocated memory: {context.memory_limit_in_mb}MB")
    
    # 建议：如果最大内存使用远低于分配内存，可以考虑降低内存配置
    max_used = max(mem_start, mem_end)
    allocated = context.memory_limit_in_mb
    if max_used < allocated * 0.3:
        print(f"💡 Consider reducing memory to save costs")
    
    return result

def process_data(event):
    """模拟数据处理"""
    # 创建一些数据占用内存
    data = [i for i in range(100000)]
    time.sleep(0.5)
    return {"processed": len(data)}

4.2 冷启动优化策略

冷启动是Serverless应用面临的主要挑战之一。以下策略可以有效减少冷启动影响：

import json
import threading
import time

# 全局缓存对象
_cache = {}
_initialized = False

def warm_up():
    """
    预热函数：在初始化阶段执行耗时操作
    """
    global _cache, _initialized
    
    # 加载配置
    with open('config.json', 'r') as f:
        _cache['config'] = json.load(f)
    
    # 建立连接池
    _cache['connections'] = {}
    
    _initialized = True
    print("Warm-up complete")

def lazy_init():
    """
    延迟初始化，但确保只执行一次
    """
    global _initialized
    if not _initialized:
        # 使用锁避免竞态条件
        lock = threading.Lock()
        with lock:
            if not _initialized:
                warm_up()

def lambda_handler(event, context):
    """
    处理函数
    """
    # 确保初始化完成（但只执行一次）
    lazy_init()
    
    # 使用缓存的对象
    config = _cache.get('config', {})
    
    # 业务逻辑
    return {
        'statusCode': 200,
        'body': json.dumps({
            'message': 'Success',
            'config_loaded': bool(config)
        })
    }

4.3 Provisioned Concurrency

对于延迟敏感的应用，可以使用Provisioned Concurrency预先初始化指定数量的执行环境，彻底消除冷启动。以下是通过CloudFormation配置的示例：

# cloudformation.yaml 片段
Resources:
  MyFunction:
    Type: AWS::Lambda::Function
    Properties:
      FunctionName: my-production-function
      Runtime: python3.13
      Handler: index.lambda_handler
      Code: ./src
      MemorySize: 512
      Timeout: 30
      
  MyFunctionProvisionedConcurrency:
    Type: AWS::Lambda::ProvisionedConcurrencyConfiguration
    Properties:
      FunctionName: !Ref MyFunction
      Qualifier: PROD
      ProvisionedConcurrentExecutions: 10  # 预置10个并发实例

4.4 日志与监控最佳实践

import json
import logging
import time
from datetime import datetime

# 配置结构化日志
logger = logging.getLogger()
logger.setLevel(logging.INFO)

class StructuredLogger:
    """结构化日志帮助类"""
    
    @staticmethod
    def log(level, message, **kwargs):
        log_entry = {
            "timestamp": datetime.utcnow().isoformat(),
            "level": level,
            "message": message,
            **kwargs
        }
        print(json.dumps(log_entry))
    
    @staticmethod
    def info(message, **kwargs):
        StructuredLogger.log("INFO", message, **kwargs)
    
    @staticmethod
    def error(message, **kwargs):
        StructuredLogger.log("ERROR", message, **kwargs)
    
    @staticmethod
    def metric(name, value, unit="Count", **kwargs):
        """记录自定义指标"""
        StructuredLogger.log("METRIC", f"Metric: {name}", 
                            metric_name=name, 
                            metric_value=value, 
                            metric_unit=unit,
                            **kwargs)

def lambda_handler(event, context):
    """
    带监控的函数示例
    """
    start_time = time.time()
    request_id = context.aws_request_id
    
    StructuredLogger.info(
        "Function invoked",
        request_id=request_id,
        event_source=event.get('source', 'unknown')
    )
    
    try:
        # 业务逻辑
        result = process_event(event)
        
        # 记录执行时间
        duration = time.time() - start_time
        StructuredLogger.metric(
            "execution_time",
            duration * 1000,
            unit="Milliseconds",
            request_id=request_id
        )
        
        return {
            'statusCode': 200,
            'body': json.dumps(result)
        }
        
    except Exception as e:
        StructuredLogger.error(
            "Function failed",
            request_id=request_id,
            error=str(e),
            error_type=type(e).__name__
        )
        raise

def process_event(event):
    """业务逻辑处理"""
    # 模拟处理
    time.sleep(0.1)
    return {"processed": True}

5. 完整实践项目：构建RESTful API

5.1 项目结构

让我们构建一个完整的用户管理API，使用API Gateway + Lambda + DynamoDB。

user-api/
├── src/
│   ├── __init__.py
│   ├── handler.py          # 主处理函数
│   ├── db.py                # 数据库操作
│   ├── models.py            # 数据模型
│   └── utils.py             # 工具函数
├── requirements.txt         # 依赖
├── serverless.yml           # Serverless Framework配置
└── tests/                   # 测试

5.2 数据模型 (models.py)

# models.py
import json
import uuid
from datetime import datetime
from typing import Optional, Dict, Any

class User:
    """用户模型"""
    
    def __init__(self, user_id: Optional[str] = None, 
                 name: str = "", 
                 email: str = "", 
                 age: Optional[int] = None):
        self.user_id = user_id or str(uuid.uuid4())
        self.name = name
        self.email = email
        self.age = age
        self.created_at = datetime.utcnow().isoformat()
        self.updated_at = self.created_at
    
    def to_dict(self) -> Dict[str, Any]:
        """转换为DynamoDB格式"""
        return {
            'userId': {'S': self.user_id},
            'name': {'S': self.name},
            'email': {'S': self.email},
            'age': {'N': str(self.age)} if self.age else {'NULL': True},
            'createdAt': {'S': self.created_at},
            'updatedAt': {'S': self.updated_at}
        }
    
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> 'User':
        """从DynamoDB响应创建用户对象"""
        user = cls(
            user_id=data.get('userId', {}).get('S'),
            name=data.get('name', {}).get('S', ''),
            email=data.get('email', {}).get('S', ''),
            age=int(data.get('age', {}).get('N')) if data.get('age', {}).get('N') else None
        )
        user.created_at = data.get('createdAt', {}).get('S', user.created_at)
        user.updated_at = data.get('updatedAt', {}).get('S', user.updated_at)
        return user
    
    def to_json(self) -> Dict[str, Any]:
        """转换为JSON响应格式"""
        return {
            'userId': self.user_id,
            'name': self.name,
            'email': self.email,
            'age': self.age,
            'createdAt': self.created_at,
            'updatedAt': self.updated_at
        }
    
    def update(self, **kwargs):
        """更新用户字段"""
        for key, value in kwargs.items():
            if hasattr(self, key) and value is not None:
                setattr(self, key, value)
        self.updated_at = datetime.utcnow().isoformat()

class ValidationError(Exception):
    """数据验证错误"""
    pass

5.3 数据库操作 (db.py)

# db.py
import os
import boto3
from botocore.exceptions import ClientError
from boto3.dynamodb.conditions import Key
from typing import Optional, List, Dict, Any

from models import User, ValidationError

# 全局初始化（复用客户端）
dynamodb = boto3.resource('dynamodb')
table_name = os.environ.get('TABLE_NAME', 'Users')
table = dynamodb.Table(table_name)

class UserRepository:
    """用户数据仓库"""
    
    @staticmethod
    def create_user(user_data: Dict[str, Any]) -> User:
        """
        创建新用户
        """
        try:
            # 验证必要字段
            if not user_data.get('name') or not user_data.get('email'):
                raise ValidationError("Name and email are required")
            
            # 创建用户对象
            user = User(
                name=user_data['name'],
                email=user_data['email'],
                age=user_data.get('age')
            )
            
            # 写入DynamoDB
            table.put_item(
                Item=user.to_dict(),
                ConditionExpression='attribute_not_exists(userId)'  # 避免覆盖
            )
            
            return user
            
        except ClientError as e:
            if e.response['Error']['Code'] == 'ConditionalCheckFailedException':
                raise ValidationError("User already exists")
            raise
        except Exception as e:
            print(f"Error creating user: {str(e)}")
            raise
    
    @staticmethod
    def get_user(user_id: str) -> Optional[User]:
        """
        根据ID获取用户
        """
        try:
            response = table.get_item(Key={'userId': user_id})
            item = response.get('Item')
            
            if not item:
                return None
            
            # 转换为User对象
            return User.from_dict(item)
            
        except ClientError as e:
            print(f"Error getting user {user_id}: {str(e)}")
            raise
    
    @staticmethod
    def update_user(user_id: str, updates: Dict[str, Any]) -> Optional[User]:
        """
        更新用户信息
        """
        try:
            # 构建更新表达式
            update_expr = "SET updatedAt = :updated_at"
            expr_attrs = {':updated_at': datetime.utcnow().isoformat()}
            
            # 添加要更新的字段
            for key, value in updates.items():
                if value is not None and key in ['name', 'email', 'age']:
                    update_expr += f", {key} = :{key}"
                    if key == 'age':
                        expr_attrs[f':{key}'] = str(value)
                    else:
                        expr_attrs[f':{key}'] = value
            
            # 执行更新
            response = table.update_item(
                Key={'userId': user_id},
                UpdateExpression=update_expr,
                ExpressionAttributeValues=expr_attrs,
                ReturnValues='ALL_NEW'
            )
            
            return User.from_dict(response['Attributes'])
            
        except ClientError as e:
            print(f"Error updating user {user_id}: {str(e)}")
            raise
    
    @staticmethod
    def delete_user(user_id: str) -> bool:
        """
        删除用户
        """
        try:
            response = table.delete_item(
                Key={'userId': user_id},
                ReturnValues='ALL_OLD'
            )
            return 'Attributes' in response  # 存在则删除成功
        except ClientError as e:
            print(f"Error deleting user {user_id}: {str(e)}")
            raise
    
    @staticmethod
    def list_users(limit: int = 20, last_key: Optional[str] = None) -> Dict[str, Any]:
        """
        列出用户（分页）
        """
        try:
            params = {
                'Limit': limit
            }
            
            if last_key:
                params['ExclusiveStartKey'] = {'userId': last_key}
            
            response = table.scan(**params)
            
            users = [User.from_dict(item) for item in response.get('Items', [])]
            
            result = {
                'users': [user.to_json() for user in users],
                'count': len(users)
            }
            
            # 返回下一页的游标
            if 'LastEvaluatedKey' in response:
                result['next_key'] = response['LastEvaluatedKey']['userId']
            
            return result
            
        except ClientError as e:
            print(f"Error listing users: {str(e)}")
            raise

5.4 工具函数 (utils.py)

# utils.py
import json
import os
import hmac
import hashlib
import base64
from typing import Dict, Any, Optional

def create_response(status_code: int, body: Any = None, 
                   headers: Optional[Dict] = None) -> Dict[str, Any]:
    """
    创建标准化的API响应
    """
    response = {
        'statusCode': status_code,
        'headers': {
            'Content-Type': 'application/json',
            'Access-Control-Allow-Origin': '*',
            'Access-Control-Allow-Methods': 'GET,POST,PUT,DELETE,OPTIONS',
            'Access-Control-Allow-Headers': 'Content-Type,Authorization',
            **(headers or {})
        }
    }
    
    if body is not None:
        response['body'] = json.dumps(body, default=str)
    
    return response

def parse_body(event: Dict[str, Any]) -> Dict[str, Any]:
    """
    安全地解析请求体
    """
    body = event.get('body', '{}')
    
    if event.get('isBase64Encoded', False):
        body = base64.b64decode(body).decode('utf-8')
    
    try:
        return json.loads(body)
    except json.JSONDecodeError:
        return {}

def extract_user_id(event: Dict[str, Any]) -> Optional[str]:
    """
    从路径参数中提取用户ID
    """
    path_params = event.get('pathParameters') or {}
    return path_params.get('userId')

def validate_auth(event: Dict[str, Any]) -> bool:
    """
    简单的JWT验证示例
    """
    headers = event.get('headers', {})
    auth_header = headers.get('Authorization') or headers.get('authorization', '')
    
    if not auth_header.startswith('Bearer '):
        return False
    
    token = auth_header[7:]  # 去掉"Bearer "
    
    # 在实际应用中，这里应该验证JWT签名
    # 此处仅作示例
    return len(token) > 0

5.5 主处理函数 (handler.py)

# handler.py
import json
import os
import traceback
from datetime import datetime
from typing import Dict, Any

from models import User, ValidationError
from db import UserRepository
from utils import create_response, parse_body, extract_user_id, validate_auth

# 初始化日志
import logging
logger = logging.getLogger()
logger.setLevel(logging.INFO)

def lambda_handler(event: Dict[str, Any], context: Any) -> Dict[str, Any]:
    """
    主入口函数 - 路由到对应的处理函数
    """
    start_time = datetime.utcnow()
    request_id = context.aws_request_id
    
    # 记录请求信息
    logger.info(json.dumps({
        'type': 'request',
        'requestId': request_id,
        'method': event.get('httpMethod'),
        'path': event.get('path'),
        'sourceIp': event.get('requestContext', {}).get('identity', {}).get('sourceIp'),
        'timestamp': start_time.isoformat()
    }))
    
    try:
        # 处理预检请求（CORS）
        if event.get('httpMethod') == 'OPTIONS':
            return create_response(200)
        
        # 路由到对应处理器
        method = event.get('httpMethod')
        path = event.get('path')
        
        if method == 'GET' and path == '/users':
            return handle_list_users(event)
        elif method == 'POST' and path == '/users':
            return handle_create_user(event)
        elif method == 'GET' and path.startswith('/users/'):
            return handle_get_user(event)
        elif method == 'PUT' and path.startswith('/users/'):
            return handle_update_user(event)
        elif method == 'DELETE' and path.startswith('/users/'):
            return handle_delete_user(event)
        else:
            return create_response(404, {'error': 'Not found'})
            
    except ValidationError as e:
        logger.warning(f"Validation error: {str(e)}")
        return create_response(400, {'error': str(e)})
        
    except Exception as e:
        logger.error(f"Unexpected error: {str(e)}\n{traceback.format_exc()}")
        return create_response(500, {'error': 'Internal server error'})
        
    finally:
        # 记录执行时间
        duration = (datetime.utcnow() - start_time).total_seconds() * 1000
        logger.info(json.dumps({
            'type': 'metric',
            'requestId': request_id,
            'duration_ms': duration
        }))

def handle_list_users(event: Dict[str, Any]) -> Dict[str, Any]:
    """
    处理GET /users - 列出用户
    """
    # 解析查询参数
    query_params = event.get('queryStringParameters') or {}
    limit = int(query_params.get('limit', 20))
    next_key = query_params.get('nextKey')
    
    # 调用仓库
    result = UserRepository.list_users(limit=limit, last_key=next_key)
    
    return create_response(200, result)

def handle_create_user(event: Dict[str, Any]) -> Dict[str, Any]:
    """
    处理POST /users - 创建用户
    """
    # 解析请求体
    data = parse_body(event)
    
    # 创建用户
    user = UserRepository.create_user(data)
    
    return create_response(201, user.to_json())

def handle_get_user(event: Dict[str, Any]) -> Dict[str, Any]:
    """
    处理GET /users/{userId} - 获取用户详情
    """
    user_id = extract_user_id(event)
    if not user_id:
        return create_response(400, {'error': 'Missing user ID'})
    
    user = UserRepository.get_user(user_id)
    if not user:
        return create_response(404, {'error': 'User not found'})
    
    return create_response(200, user.to_json())

def handle_update_user(event: Dict[str, Any]) -> Dict[str, Any]:
    """
    处理PUT /users/{userId} - 更新用户
    """
    user_id = extract_user_id(event)
    if not user_id:
        return create_response(400, {'error': 'Missing user ID'})
    
    # 解析更新数据
    data = parse_body(event)
    
    # 更新用户
    user = UserRepository.update_user(user_id, data)
    if not user:
        return create_response(404, {'error': 'User not found'})
    
    return create_response(200, user.to_json())

def handle_delete_user(event: Dict[str, Any]) -> Dict[str, Any]:
    """
    处理DELETE /users/{userId} - 删除用户
    """
    user_id = extract_user_id(event)
    if not user_id:
        return create_response(400, {'error': 'Missing user ID'})
    
    deleted = UserRepository.delete_user(user_id)
    if not deleted:
        return create_response(404, {'error': 'User not found'})
    
    return create_response(204)  # No content

5.6 配置文件 (serverless.yml)

# serverless.yml
service: user-api

frameworkVersion: '3'

provider:
  name: aws
  runtime: python3.13
  region: us-east-1
  environment:
    TABLE_NAME: ${self:custom.tableName}
    LOG_LEVEL: INFO
  iamRoleStatements:
    - Effect: Allow
      Action:
        - dynamodb:GetItem
        - dynamodb:PutItem
        - dynamodb:UpdateItem
        - dynamodb:DeleteItem
        - dynamodb:Scan
      Resource: !GetAtt UsersTable.Arn

custom:
  tableName: users-${sls:stage}

functions:
  api:
    handler: src/handler.lambda_handler
    events:
      - httpApi:
          path: /users
          method: GET
      - httpApi:
          path: /users
          method: POST
      - httpApi:
          path: /users/{userId}
          method: GET
      - httpApi:
          path: /users/{userId}
          method: PUT
      - httpApi:
          path: /users/{userId}
          method: DELETE
      - httpApi:
          path: /users
          method: OPTIONS
      - httpApi:
          path: /users/{userId}
          method: OPTIONS
    memorySize: 256
    timeout: 10

resources:
  Resources:
    UsersTable:
      Type: AWS::DynamoDB::Table
      Properties:
        TableName: ${self:custom.tableName}
        AttributeDefinitions:
          - AttributeName: userId
            AttributeType: S
        KeySchema:
          - AttributeName: userId
            KeyType: HASH
        BillingMode: PAY_PER_REQUEST
        Tags:
          - Key: Environment
            Value: ${sls:stage}
          - Key: Service
            Value: user-api

5.7 部署与测试

# 安装依赖
pip install -r requirements.txt -t src/vendor

# 部署到开发环境
sls deploy --stage dev

# 部署到生产环境
sls deploy --stage prod

# 查看日志
sls logs -f api -t

# 本地测试
sls invoke local -f api -p test-events/create-user.json

5.8 测试事件示例

// test-events/create-user.json
{
  "httpMethod": "POST",
  "path": "/users",
  "headers": {
    "Content-Type": "application/json"
  },
  "body": "{\"name\":\"张三\",\"email\":\"zhangsan@example.com\",\"age\":28}"
}

6. 新特性：持久化函数 (Durable Functions)

2025年底，AWS发布了Lambda持久化函数（Durable Functions），这是一个重大更新，允许开发者在Lambda代码中实现有状态逻辑和工作流编排。

6.1 核心概念

持久化函数引入了两个核心原语：

Step：为业务逻辑添加自动检查点和重试
Wait：暂停执行指定时间，期间不计费

# 使用持久化函数的Python示例
import json
from aws_lambda_durable import durable

# 启用持久化执行
@durable
def lambda_handler(event, context):
    """
    订单处理工作流 - 可暂停长达1年且不计费
    """
    order_id = event['orderId']
    amount = event['amount']
    items = event['items']
    
    # Step 1: 预留库存 (自动检查点)
    inventory = context.step("reserve-inventory", lambda: 
        inventory_service.reserve(items)
    )
    
    # Step 2: 处理支付
    payment = context.step("process-payment", lambda:
        payment_service.charge(amount)
    )
    
    # Step 3: 等待外部批准 (可暂停)
    if amount > 10000:
        context.wait("approval", max_days=7)  # 等待7天
    
    # Step 4: 创建发货单
    shipment = context.step("create-shipment", lambda:
        shipping_service.create_shipment(order_id, inventory)
    )
    
    return {
        'orderId': order_id,
        'status': 'completed',
        'shipment': shipment
    }

6.2 应用场景

持久化函数特别适合以下场景：

多步骤业务流程：订单处理、审批流程
LLM/AI工作流：链式调用大语言模型
长时间运行的任务：等待外部事件、人工审批
复杂编排：替代Step Functions的代码化实现

7. 调试与故障排查

7.1 本地调试

# local_test.py
import json
import boto3
from src.handler import lambda_handler

# 模拟事件
test_event = {
    "httpMethod": "GET",
    "path": "/users",
    "queryStringParameters": {
        "limit": "5"
    }
}

# 模拟上下文（最小实现）
class MockContext:
    def __init__(self):
        self.aws_request_id = "test-request-123"
        self.function_name = "test-function"
        self.memory_limit_in_mb = 256
    
    def get_remaining_time_in_millis(self):
        return 30000

# 本地调用
if __name__ == "__main__":
    context = MockContext()
    result = lambda_handler(test_event, context)
    print(json.dumps(result, indent=2))

7.2 常见错误排查

错误类型	可能原因	解决方案
Timeout	函数执行超过配置的超时时间	增加超时配置，优化代码性能
MemoryError	内存不足	增加内存配置，优化内存使用
AccessDenied	IAM权限不足	检查执行角色权限
Task timed out	同步调用超时（6MB限制）	减少响应大小，使用流式响应
Invalid request	事件格式错误	检查事件源的数据结构