Queueing Systems: 流体模型在服务运营管理中的应用

编者按:
服务运营管理一直是一个富有成果的研究领域,致力于解决与服务系统相关的战略和运营层面的各种挑战。这类问题通常具有复杂、动态且随机的特性,往往导致模型在解析和计算上都较为复杂。在这种情况下,用于近似随机/排队系统动态的流体确定性模型,可以提供既准确又易于处理的优化模型。这些模型有助于构建直观且富有洞见的策略,并且在实际中具有可实施性,即使是在随时间变化的系统中也是如此。本文重点关注流体模型在服务运营与医疗运营管理中解决各类问题的应用方面。
Zychlinski, N. Applications of fluid models in service operations management. Queueing Syst 103, 161–185 (2023). https://doi.org/10.1007/s11134-022-09868-2
1. 引言
服务系统构成了当今世界经济以及人们日常生活中不可或缺的一部分。这类系统通常具有复杂性、随机性和动态性,其结构往往是包含多个服务台和多类客户的网络。因此,针对这些系统的运营管理问题往往非常复杂,甚至会导致模型在分析上不可处理。
在这种情况下,流体模型(fluid frameworks)能够提供一种准确且可处理的近似方法,用于优化系统性能,从而帮助我们提炼出系统的结构性运营洞见,并设计出易于实施的策略。在流体模型中,系统中的个体(如客户)被视为连续的、确定性的流体。这种近似使得系统的动态行为可以通过一组直观的微分方程来描述,相较于原始的随机模型,更易于分析和处理。
此外,多服务器、时变的流体模型可以对处于欠载、过载以及临界负载状态下的随机系统进行近似,并且能够很好地刻画这些时变随机系统的平均瞬态行为。已有大量文献表明,在合适的运行极限条件下,流体模型可以准确逼近其对应的随机系统。
由于流体确定性模型能够以一种简单但又相对真实的方式刻画随机离散系统,因此它们已经被广泛应用于多种服务系统的建模中。这些应用包括早期的邮政系统和社会保障办公室、交通与网约车系统、呼叫中心,以及医疗服务系统等。
一个简单的流体模型可以使用如下微分方程表示:
q˙(t)=λ(t)−δ(t),\dot{q}(t)=\lambda(t)-\delta(t),q˙(t)=λ(t)−δ(t),
其中,q(t)q(t)q(t)是流体存量(例如顾客的数量等),λ(t)\lambda(t)λ(t)是到达速率,δ(t)\delta(t)δ(t)是离开系统的速率。

2. 对流体模型的理解
流体模型可以从两种角度来理解。
第一种是将其作为分析随机系统的工具,即把流体模型视为原始随机排队系统在某种极限条件下的近似模型,通过研究其性质(如稳定性)来推断原系统的行为(Jim Dai的经典结论)。
第二种是将其作为一个独立的模型,即不再强调其来源于随机系统的极限,而是直接利用其简单、直观的微分方程结构来描述系统的平均动态,并据此进行优化与决策。在这种视角下,流体模型本身就能提供足够的管理洞见和可实施策略。因此,这两种理解分别对应理论分析与实际应用两个层面,并在服务系统研究中相互补充。注意,若考虑随机波动则需用diffusion model补充。
3. 两种极限框架
3.1 Conventional heavy traffic regime
在此框架下,可视为时间被加速(到达率和服务速率被放大),但服务器数量保持不变。适用于拥挤的系统。
3.2 Many-server heavy-traffic regime
在此框架下,到达率和服务器数量被放大,但服务数量保持不变。该框架被广泛应用。
4. 应用场景
4.1 呼叫中心
在呼叫中心中,运营问题主要集中在人员配置(staffing)、排班调度(scheduling)和呼叫分配(routing)。由于系统通常具有大规模、多技能和随机到达等特点,精确的随机模型难以求解。流体模型通过将客户流连续化,刻画系统的平均负载变化,使得这些问题可以转化为可解的优化问题,从而得到结构清晰且易于实施的近似最优策略,例如人员配置规则和动态路由策略。
代表论文:Zhenghua Long, Hailun Zhang, Jiheng Zhang, Zhe George Zhang (2023) The Generalized c/μ Rule for Queues with Heterogeneous Server Pools. Operations Research 72(6):2488-2506.
Jing Dong, Rouba Ibrahim (2020) Managing Supply in the On-Demand Economy: Flexible Workers, Full-Time Employees, or Both?. Operations Research 68(4):1238-1264.
4.2 医疗系统
医疗系统通常具有资源紧张、流程复杂和强动态性的特点,如病床分配、急诊分流和患者流管理等问题。流体模型能够用连续流的方式描述患者在各科室之间的流动,帮助分析拥堵、阻塞以及资源利用率等关键问题,并支持决策者在复杂系统中进行资源配置与调度优化,从而在效率与服务质量之间取得平衡。
代表论文:Jing Dong, Ohad Perry (2019) Queueing Models for Patient-Flow Dynamics in Inpatient Wards. Operations Research 68(1):250-275.
Timothy C. Y. Chan, Simon Y. Huang, Vahid Sarhangian (2024) Dynamic Control of Service Systems with Returns: Application to Design of Postdischarge Hospital Readmission Prevention Programs. Operations Research 73(4):2242-2263.
4.3 匹配系统
在匹配系统中,需要将不同类型的资源与需求进行动态匹配,例如器官分配或司机与乘客的匹配。这类问题具有高度随机性和复杂约束。流体模型将匹配过程近似为连续流动,使得原本难以处理的动态匹配问题可以转化为优化问题,从而设计出有效的分配或匹配策略,提高整体效率和公平性。
代表论文:Stefanos A. Zenios, Glenn M. Chertow, Lawrence M. Wein, (2000) Dynamic Allocation of Kidneys to Candidates on the Transplant Waiting List. Operations Research 48(4):549-569.
Mustafa Akan, Oguzhan Alagoz, Baris Ata, Fatih Safa Erenay, Adnan Said, (2012) A Broader View of Designing the Liver Allocation System. Operations Research 60(4):757-770.
4.4 延迟信息系统
在许多服务系统中,客户会根据等待时间信息决定是否加入系统。流体模型可以刻画系统中平均等待时间与客户行为之间的相互作用,从而分析信息披露对系统稳定性和性能的影响,并帮助设计合理的延迟公告策略,使系统在效率与用户体验之间达到平衡。
代表论文:Mor Armony, Nahum Shimkin, Ward Whitt, (2008) The Impact of Delay Announcements in Many-Server Queues with Abandonment. Operations Research 57(1):66-81.
Rouba Ibrahim, Ward Whitt, (2009) Real-Time Delay Estimation in Overloaded Multiserver Queues with Abandonments. Management Science 55(10):1729-1742.
5. 局限
流体模型的主要局限在于其本质是一种确定性的平均近似方法,它通过连续的“流”来替代原本离散且具有随机性的系统,因此无法刻画系统中的随机波动和不确定性。这种近似通常在大规模或重负载条件下较为准确,但在小规模或低负载系统中可能产生较大误差,甚至导致不合理的决策。此外,流体模型是连续的,而实际系统是离散的,因此其结果需要经过额外的转换才能应用于实际操作。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)