2023 开放原子开发者大会

OPEN ATOM DEVELOPERS CONFERENCE

AI 时代数据库存储管理新挑战分论坛

2023.12.16

随着 AI 大模型的广泛应用和普及,其模型训练和推理的精准度对数据和信息的存储、检索、处理提出了更高的要求。为此,存算分离、向量化数据库、图数据库、分布式数据库和开源数据库等受到了前所未有的关注。12 月 16-17 日,2023 开放原子开发者大会(OADC)即将召开,“AI 时代数据库存储管理新挑战”分论坛将聚集国内顶尖的数据库技术团队,为开发者们提供 AI 时代数据库技术的最新进展和实践经验分享。

AI 时代数据存储管理新挑战分论坛将于 12 月 16 日下午举行。接下来,我们精选一些议题介绍,以飨读者。

时序数据库 CeresDB 技术揭秘

演讲嘉宾:

曹瑞秋,蚂蚁集团开发工程师,CeresDB 核心开发者,长期专注于时序数据库领域,热爱数据库、开源。毕业自华南理工大学,毕业后即加入 CeresDB 项目组,深度参与过 CeresDB 多个模块的研发与性能优化工作。

议题简介:作为一种新型的时序数据库,CeresDB 的设计目标是高基数时序场景处理能力以及原生分布式能力。会上将分享 CeresDB 的一些核心技术细节,例如存储格式(与经典时序数据库的存储格式对比);分布式集群方案,包括数据分片和负载均衡策略;查询路径优化,包括分布式查询、查询友好的 memtable、数据拉取和缓存等,以及 CeresDB 在蚂蚁集团生产场景中的应用及其效果。

数据库增强计算引擎

数据库架构革新新思路

演讲嘉宾:

张亮,SphereEX 创始人,数据库领域知名实践者,拥有超过 10 年的数据库领域探索、实践经验,热爱开源,擅长分布式架构,推崇优雅代码。曾在多个大型互联网集团公司任职架构、数据库团队负责人。Apache Member 、微软 MVP 、阿里云 MVP、腾讯云 TVP、华为云 MVP、Apache ShardingSphere 创始人 & PMC Chair。是《未来架构——从服务化到云原生》《A Definitive Guide to Apache ShardingSphere》书籍作者,在 ICDE 发表论文《Apache ShardingSphere:A Holistic and Pluggable Platform for Data Sharding》。

议题简介:了解数据库增强引擎的创新理念和技术特点,打破传统数据库的限制。源于数据库顶级会议 ICDE 的论文,深度解析新一代数据库架构增强引擎的设计理念、技术特点和应用场景。

TiDB Serverless:

构建一个云原生的 Serverless 数据库

演讲嘉宾:

张翔,PingCAP/TiDB Serverless 生态负责人,Python 核心开发者。

议题简介:如何将一个分布式数据库改造成一个 cloud native 的 serverless 数据库,从而给客户提供更好的服务和更低的价格,服务 modern development。新的架构带来新的使用场景,cloud native 的架构使得 TiDB Serverless 可以推出 database branching 这种功能,提升用户的效率和协作体验,将数据库融入到 CICD。

DingoDB:融合 SQL 与向量

构建功能完整的 RAG 数据库底座

演讲嘉宾:

孟圣智,九章云极 DataCanvas 资深架构师,DingoDB 多模向量数据库主要设计者和开发者之一,拥有多年社区开源项目开发经验,在分布式数据库、Serverless 计算、虚拟化和容器平台、高并发系统设计方面有较深入的研究,对分布式存储系统和分布式数据库方向有独到的理解。

议题简介:介绍支持融合 SQL 与向量检索多模向量数据库的技术架构;融合 SQL 支持与 Vector First-Class Citizen 的支持,提供丰富的 API 访问方式;基于 Multi-Raft 实现向量索引的实时构建与优化。

云原生批流融合数据平台

助力 AI/LLM 的实时数据处理

演讲嘉宾:

翟佳,StreamNative 联合创始人, Apache Pulsar PMC 成员和 Apache Member。主要从事分布式、文件系统、流存储相关的设计和开发。近年一直从事开源项目 Apache BookKeeper 和 Apache Pulsar 的设计开发和社区运营工作。他在分布式、存储、消息等领域有丰富的积累和经验,在工作过程中,在相关领域先后获得中美专利 10 余项。

议题简介:1、了解 LLMs 对实时数据的需求;2、 介绍 Event/Streaming 系统怎样配合 LLMs 提供更高效的服务;3, 介绍 Apache Pulsar 及其在 LLMs 数据流转中优势。

腾讯云 TDSQL 平滑去 O 的机遇挑战

与开源实践

演讲嘉宾:耿航,目前担任腾讯开源专家,同时兼任木兰开源社区运营负责人,中国科协“科创中国”开源技术传播工委会秘书长,中国计算机学会开源发展委员会首批执委,NextArch 基金会技术监督委员会成员、SODA 基金会外联委员会成员、Ceph 基金会全球大使、中国开源云联盟副秘书长。

议题简介:分享腾讯云分布式数据库 TDSQL PG 是腾讯内部深度实践的分布式数据库,历经金融、游戏、广告、社交等业务打磨 10 年之久,逐步推广到千行百业落地应用。TDSQL 团队十年磨一剑,当前在面对数据库升级和替换过程中的机遇和挑战,将会和业界一起打磨共创商业数据库语法兼容生态和开源生态,更好的助力企业数字化转型,应对海量数据的高性能和高可用的挑战,以及降低用户的使用门槛,本次将为大家分享腾讯云 TDSQL 平滑去 O 的实践与开源实践。

openGauss 内核架构双引擎

驱动大规模数据处理

演讲嘉宾:胡正超,华为 openGauss 内核技术专家,就职于华为技术有限公司,参与 openGauss 内核技术研发与探索相关工作,负责 SQL 引擎、DFX 能力、性能优化方面的研发工作。目前 openGauss SIG SQL/OPS Committer。

议题简介:介绍在高性能、高可用、高智能、高安全上的创新特性。DataPod 三层资源池化架构技术,DataKit 数据库全生命周期管理工具。即刻报名,了解更多数据库技术进展。

扫描下方二维码

报名参加 AI 时代数据库存储管理新挑战分论坛

点击【阅读原文】立即报名

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐