Neo4j 集群和负载均衡

简vae

1771人浏览 · 2023-07-26 19:19:08

简vae · 2023-07-26 19:19:08 发布

Neo4j 集群和负载均衡

Neo4j是当前最流行的开源图DB。刚好读到了Neo4j的集群和负载均衡策略，记录一下。

1 集群

Neo4j 集群使用主从复制实现高可用性和水平读扩展。

1.1 复制

集群的写入都通过主节点协调完成的，数据先写入主机，再同步到一个或多个备机。这意味着并没有做图切分，集群中的每个实例都将包含数据的完整副本。准确来说，集群中的每个实例最终会将包含数据的完整副本，原因是，刚刚写入的数据，可能还没有同步到备机。

Neo4j 也允许通过从节点进行写入操作，不过此时，被写入的从节点会先将数据同步到主节点，再将数据返回客户端。由于额外的网络负载和协调协议，通过从节点写入会比直接写入主节点慢一个数量级。

1.2 写入缓冲区

在高写人负载的情况中，可以使用队列来进行缓冲区写入和负载调节。使用该策略将集群的写入缓冲在队列中，随后会有工作节点对队列进行轮询并对数据库执行批量写入。这不仅控制了写入流量，而且降低了竞争，并使我们能够在维护时段暂停写入操作而不拒绝客户端的请求。

2 负载均衡

2.1 读写分离流量

鉴于推荐的写入方式是将绝大部分写入操作直接在主节点上进行，我们应该将读请求和写请求完全分离开，并通过负载均衡器将写流量定向到主节点，而读流量平衡地分散到整个集群。

2.2 高速缓存分片

高速缓存分片技术是指将每个请求路由到 HA（高可用性）集群中的特定实例上，这个实例可能已经将需要使用的图的部分放置在自己的主存储器中了。

如果应用程序的大多数查询都是局部图查询，即从图的一个或多个特定点开始，然后遍历周围的子图，那么这种一致地从一组节点开始查询，随后路由到同一数据库实例继续查询的机制将增加每个查询在热高速缓存（ warm cache ）中命中可能性。例如，在一个地理数据系统中，我们可以将特定地区的请求路由到特定的刚刚响应过该地区的数据库实例上。这种策略都增加了所需节点和联系被缓存在主存储器中的可能性，在那里它们可以被快速地访问和处理。

感兴趣的同学可以看一下一致性哈希。

3 附

以上内容均参考自《图数据库》。

图数据库（第二版）.pdf https://www.aliyundrive.com/s/zxfL2btKEj5

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m