数据模型和查询语言对于那些不在鉴赏家圈子内的人来说无疑有些枯燥乏味。尽管图形数据模型和查询语言也不例外,但出于一个主要原因,我们一直在努力跟踪该领域的发展。
图形是企业软件最大细分市场——数据库中增长最快的领域。举个例子:最近的一系列融资回合,以Neo4j的3.25亿美元F系列融资回合为高潮,使其估值超过20亿美元。
Neo4j是历史最长的图形数据库供应商之一,现在也是资金最充足的一家。但这并不意味着它是唯一值得关注的。AWS于2018年与Neptune一起进入图形数据库市场,此后取得了很大进展。
今天,AWS推出了对openCypher的支持,openCypher是一种基于Neo4j的Cypher的开源查询语言。我们借此机会了解这意味着什么,以及它与图形数据库未来的关系,并回顾Neptune对机器学习和数据科学的支持方面有趣的发展。
与openCypher建立桥梁开发者现在可以使用openCypher,一种流行的图形查询语言,与Amazon Neptune,为构建或迁移图形应用程序提供更多选择。另外,Neptune、Neptune和Nepsparp将支持三种最流行的二进制查询语言。这暗示了客户能够利用熟悉的和现有的工具——更具体地说,是Neo4的工具。但这一点之所以重要还有更多原因。
有两种主要的数据模型用于图形建模:RDF和标记属性图(LPG)。Neptune支持两者,SPARQL作为RDF的查询语言,Gremlin作为LPG的查询语言。Gremlin有很多优点,因为它几乎无所不在的支持,并提供了很多对图形遍历的控制。但这也可能是个问题。
作为Apache Tinkerpop项目的一部分,Gremlin是一种命令式查询语言。这意味着,与SQL、Cypher和SPARQL等声明性查询语言不同,Gremlin查询不仅要表示要检索什么,还需要指定检索方式。在这方面,Gremlin更像是一种编程语言。
Amazon-Neptune架构。Neptune对openCypher的支持增强了它的功能,这为它的软件库带来了更多的灵活性。
并非所有用户都能在所有场景中自如地使用Gremlin。然而,如果他们想使用液化石油气模式,他们所要做的就是这样。尽管亚马逊雇佣了一些Apache Tinkerpop的关键贡献者,但它似乎承认这一点。添加对openCypher的支持使在Neptune中使用LPG发动机变得更加容易。
Neptune对LPG和RDF的支持是可能的,因为它的发动机罩下有两个不同的发动机,每个数据模型一个。增加对openCypher的支持并没有改变这一点——至少目前还没有。但RDF*可能会。RDF*,也称为RDF Star,是对RDF标准的更新,使其能够对液化石油气图形进行建模。
RDF和液化石油气工作组都在该领域开展工作。除了Amazon和Neptune,其他RDF供应商也在增加对openCypher的实验性支持。这里的大图是ISO认可的正在进行的关于GQL的工作。
GQL是图形查询语言的新标准,旨在统一当今支离破碎的局面。人们期望GQL对图形数据库的作用与SQL对关系数据库的作用相同。亚马逊在RDF*和GQL方面都很活跃。
最终,这将使海王星能够统一其目前两个完全不同的引擎。但这里的故事不仅仅是亚马逊。亚马逊的承诺是,所有的图形数据库用户都应该能够在他们的系统中使用单一的数据模型和查询语言。数据科学和机器学习功能:笔记本电脑和图形神经网络还有一段路要走。标准化工作总是很复杂,而且也不能保证全面采用。但Neptune还举例说明了图形数据库的另一个重要发展:数据科学和机器学习功能的集成。
开发图形应用程序和导航图形结果,通过IDE和为此目的定制的可视化探索工具大大方便了。尽管许多图形数据库供应商已将用于这些目的的内置工具纳入其产品中,但直到最近,Neptune还完全依赖第三方集成。
Neptune团队选择的解决这一差距的方法是开发AWS graph Notebook。笔记本电脑在数据科学家和机器学习实践者中非常流行,使他们能够混合和匹配代码、数据、可视化和文档,并协同工作。
AWS Graph Notebook是Jupyter笔记本电脑的开源Python包,支持图形可视化。它同时支持Gremlin和SPARQL,我们希望它最终也会支持openCypher。虽然最初被数据科学和机器学习群体采用,亚马逊似乎相信笔记本电脑也会在开发者中流行起来。
Neptune ML是亚马逊在SageMaker和DGL中集成Neptune图形数据库和图形机器学习功能的代号。
我们将不得不等待,看看这一赌注是否有回报。然而,可以肯定的是,提供笔记本支持增强了Neptune对数据科学和机器学习用例的吸引力。但这并不是海王星所能提供的全部——输入海王星ML。
亚马逊鼓吹海王星ML是一种利用图形神经网络(GNN)对图形进行简单、快速、准确预测的方法。Neptune ML由亚马逊SageMaker和open提供动力source Deep Graph Library(DGL),Amazon对此做出了贡献。
GNNs是深度学习的一个相对较新的分支,其有趣的特点是,它们利用了将数据建模为图形可以建模的附加上下文信息来训练深度学习算法。GNNs被认为是机器学习领域的最新技术,与传统的神经网络相比,GNNs在预测方面具有更好的准确性。
将GNNs与图形数据库集成是一种自然的匹配。GNN可用于节点级和边缘级预测,即它们可以在图形中推断额外的数据和连接。它们可用于训练模型,以推断欺诈预测、广告定位、客户360、推荐、身份解析和知识图完成等用例的属性。
同样,Neptune不是唯一一家将笔记本和机器学习纳入其产品的公司。除了满足数据科学和机器学习人群的需求外,这些功能还可以提升开发人员和最终用户的体验。更好的工具、更好的数据、更好的分析——它们都能带来更好的最终用户应用程序。这是所有供应商都在努力的目标。
开源增长和风险资本投资:数据、数据库、挑战和机遇
Surfshark VPN评论:它很便宜,但很好吗?
不仅仅是文字:揭示数据术语混乱
这是数据库历史上最大的投资,有史以来最大的社交网络,以及Neo4j的其他图表故事通过注册,您同意使用条款,并承认隐私政策中概述的数据实践。
您还将免费订阅ZDNet的今日技术更新和ZDNet公告时事通讯。您可以随时取消订阅这些时事通讯。
您同意接收CBS公司系列的更新、提醒和促销活动,包括ZDNet的今日技术更新和ZDNet公告时事通讯。您可以随时取消订阅