跨系统运行的 AI

现代 AI 十分强大,但它通常依赖于数据集中化,或者依赖于对单一提供方的信任。Onai 让模型能够在分布式系统中训练和使用,而无需暴露数据,也无需放弃控制权。

问题

今天的 AI 基础设施在根本上是中心化的

要训练模型,数据通常必须被聚合到一个统一环境中。要使用模型,用户通常必须把敏感数据发送给模型提供方。

因此,世界上大量的数据无法被 AI 有效利用,许多应用也因为保密要求而被阻断。

数据无法被充分利用

隐私、监管和组织层面的约束,使许多有价值的数据集无法被共享或集中化。

推理需要信任

敏感输入会暴露给外部系统,这使得那些真正重视保密性的场景难以采用 AI。

我们的方法

随处训练,随处运行,什么都不暴露

Onai 让 AI 能够在分布式系统上运行,同时保护数据和模型本身的隐私。

这创造出一个系统,在其中数据、模型和计算可以相互协作,而不必信任任何单一参与方。

分布式训练

模型可以在多个数据集上训练,而不需要将数据集中化。

私密推理

推理过程可以在不向模型所有者暴露查询数据的情况下完成。

受保护的模型部署

模型提供方可以部署模型,而无需暴露模型本身。

这带来了什么

无需中心化的新型 AI 工作流

训练

保护隐私的分布式训练

在无法共享或集中化的数据集上训练模型,在严格保持数据边界的同时提升性能。

推理

保密推理

在不向模型提供方暴露敏感输入数据的前提下,对模型发起查询。

模型

模型隐私与保护

让模型所有者能够在不暴露模型权重或知识产权的情况下部署和使用模型。

网络

作为网络的 AI

应用开发者可以构建在一个分布式模型网络之上,访问来自多个提供方的能力,而不是依赖单一中心化 API。

系统在实践中

一个用于私密 AI 计算的网络

Onai 的基础设施将数据持有者、模型提供方和应用开发者连接成一个共享系统。

随着时间推移,这会形成一种新的生态系统,在其中模型、数据和算力可以在参与者之间被访问和利用,而无需中心化。

数据

数据留在其所有者手中

数据持有者在保持本地控制的同时,仍然能够参与训练和推理工作流。

模型

模型部署在分布式网络上

提供方可以向多个对手方提供能力,而不必把一切都收拢到单一主机上。

查询

查询被安全执行

请求运行时不会暴露敏感输入,也不会迫使用户把原始数据托付给中心化模型提供方。

结果

隐私保障依然成立

输出结果会在保留工作流保密属性的前提下返回,无论是对数据持有者还是对模型提供方而言都是如此。

适用对象

为那些需要跨越边界使用 AI 的参与方而构建

应用开发者

构建使用强大模型的应用,而无需要求用户把敏感数据发送到中心化服务。

模型提供方

以保护知识产权的方式部署模型,同时将访问和使用扩展到更广泛的网络中。

数据持有者

参与 AI 工作流、训练和推理,而无需暴露底层数据。

AI 的新基础

Onai 正在构建这样一种基础设施,使 AI 能够跨越边界运行、释放数据价值、保护隐私,并支持一个更加开放、更加协作的生态系统。

如需更多信息,与我们会面