中文内容
今天,我们宣布 Amazon SageMaker AI 支持 Fundamental 的 NEXUS 模型。借助此次发布,您可以部署一个专为表格数据预测而构建的基础模型(FM)。该模型可帮助企业在数天内从结构化数据生成准确、确定性的预测,而不是耗时数月。
本文将介绍如何在 Amazon SageMaker JumpStart 上开始使用 NEXUS,演示部署流程,并展示如何针对企业数据集运行预测。
什么是 NEXUS?
NEXUS 是由 Fundamental 开发、面向表格数据预测构建的基础模型。大型语言模型(LLM)为文本而设计,传统机器学习(ML)方法则需要大量特征工程和模型训练。NEXUS 采用了不同的方法。它在跨结构化数据集的数十亿个真实世界预测任务上进行了预训练,因此在使用时已经具备从数据中发现信号的能力。
作为大型表格模型,NEXUS 面向结构化数据分析而构建,并提供以下关键创新:
- 确定性架构——概率式 LLM 可能会对相同查询给出不同答案。NEXUS 会为每一次单独预测生成一致、可复现的结果。
- 原生表格理解——NEXUS 在数十亿张表格上训练而成,可原生处理数字、类别、日期和非结构化文本,无需手动特征工程。
- 非序列推理——大多数 AI 模型预测序列数据(例如下一个词或下一个像素)。NEXUS 分析企业表格中的多维关系。例如,在预测客户流失时,NEXUS 能理解多个因素(交易频率、支持工单和经济指标)如何影响流失可能性。
为什么现有方法存在不足
最有价值的企业数据存在于各种表格中,例如电子表格、企业资源计划(ERP)系统、客户关系管理(CRM)系统和关系型数据库。许多关键业务决策依赖于基于这些数据作出的预测。然而,当前工具存在显著局限:
- 传统 ML 需要数据科学家团队花费 3–6 个月,为单一用例构建、训练和部署模型。您会在预测质量与预测数量之间持续面临取舍。
- LLM 具有非确定性,在同一数据集上会产生不同答案。它们在分词过程中会丢失数值上下文,导致结构化数据上的结果不准确,并需要复杂的护栏机制来缓解这些问题。
NEXUS 专为表格数据设计,并提供如下优势:
- 排列不变性——能够识别列顺序的改变并不改变含义,这不同于 transformer 处理数据的方式。
- 十亿行能力——可处理海量数据集,无需截断或抽样。
- 跨模式推理——自动连接不同表格中的相关数据。
- 自主数据清洗——处理不完整条目(例如,即使存在缺失项,NEXUS 仍可进行预测)。
NEXUS 如何在 Amazon SageMaker AI 上工作
下图展示了在 SageMaker AI 上部署并使用 NEXUS 运行预测的端到端流程。

NEXUS 在 SageMaker AI 托管环境中的专用、单租户、网络隔离 GPU 实例上运行。工作流程包括以下步骤:
- 订阅并部署——在 AWS Marketplace 上订阅 NEXUS 模型包,然后将其作为 SageMaker AI 托管推理端点部署到 ml.p5en.48xlarge 实例(8× NVIDIA H200 GPU)上。
- 安装 SDK——安装 Fundamental Python SDK,并将其连接到您的 SageMaker 端点。该 SDK 提供熟悉的、兼容 scikit-learn 的 API,包含 NEXUSClassifier 和 NEXUSRegressor 估计器。
- 将数据上传到 Amazon S3——SDK 会序列化您的表格数据,并将其上传到您账户中的 Amazon Simple Storage Service(Amazon S3)存储桶。
- 训练模型——调用 clf.fit(X_train, y_train) 进行训练。NEXUS 会自动处理数据清理和特征工程,无需手动构建流水线。
- 生成预测——调用 clf.predict(X_test) 生成确定性预测,或调用 clf.predict_proba(X_test) 生成概率估计。结果会存回您的 Amazon S3 存储桶。
在整个过程中,您的数据都保留在您的 AWS 环境中。该端点采用网络隔离和单租户模式,使 NEXUS 适用于涉及敏感数据的企业工作负载。
在 Amazon SageMaker AI 上开始使用 NEXUS
要开始使用,请导航到 Amazon SageMaker JumpStart,搜索 Fundamental NEXUS,并从以下选项中选择:
- 基础模型(在超过 100 亿行表格数据上预训练)。
- 行业特定变体(金融、医疗保健和制造)。


改变各行业的企业用例
表格数据是企业决策的基础,从财务账簿到患者记录,再到供应链日志。NEXUS 专为此类数据构建,可帮助您在无需大量特征工程或模型训练的情况下,从原始结构化数据转向生产级预测。以下是 NEXUS 可创造价值的一些代表性用例。
金融服务
- 欺诈检测——分析数百万账户的交易模式。
- 信用风险建模——通过自动特征提取处理贷款组合。
- 监管合规——从非结构化监管申报文件中提取结构化数据。
医疗保健
- 临床试验匹配——在电子健康记录(EHR)系统中识别符合条件的患者。
- 药物发现——分析用于化合物筛选的生物测定数据。
- 患者风险分层——使用重症监护病房(ICU)时间序列数据预测再入院风险。
制造与供应链
- 预测性维护——基于传感器数据预测设备故障。
- 需求预测——预测全球分销网络中的库存需求。
- 供应商风险分析——使用采购历史评估供应商可靠性。
零售与电子商务
- 流失预测——利用购买历史和浏览行为识别有风险客户。
- 动态定价——根据竞争对手数据和库存水平优化价格。
- 购物车放弃分析——帮助您了解客户为何将商品留在在线购物车中。
为什么选择 Amazon SageMaker AI 上的 NEXUS
部署模型只是问题的一半。运行模型的基础设施决定了您从实验走向生产的速度。SageMaker AI 为企业级规模运行 NEXUS 提供托管、安全且可扩展的环境。NEXUS 与 AWS 共同减少无差别的繁重工作,使数据科学家能够专注于业务结果,而不是基础设施管理。
- 加速价值实现——预构建容器和脚本可缩短部署时间。
- 成本效率——SageMaker AI 的托管基础设施可降低运营开销。
- 可扩展性——自动扩展到 PB 级数据集。
- 合规就绪——默认满足 GDPR、HIPAA 和 SOC 2 要求。
- 持续学习——与 Amazon SageMaker Pipelines 原生集成,用于模型再训练。
- 多路复用支持——支持在单个 SageMaker AI 端点上执行多个拟合和预测操作,从而无需为每个用例配置专用资源。
战略性 AWS 合作伙伴关系
Fundamental 已与 AWS 建立战略合作伙伴关系,以加速企业采用:
- 原生集成——直接从 AWS Marketplace 部署 NEXUS。
- 安全基础设施——运行于 AWS 安全、合规的云环境。
- 企业支持——由专属 AWS Solutions Architects 提供实施指导。
后续步骤
准备好改变您的数据驱动决策了吗?
- 联系 Fundamental 团队了解更多信息。
- 在 Amazon SageMaker AI 的 JupyterLab 空间中试用托管示例笔记本。
结论
本文展示了 Amazon SageMaker AI 对 NEXUS 模型的支持如何帮助您从结构化数据资产中解锁新的洞察。无论您是在预测设备故障、优化供应链,还是检测金融欺诈,NEXUS 都可为企业预测工作负载提供确定性、可扩展的能力。
要了解更多信息,请参阅以下资源:
- Fundamental NEXUS 文档
- Amazon SageMaker AI 开发者指南
作者简介



