HeatWave ML完全自动化模型训练 推理和解释
Oracle 宣布,除了以前可用的事务处理和分析之外, Oracle MySQL HeatWave现在还支持数据库内机器学习 (ML) — 唯一支持此功能的 MySQL 云数据库服务. MySQL HeatWave ML完全自动化了 ML 生命周期,并将所有经过训练的模型存储在 MySQL 数据库中,无需将数据或模型移动到机器学习工具或服务中。消除 ETL 可降低应用程序复杂性、降低成本并提高数据和模型的安全性。HeatWave ML 包含在所有 37 个 Oracle 云基础设施 (OCI) 区域的 MySQL HeatWave 数据库云服务中。
到目前为止,为 MySQL 应用程序添加机器学习功能对于许多开发人员来说非常困难且耗时。首先,存在从数据库中提取数据并进入另一个系统以创建和部署 ML 模型的过程。这种方法创建了多个孤岛,用于将机器学习应用于应用程序数据,并在数据移动时引入延迟。它还导致数据库中数据的扩散,使其更容易受到安全威胁,并增加了开发人员在多个环境中编程的复杂性。其次,现有服务期望开发人员成为指导 ML 模型训练过程的专家;否则,模型是次优的,这会降低预测的准确性。最后,大多数现有的 ML 解决方案都没有
MySQL HeatWave ML 通过在 MySQL 数据库中本地集成机器学习功能来解决这些问题,无需将数据 ETL 到另一个服务。HeatWave ML 完全自动化训练过程,并为给定数据集和指定任务创建具有最佳算法、最佳特征和最佳超参数的模型。HeatWave ML 生成的所有模型都可以提供模型和预测解释。
没有其他云数据库供应商直接在其数据库服务中提供如此高级的 ML 功能。Oracle发布了 ML 基准测试在大量公开可用的机器学习分类和回归数据集(例如 Numerai、Namao 和 Bank Marketing 等)中执行。平均而言,在最小的集群上,HeatWave ML 训练机器学习模型的速度提高了 25 倍,成本仅为 Redshift ML 的 1%。此外,在更大的 HeatWave 集群上进行训练时,相对于 Redshift ML 的性能优势会增加。训练是一个耗时的过程,由于使用 MySQL HeatWave 可以非常高效和快速地完成,客户现在可以更频繁地重新训练他们的模型并跟上数据的变化。这使模型保持最新并提高了预测的准确性。
“正如我们在单个数据库中集成分析和事务处理一样,我们现在将机器学习引入 MySQL HeatWave,” Oracle 首席企业架构师Edward Screven说。“MySQL HeatWave 是 Oracle 增长最快的云服务之一。越来越多的客户已经从 Amazon 和其他云数据库服务迁移到 MySQL HeatWave,并获得了显着的性能改进和更低的成本。今天,我们还宣布了一些"