显示Alteryx机器学习中Auto Insight步骤中列关联的弦图https://www.alteryx.com/“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>Alteryx,一家在自助数据准备和管道领域最知名的上市公司,作为其的一部分,它一直具有有趣且重要的AI/机器学习(ML)功能https://www.alteryx.com/products/alteryx-platform/alteryx-designer“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>设计器平台。但今天,在它的 虚拟全球激励 活动中,该公司宣布了一些重要的新AI/ML功能,这些功能应能引起业务用户和高级用户的共鸣。
另请阅读: Alteryx说让我们看一看
ZDNet听取了Alteryx首席数据和分析官(CDAO)关于新产品的简报,艾伦•雅各布森(Alan Jacobson),两年前从福特汽车公司(Ford Motor company)全球分析总监一职加入该公司。Jacobson亲自演示了Intelligence Suite功能和Alteryx机器学习产品,详细介绍了后者。
Alteryx的Intelligence Suite将机器学习和文本挖掘选项卡引入Designer,添加了自然语言处理(NLP)和文本挖掘;基于图像的数据和光学字符识别(OCR)的计算机视觉能力;以及主题建模和情感分析。Jacobson将这组特性描述为“Pythonic“相当于Alteryx基于R程序设计语言。Intelligence Suite还添加了一些轻型自动机器学习(AutoML)功能。
但是如果AutoML是您所追求的,那么您需要看看新的Alteryx机器学习产品,这是一个独立的、基于云(和浏览器)的产品。该产品提供了完整的API驱动操作,对于Alteryx的许多客户来说可能更重要的是,它提供了一个优秀的用户界面,帮助非数据科学家通过一系列步骤从数据集到优化的ML模型。
第一步,“准备数据”,提供数据摄取、基本数据分析和“数据健康”(数据质量)支持。第二步,“Auto Insight”的特点是自动生成洞察,以支持Alteryx所称的洞察第一模型开发过程。雅各布森解释说,Alteryx采用这种方法是因为从模型本身汲取见解,而不是将其用于评分和预测分析,这通常是数据科学的目标。本着这种精神,用户可以看到相关的可视化效果(包括本文顶部图中显示的交互式和弦图),异常值和用户选择的目标变量的预测分布。
Auto Insight步骤中的高级设置允许用户通过设置排名指标、AutoML测试运行的时间限制、其中的最大迭代次数来准备生成ML模型,交叉验证设置以及是否应启用模型“ensembling”。用户还可以使用Alteryx的“深度功能合成”和内置功能库执行自动功能工程,这些功能库源自于2019年对麻省理工学院衍生功能实验室的收购。
另请阅读: Alteryx购买Feature Labs来自动化ML功能工程
接下来是“Auto Model”步骤,它启动了AutoML探测,在模型性能排名的排行榜中显示进度,相对于基准模型。在流程结束时,位于排行榜顶部的模型将成为推荐模型。在最后一个“ReviewModel”步骤中,用户可以查看推荐模型的常规统计信息和用于生成推荐模型的处理管道,并可以查看其性能的可视化效果。Auto Model步骤中的Insights选项卡非常有价值,因为它总结了功能重要性、部分依赖性和Alteryx Promote,用于开发、测试和生产环境的托管部署。Alteryx机器学习功能的一个子集可以在开源库中找到https://woodwork.alteryx.com/en/stable/“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>木制品,撰写,功能工具https://evalml.alteryx.com/en/stable/“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>EvalML,所有这些都在GitHub上提供。Alteryx Designer也继续提供到其他AutoML平台的连接器,包括https://www.datarobot.com/“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>DataRobot,H20无人驾驶AI,和分析过程自动化(APA)平台。
Alteryx收购ClearStory data的Yhat(其前任CEO,Sharmila Mulligan,是Alteryx的首席战略和营销官)和功能实验室似乎已经联合起来,为公司今天宣布的各种产品和功能提供动力。由于该公司的股价较2020年7月的高点下跌了近57%,因此需要加大力度。今天的声明无疑指出了正确的方向。