民主化与自动化:降低机器学习门槛的六大工具
发布于:2019-12-07 05:15   编辑:admin 

曩昔,v博平台机器学习这个名词的头上从前笼着科学的光环,只要少量高薪数据科学家才懂得怎么用数据“喂食”杂乱的算法,得出有用的剖析成果。但现在跟着主动化东西的快速开展,数据的收集、结构化和剖析现已变得愈加简略,机器学习的运用门槛现已大幅下降,即便那些不明白编程的业务人员,只要能提出正确的问题,相同也能用机器学习东西得到想要的成果。

机器学习的民主化进程正在加快,标志之一便是AutoML最近成了抢手词汇,所谓AutoML便是给机器学习算法添加了一个主动化的meta层。曩昔,机器学习算法的杂乱之处在于需求进行很多选项和参数设置来“微调”,而数据科学家们的精力80-99%都花在这上面。AutoML能够主动测验并调优很多参数,不光大大下降算法运用门槛,也加快了算法调优进程。

AutoML是云核算的天作之合,由于在云端AutoML能够调用满足的机器算力来并行处理并回来成果,一起,AutoML也十分合适机器学习的新手按部就班自行探究机器学习运用。

以下介绍的六种机器学习东西为那些运用数字、电子表格和数据的人们打开了通向机器学习国际的大门,并且不需求他们成为编程和数据科学方面的专家。

Splunk开始是作为一种查找东西,对Web运用程序创立的很多日志文件进行查找。现在它现已开展成为能够剖析一切方式数据的东西,特别是时刻序列和其他按次序生成的数据。Splunk能够将将数据剖析成果显现在一个杂乱的可视化仪表板中。

最新的Splunk版别包含将数据源与TensorFlow等机器学习东西和一些最佳Python开源东西集成的运用程序。它们供给快速解决计划,用于检测反常值,符号反常并生成对未来值的猜测。它们经过优化,能够在十分大的数据会集大海捞针。

DataRobot内部的仓库是一些用R、Python或其他几个渠道编写的最好的开源机器库的调集。DataRobot有一个Web界面,显现用于设置管道的相似流程图的东西。DataRobot衔接到一切首要数据源,包含本地数据库,云数据存储和下载的文件或电子表格。您构建的管道能够整理数据,填充缺失值,然后生成符号反常值并猜测未来值的模型。

DataRobot还能够测验供给关于为什么进行某些猜测的“人性化解说”,这是了解AI怎么作业的有用功用。

它能够布置在云和本地解决计划的混合计划中。云端施行能够经过共享资源供给最大的并行性和吞吐量,而本地装置供给更多的隐私和操控。

H2O对自己的定位是“无人驾驶AI”,这个主动化仓库能够用来探究各种机器学习解决计划。它将数据源衔接在一起,并将它们供给给具有各种参数的各种算法。您能够操控分配给特定使命的时刻量和核算资源,并在预算内测验各种参数组合。你也能够经过仪表板或Jupyter笔记原本探究和审阅成果。

H2O的中心机器学习算法以及与Spark等东西的集成是开源的,但所谓的“无人驾驶”选项是销售给企业客户的专有软件包之一,供给技术支持。

RapidMiner生态系统的中心是一个根据可视图标进行数据剖析的作业室软件。用户只需拖放图标来生成一个管道,进行数据整理,然后经过各种统核算法运转它。假如您想运用机器学习而不是更传统的数据科学,主动模型将从多种分类算法中进行挑选,并查找各种参数,直到找到最佳拟合。该东西的方针是生成数百个模型,然后确认最佳模型。

创立模型后,该东西能够布置它们,一起测验它们的成功率并解说模型怎么做出决议计划。能够运用可视化作业流编辑器测验和调整对不同数据字段的敏感度。

最近的增强功用包含更好的文本剖析,用于构建可视化仪表板的更多品种的图表以及用于剖析时刻序列数据的更杂乱的算法。

BigML仪表板供给了数据科学的常用根本东西用于辨认数据相关性,这是更杂乱的机器学习作业的根底。例如,他们的Deepnets供给了用于测验和优化更精密的神经网络的杂乱机制。能够将模型的质量与其他算法进行比较,并运用标准化的比较结构,协助您在经典数据科学和更杂乱的机器学习之间进行挑选。

BigML的仪表板在浏览器中运转,其剖析能够在BigML云中运转,也能够在服务器机房中运转。云版别的价格设置较低,以鼓舞前期测验; 乃至还有一个免费图层。本钱首要取决于数据集巨细的约束以及能够调用的核算资源量。免费套餐将运用不超越两个并行运转的进程剖析最多16MB的数据。较小的付费账户的定价十分合理,每月只需30美元,但跟着资源需求的添加,本钱会上升。

R关于非程序员用户来说并不友爱,但它仍然是杂乱统计剖析最重要的东西之一,由于它十分受中心数据科学家的欢迎。R Studio是一个东西,为用户供给一组菜单和点击选项,使其更简略与内部运转的R层交互。

经过R Studio,那些能够处理电子表格的高档管理人员能够运用最简略的选项来运转根本剖析,乃至是一些杂乱的剖析。尽管R Studio的有些部分仍然让普通用户感到困惑,但R Studio正处于敞开的边际,每个乐意投入一些时刻的人都能够拜访运用,关于想要探究顶级东西的人来说,R Studio值得一试。