从 4 个月到 7 天:Netflix 开源自家框架 Metaflow,性能像坐上了火箭

从 4 个月到 7 天:Netflix 开源自家框架 Metaflow,性能像坐上了火箭
2020年01月24日 17:59 CSDN

作者 | Rupert Thomas译者 | 凯隐编辑 | Jane来源 | AI科技大本营(ID:rgznai100) Metaflow 是由 Netflix 开发,用在数据科学领域的 Python框架,于 2019 年 12 月正式对外开源。据介绍,Metaflow 解决了数据科学家在可扩展性和版本控制方面面临的一些挑战,通过有向图中的一系列步骤来构建处理流水线。Metaflow 可以更容易地将本地流水线搬移到云资源上运行(不过目前仅支持 AWS 云)。每个步骤都在又向流程图中的独立节点上运行,并且具有唯一的依赖关系,Metaflow 则负责处理节点之间的内部通信。今天,我们就为大家介绍 Metaflow,希望对大家有所帮助。

Metaflow 简介 Metaflow 在  Netflix 内部已经被用于各个方面的机器学习任务,例如优化广告投递,视频编码等。Metaflow 其出现是为了提高模型的部署效率,让整个模型开发,部署,更新流程更加系统化,从而提高部署速度。 对数据科学家而言,他们更关注的是模型设计和特征工程等直接与模型性能相关的工作,并且希望能快速部署模型从而验证模型是否能在生产环境中有所提升,而不想在诸如环境依赖,版本控制,数据仓库管理等基本流程任务中浪费精力,Metaflow 的出现就是为了解决这个问题。

Metaflow 可以简化甚至自动完成底层任务,让数据科学家能更轻松,快速地部署模型,从而集中精力来提升模型性能以及在实际工程环境中的表现,提高生产力。因此,这是一款以人为中心的框架。近期,Netflix 也透露,Metaflow 已经将 Netflix 机器学习项目部署时间的中位数从四个月缩短到了仅仅7天。接下来将主要介绍Metaflow的工作原理和特点。

基本工作原理

如上图,可以用一个有向非循环图来表示工作流程,图中的每个节点都表示一个流程中的一个阶段,这些阶段可以是任意的 Python 代码,在上图的例子中,Metaflow 并行的训练两个不同版本的模型,并选择性能最好的那个。这是一种单机并行处理的方式,类似于 Python 中的  multiprocessing 包。如果要部署到云资源,只需要额外指定一个命令行参数 --with batch,即可告知 Metaflow 在云上运行代码。目前只支持亚马逊的 Web 服务器,不过应该很快就会支持更多云服务器。 每个阶段的末尾都有一个检查点,可以在以后的阶段中从任意检查点恢复执行,以帮助调试。但是你不能逐行检查您的代码。

版本控制 机器学习的版本控制颇具挑战性,因此 Metaflow 也特别照顾了这个问题。每个步骤的运行代码和数据都是散列(hash)的,图中每个节点的执行都被记录下来,并且超参数设置和运行结果都被存储:

from metaflow import FlowSpec, Parameter, stepclass FitModelFlow(FlowSpec): alpha = Parameter('alpha', help='Learning rate', default=0.01) @step def start(self): print('alpha is %f' % self.alpha) self.data = load_data() self.next(self.fit) @step def fit(self): self.model = fit(self.data) self.next(self.end) @step def end(self): print(f'Results for LR={self.alpha}: {eval(self.model)}')if __name__ == '__main__': FitModelFlow()

超参数的设置可以很容易地通过命令行参数来完成:

python metaflow_parameter.py run --alpha 0.001

元数据以 JSON 格式存储在文件系统中,可以访问存储在任何阶段的变量数据,也可以很容易地获取最后一次成功运行的结果。

run = Flow(flow_name).latest_successful_run

依赖管理 Metaflow 还提供了依赖管理机制,可以在图阶段或节点阶段通过装饰器来指定,并且可以指定特定的Python版本或特定的包:

from metaflow import FlowSpec, step, conda, conda_base@conda_base(python='3.6.5')class FitModelFlow(FlowSpec): @step def start(self): self.data = load_data() @conda(libraries={"scikit-learn": "0.19.2"}) @step def fit(self): from sklearn import svm self.model = svm.LinearSVC( ... )# ...

例如可以从命令行运行时指定 conda 环境标志:

python metaflow_conda.py --environment=conda run

开始使用Metaflow 可以通过pip命令来安装metaflow:

pip install metaflow

更多教程和详细介绍可以参考官方文档:https://docs.metaflow.org/getting-started/tutorials

财经自媒体联盟

新浪首页 语音播报 相关新闻 返回顶部