您现在的位置：首页 > IT资讯 > 精选文章 > 使用NeptuneAI跟踪PyTorch闪电实验

使用NeptuneAI跟踪PyTorch闪电实验

2020-08-04 19:07:00　|　来源：中培企业IT培训网

想使用PyTorch Lightning来构建您的深度学习代码，并且不介意学习它的日志记录功能吗?不知道闪电具有强大的海王星集成吗？为什么选择PyTorchLightning？如果您从未听说过，PyTorch Lightning是PyTorch之上非常轻便的包装器，它更像是编码标准，而不是框架。该格式可让您摆脱大量样板代码，同时使其易于遵循。结果是一个框架，为研究人员，学生和生产团队提供了最大的灵活性，使他们可以灵活地尝试疯狂的想法，而无需学习另一个框架，同时自动删除所有工程细节。

您可以立即使用的一些很棒的功能是：

· 在CPU，GPU或TPU上进行训练而无需更改代码，

· 简单的多GPU和多节点训练

· 普通的16位精度支持

· 内置性能分析器（Trainer(profile=True)）

· 以及其他众多功能。

但是，通过这种强大的功能轻松进行实验，以及灵活地调整所需的任何东西，都会带来问题。如何跟踪所有变化，例如：

· 损失和指标，

· 超参数，

· 模型二进制文件，

· 验证预测，

　　还有其他可以帮助您组织实验过程的东西？

幸运的是，PyTorch闪电为您提供了一个选项，可轻松将记录仪连接到 pl.Trainer可以跟踪前面提到的所有内容（以及许多其他内容）的受支持记录器之一是 NeptuneLogger将您的实验保存在……您猜中了海王星。海王星不仅跟踪您的实验工件，而且：

· 让我们监视所有实时情况

· 提供了一个不错的用户界面，您可以在其中过滤，分组和比较各种实验运行

· 访问您从Python脚本或Jupyter Notebook以编程方式记录的实验数据。最好的部分是，这种集成确实使用起来很简单。

　　注意：

您也可以查看此colab笔记本，并尝试我们将要讨论的示例。

　　基本整合

在最简单的情况下，您只需创建 NeptuneLogger：

from pytorch_lightning.logging.neptune import NeptuneLogger

neptune_logger = NeptuneLogger(

api_key="ANONYMOUS",

project_name="shared/pytorch-lightning-integration")

并将其传递给的logger参数 Trainer并适合您的模型。

from pytorch_lightning import Trainer

trainer = Trainer(logger=neptune_logger)

trainer.fit(model)

这样，您将获得：

· 记录度量和损失并创建图表，

· 保存超参数（如果通过闪电参数定义）

· ，记录硬件利用率

· Git信息和执行脚本已记录

　　高级选项

海王星为您提供了许多自定义选项，您可以简单地记录更多特定于实验的内容，例如图像预测，模型权重，性能图表等。

所有这些功能都可供Lightning用户使用，在接下来的部分中，我将向您展示如何充分利用Neptune。

　　在创建NeptuneLogger时记录其他信息

创建记录器时，可以记录其他有用的信息：

· 代码：快照脚本，jupyter笔记本，配置文件等。

· 超参数：对数学习率，历元数和其他事物（如果您使用的是闪电） hparams来自闪电的对象将被自动记录。

· 属性：日志数据位置，数据版本或其他内容。

· 标签：添加“ resnet50”或“ no-augmentation”之类的标签来组织跑步。

· 名称：每个实验都应使用一个有意义的名称，因此我们不要每次都使用“默认”。

只需将此信息传递给记录器即可：

neptune_logger = NeptuneLogger(

api_key="ANONYMOUS",

project_name="shared/pytorch-lightning-integration",

experiment_name="default", # Optional,

params={"max_epochs": 10,

"batch_size": 32}, # Optional,

tags=["pytorch-lightning", "mlp"] # Optional,

upload_source_files=["**/*.py", "*.yaml"] # Optional,

)

并像以前一样继续进行操作，以获得像这样的组织好的仪表板。

　　训练期间记录多余的东西

培训期间可以记录很多有趣的信息。

您可能对监视以下内容感兴趣：

每个时期之后的模型预测（考虑预测蒙版或覆盖的边界框）

　　模型检查点或其他对象

真的很简单。只是去你的LightningModule 和海王星实验的调用方法 self.logger.experiment。

例如，我们可以记录每个时期之后的损失直方图：

class CoolSystem(pl.LightningModule):

def validation_end(self, outputs):

# OPTIONAL

avg_loss = torch.stack([x['val_loss'] for x in outputs]).mean()

tensorboard_logs = {'val_loss': avg_loss}

# log debugging images like histogram of losses

fig = plt.figure()

losses = np.stack([x['val_loss'].numpy() for x in outputs])

plt.hist(losses)

self.logger.experiment.log_image('loss_histograms', fig)

plt.close(fig)

return {'avg_val_loss': avg_loss, 'log': tensorboard_logs}

您在训练期间可能想要记录的其他内容是：

· self.logger.experiment.log_metric#记录自定义指标

· self.logger.experiment.log_text#记录文本值

· self.;ogger.experiment.log_artifact# 日志文件

· self.logger.experiment.log_image#记录图像，图表

· self.logger.experiment.set_property#添加键：值对

· self.logger.experiment.append_tag#为组织添加标签

很酷吧？但这不是您能做的！

　　培训结束后记录日志

.fit循环结束后，不必完成对实验的跟踪。

您可能要跟踪 trainer.test(model) 或计算一些其他验证指标并将其记录下来。

为此，您只需要告诉 NeptuneLogger 适合后不关闭：

neptune_logger = NeptuneLogger(

api_key="ANONYMOUS",

project_name="shared/pytorch-lightning-integration",

close_after_fit=False,

...

)

…并且您可以继续记录

　　测试指标：

trainer.test(model)

　　其他（外部）指标：

from sklearn.metrics import accuracy_score

...

accuracy = accuracy_score(y_true, y_pred)

neptune_logger.experiment.log_metric('test_accuracy', accuracy)

　　测试集上的性能图表：

from scikitplot.metrics import plot_confusion_matrix

import matplotlib.pyplot as plt

...

fig, ax = plt.subplots(figsize=(16, 12))

plot_confusion_matrix(y_true, y_pred, ax=ax)

neptune_logger.experiment.log_image('confusion_matrix', fig)

　　整个模型检查点目录：

neptune_logger.experiment.log_artifact('my/checkpoints')

直接将实验信息提取到笔记本中

您可以在实验完成后获取实验，分析结果并根据需要更新指标，工件或其他内容。

例如，让我们将实验仪表板获取到pandas DataFrame：

import neptune

project = neptune.init('shared/pytorch-lightning-integration')

project.get_leaderboard().head()

或通过海王星HiPlot集成使用HiPlot将其可视化：

from neptunecontrib.viz import make_parallel_coordinates_plot

make_parallel_coordinates_plot(

metrics= ['train_loss', 'val_loss', 'test_accuracy'],

params = ['max_epochs', 'batch_size', 'lr'])

或获取单个实验并使用训练后计算出的一些外部指标对其进行更新：

exp = project.get_experiments(id='PYTOR-63')[0]

exp.log_metric('some_external_metric', 0.92)

如您所见，您可以从Pytorch Lightning登录到Neptune。

如果您想更深入地了解这一点：

· 阅读集成文档

· 去看看海王星，看看它可以做的其他事情，

· 在colab上试用Lightning + Neptune

　　最终思想

Pytorch Lightning是一个很棒的库，可以帮助您：

· 整理您的深度学习代码，使其他人容易理解它，

· 将开发样板外包给经验丰富的工程师团队，

· 无需更改代码即可访问许多最新功能，

借助Neptune集成，您可以免费获得其他一些功能：

· 您可以监控并跟踪您的深度学习实验，

· 您可以轻松地与他人分享您的研究，

· 您和您的团队可以访问实验元数据并更有效地协作。

以上即是关于使用NeptuneAI跟踪PyTorch闪电实验的全部内容，想了解更多关于NeptuneAI的信息，请继续关注中培教育。

标签： NeptuneAI PyTorch

上一篇：2020年Kubernetes的9大安全实践
下一篇：如何使您的机器学习模型保持最新

热门课程推荐

使用NeptuneAI跟踪PyTorch闪电实验

相关阅读

国家注册信息安全专业人员CISP认证

企业数字化转型规划设计

产品经理如何真实的挖掘和体现需求最佳实践

Python核心编程及可视化界面开发实战

DAMA中国数据治理专家CDGP认证

黑客攻防技术与网络安全架构实战

大数据平台搭建与高性能计算最佳实战

微服务及高并发、高可用架构设计与最佳实践

IT服务管理ITIL 4 Foundation认证

大数据分析挖掘与可视化最佳实践

预约领优惠