0


pandas_profiling:1行代码即可生成详细的数据分析报告

Python是程序员和数据科学家最常用的编程语言之一。程序员喜欢Python是因为它简单但是功能强大。数据科学家喜欢Python,因为大多数机器学习和深度学习库都在Python中可用。

在现实世界中,当我们为任何项目或客户工作时,我们都需要了解数据。数据是每个行业的决定性因素。我们需要应用不同的编程逻辑,分析和进一步的建模练习来了解数据。

它花费了大量的时间来分析数据并使数据适合您的任务。在python中,我们有一个库,可以在单个python代码行中创建一个端到端数据分析报告。

本文将介绍这个库,它可以在单个代码行中为我们提供详细的数据分析报告。你唯一需要的就是数据!

pandas_profiling

pandas_profiling是最著名的python库之一,程序员可以使用它在一行python代码中立即获取数据分析报告。

要安装此库,可以使用pip命令,如下所示。

pip install pandas_profiling

安装了pandas_profiling,我们就可以使用下面的import命令导入该库。

import pandas_profiling
import pandas as pd

我们将使用pandas来导入数据集。

对于本文,我们将使用开源房屋价格数据(https://www.kaggle.com/anmolkumar/house-price-prediction-challenge/tasks?taskId=2304)

我们准备好数据,就可以使用1行python代码生成数据分析报告,如下所示。

hourse_price_report=pandas_profiling.ProfileReport(df)

运行以下命令后,将看到进度条,该进度条根据特定参数生成数据概要分析报告。

成功生成报告后,我们可以将报告另存为HTML文件并与他人共享。

使用下面的代码行将报告保存为HTML格式。

hourse_price_report.to_file('house_report.html')

可以从数据分析报告中获得什么?

总体数据汇总

有关每个变量的详细信息

变量之间每个相关性的详细可视化

缺失值计数

互动分析

总结

分析报告可以为我们提供数据的总体总结、关于每个特性的详细信息、特征之间关系的可视化表示、关于缺失数据的详细信息,以及许多可以帮助我们更好地理解数据的更有趣的见解。而这些我们只用了一行代码。

作者:Pranjal Saxena

原文地址:https://towardsdatascience.com/1-line-of-python-code-for-data-profiling-660496883d8f

deephub翻译组

标签:

“pandas_profiling:1行代码即可生成详细的数据分析报告”的评论:

还没有评论