大家好,我是章北海
介绍一个非常Cool的拖拽式数据分析工具
PyGWalkerPyGWalker 是个在 Jupyter Notebook 环境中运行的可视化探索式分析工具,仅一条命令即可生成一个可交互的图形界面,以类似 Tableau/PowerBI 的方式,通过拖拽字段进行数据分析。
过去在 python 中进行数据可视化分析时,经常需要查询大量的可视化类的代码,并编写胶水代码将其应用在数据集上。PyGWalker 的目标是通过一行代码,将数据集转化为一个可视化分析工具,只需拖拉拽即可生成图表,从而减少数据分析师在数据可视化上的时间成本。
为什么叫 PyGWalker?PyGWalker,全称为"Python binding of Graphic Walker",将 Jupyter Notebook(或类 Jupyter Notebook) 和 Graphic Walker 集成。Graphic Walker 是一个轻量级的 Tableau/Power BI 开源替代品,可以帮助数据分析师使用简单的拖拉拽操作,进行数据可视化和探索。
From https://github.com/Kanaries/pygwalker/blob/main/docs/README.zh.md
安装、极简使用使用 pip 或 Conda 安装 pygwalker
pip install pygwalker在您的 Jupyter Notebook 中导入 pygwalker 和 pandas 来开始使用。
import pandas as pdimport pygwalker as pyg使用拖拉拽,直接操作 dataframe,创建可视化视图,完成数据分析:
使用PyGWalker制作数据可视化图--快速预览数据
使用PyGWalker制作数据可视化图--分面图 (Facet)
使用PyGWalker制作数据可视化图--连接视图(Concat)
其他玩法玩法还有很多
比如生成一个html页面并在网页中拖拽式数据分析
import pygwalker as pygimport pandas as pddf = pd.read_csv("https://kanaries-app.s3.ap-northeast-1.amazonaws.com/public-datasets/bike_sharing_dc.csv")with open("pyg_demo.html", "w", encoding="utf-8") as f: html = pyg.to_html(df) f.write(html)它还可以
与gradio、streamlit、dash结合将数据可视化导出为代码PyGwalker还有R版本one more thing事实上类似的工具还有一个——LUX
https://github.com/lux-org/lux
用法也极其相似
# 安装 pip install lux-apiimport luximport pandas as pddf = pd.read_csv("college.csv")df图解机器学习 - 中文版(72 张 PNG)
ChatGPT 、大模型系列研究报告(50+ 个 PDF)
搭建完美的写作环境:工具篇(12 章)
108页PDF小册子:搭建机器学习开发环境及Python基础
116页PDF小册子:机器学习中的概率论、统计学、线性代数
《全网最全 Python、机器学习、AI、LLM 速查表(100 余张)》