Loading... ## pandas是什么? <button class=" btn m-b-xs btn-danger " onclick="window.open('https://zhuanlan.zhihu.com/p/162789863','_blank')">初识pandas</button> <div class="panel panel-default collapse-panel box-shadow-wrap-lg"><div class="panel-heading panel-collapse" data-toggle="collapse" data-target="#collapse-a8325444376eaa3f97ab07da4422cc4888" aria-expanded="true"><div class="accordion-toggle"><span style="">初识pandas原文内容</span> <i class="pull-right fontello icon-fw fontello-angle-right"></i> </div> </div> <div class="panel-body collapse-panel-body"> <div id="collapse-a8325444376eaa3f97ab07da4422cc4888" class="collapse collapse-content"><p></p> ***江湖上流传着这么一句话——分析不识潘大师(PANDAS),纵是老手也枉然。*** [Pandas](https://link.zhihu.com/?target=https%3A//www.pypandas.cn/),**python+data+analysis**的组合缩写,是python中基于numpy和matplotlib的第三方数据分析库,与后两者共同构成了python数据分析的基础工具包,享有数分三剑客之名。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为 **最强大、最灵活、可以支持任何语言的开源数据分析工具** 。 ![](https://pic1.zhimg.com/80/v2-ca37b25a9a1eac080f4d3667ec52da8c_720w.jpg) ### Pandas 适用的数据类型 * 与 SQL 或 Excel 表类似的,含异构列的表格数据; * 有序和无序(非固定频率)的时间序列数据; * 带行列标签的矩阵数据,包括同构或异构型数据; * 任意其它形式的观测、统计数据集, 数据转入 Pandas 数据结构时不必事先标记。 ### Pandas的特色功能 * 按索引匹配的广播机制,这里的广播机制与[numpy广播机制](https://zhuanlan.zhihu.com/2020/06/28/Numpy%E7%9A%84%E5%B9%BF%E6%92%AD%E6%9C%BA%E5%88%B6/)还有很大不同 * 便捷的数据读写操作,相比于numpy仅支持数字索引,pandas的两种数据结构均支持标签索引,包括bool索引也是支持的 * 类比SQL的join和groupby功能,pandas可以很容易实现SQL这两个核心功能,实际上,SQL的绝大部分DQL和DML操作在pandas中都可以实现 * 类比Excel的数据透视表功能,Excel中最为强大的数据分析工具之一是数据透视表,这在pandas中也可轻松实现 * 自带正则表达式的字符串向量化操作,对pandas中的一列字符串进行通函数操作,而且自带正则表达式的大部分接口 * 丰富的时间序列向量化处理接口 * 常用的数据分析与统计功能,包括基本统计量、分组统计分析等 * 集成matplotlib的常用可视化接口,无论是series还是dataframe,均支持面向对象的绘图接口 <p></p></div></div></div> ## 我们需要掌握到哪里? 根据我看学考的题目和看书加上私聊了老师,我们基本上要掌握的pandas的知识点,是非常简单的 显然,安装pandas不是重点,当然,如果你自己能够写出程序,我想就算你的想法跟填的空对不上号,你总是能看懂的 譬如 用,为分割值,而用到了while!!!还float。。。 其实一句就解决了 [float(i) for i in a.split(',')] 嗯哼,目前我的困境就是这样,当然,后面的树啊这种的肯定不会简单到哪里去的,毕竟我根本就用不到这些,我想其实以后学计科这种的,应该也不太会碰到这种的数据结构了 ## 好,现在,立刻,入门pandas! 经过我的这个,,看法啊,其实学考班基本上是没有多少人学了的,譬如勒。。。。根本性的一个问题 一个对象的属性和方法,拿啥区别啊? 当然是“()”啊! 比如我们pandas的Dataframe这个对象df df.index和df.count() 前者是这个(df)的一个属性,后者,是该对象的方法,基本上都是叫函数!虽然,没有任何的面向对象基础,但是类和对象是一定要搞清的,起码,对象是什么 ### 对象是什么? 我们尝尝这样诉说对象:万物皆为对象,正如你面前的这台设备,它就是一个对象,一个对象有属性和方法(起码可以从这两方面来给他定义) df.count会返回df的函数对象,而df.count()会返回该方法的返回结果。 下面来看整理的知识点 [pandas知识点001](http://blog.a152.top/usr/uploads/2022/01/2498828289.html "http://blog.a152.top/usr/uploads/2022/01/2498828289.html") Last modification:February 5, 2022 © Allow specification reprint Support Appreciate the author AliPayWeChat Like 2 如果觉得我的内容对你有用,请随意赞赏