失效链接处理 |
Pandas数据结构详解 PDF 下载
本站整理下载:
相关截图:
主要内容:
简介
Series 是一个带有 名称 和索引的一维数组,既然是数组,肯定要说到的就是数组中的元素类型,在 Series 中包含的数据类型可以是整数、浮点、字符
串、Python对象等。
假定有一个场景是:存储一些用户的信息,暂时只包括年龄信息。
我们可以通过 Series 来存储,这里我们通过 Series 存储了四个年龄:18/30/25/40,只需将要存储的数据构建成一个数组,然后赋值给data参数即可。
In [2]: # 存储了 4 个年龄:18/30/25/40
user_age = pd.Series(data=[18, 30, 25, 40])
user_age
executed in 49ms, finished 15:22:11 2018-06-04
Out[2]: 0 18
1 30
2 25
3 40
dtype: int64
可以看到,已经正确将多个年龄存储到 Series 中了,你可能会想,单独存储了年龄有什么用,我怎么知道这个年龄属于哪个用户呢?
我们可以通过 Series 的 index(索引)来解决这个问题。由于有四个年龄,自然地也需要四个姓名,所以我们需要构建一个与 data 长度相同的数组,
然后通过下面的操作即可满足要求。
In [3]: user_age.index = ["Tom", "Bob", "Mary", "James"]
user_age
executed in 30ms, finished 15:22:11 2018-06-04
Out[3]: Tom 18
Bob 30
Mary 25
James 40
dtype: int64
你看,现在姓名与年龄已经完全对应上了。虽然说我们自己知道 Tom/Bob 这些是姓名,但是别人不知道啊,我们怎么告诉他人呢?
要想让别人知道,我们可以为 index 起个名字。
In [4]: user_age.index.name = "name"
user_age
executed in 35ms, finished 15:22:11 2018-06-04
Out[4]: name
Tom 18
Bob 30
Mary 25
James 40
dtype: int64
可能你还会想,如果别人在看我写的代码,怎么能快速的知道我这写的到底是什么玩意呢?
别急,就像我们给index起名字一样,我们也可以给 Series 起个名字。
In [5]: user_age.name="user_age_info"
user_age
executed in 22ms, finished 15:22:11 2018-06-04
Out[5]: name
Tom 18
Bob 30
Mary 25
James 40
Name: user_age_info, dtype: int64
通过上面一系列的操作,我们对 Series 的结构上有了基本的了解,简单来说,一个 Series 包括了 data、index 以及 name。
上面的操作非常方便做演示来使用,如果想要快速实现上面的功能,可以通过以下方式来实现。
In [6]: # 构建索引
name = pd.Index(["Tom", "Bob", "Mary", "James"], name="name")
# 构建 Series
user_age = pd.Series(data=[18, 30, 25, 40], index=name, name="user_age_info")
user_age
executed in 23ms, finished 15:22:11 2018-06-04
Out[6]: name
Tom 18
Bob 30
Mary 25
James 40
Name: user_age_info, dtype: int64
另外,需要说明的是我们在构造 Series 的时候,并没有设定每个元素的数据类型,这个时候,pandas 会自动判断一个数据类型,并作为 Series 的类
型。
当然了,我们也可以自己手动指定数据类型。
In [7]: # 指定类型为浮点型
user_age = pd.Series(data=[18, 30, 25, 40], index=name, name="user_age_info", dtype=float)
user_age
executed in 25ms, finished 15:22:11 2018-06-04
Out[7]: name
Tom 18.0
Bob 30.0
Mary 25.0
James 40.0
Name: user_age_info, dtype: float64
Series 像什么
Series 包含了 dict 的特点,也就意味着可以使用与 dict 类似的一些操作。我们可以将 index 中的元素看成是 dict 中的 key。
|