【Pandas】Anaconda及Pandas快速入门
Anaconda是什么
这个就不多bb了,用到时自然就理解了。
常用命令
1 | conda create -n 虚拟环境名字 python=3.8 # 创建虚拟环境 python=3.8 指定python版本 |
创建虚拟环境(-n是-name)
- conda create -n 虚拟环境名字 python=3.8
进入虚拟环境
- conda activate
退出虚拟环境
- conda deactivate 虚拟环境名字
删除虚拟环境
- conda remove -n 虚拟环境名字 –all
查看所有虚拟环境
- conda env list
查看虚拟环境中的所有包
- conda list
给Anaconda添加镜像源
- conda config –add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
- conda config –add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- conda config –set show_channel_urls yes
- conda config –set show_channel_urls yes的意思是从channel中安装包时显示channel的url,这样就可以知道包的安装来源了。
以后这些东西还会用到的,这里放个链接方便以后查阅:
Pandas介绍及Quickstart
Pandas是什么
pandas是用于数据分析的开源Python库,可以实现数据加载,清洗,转换,统计处理,可视化等功能。
csv和tsv文件格式简介
csv 和 tsv 文件都是存储一个二维表数据的文件类型。
注意:其中csv文件每一列的列元素之间以逗号进行分割,tsv文件每一行的列元素之间以\t进行分割。
所以说当你加载tsv文件的时候需要制定分割符:\t
指定分隔符:sep或者delimiter
loc函数获取指定行列的数据
基本格式:
| 语法 | 说明 |
|---|---|
df.loc[[行标签1, ...], [列标签1, ...]] |
根据行标签和列标签获取对应行的对应 列的数据,结果为:DataFrame |
df.loc[[行标签1, ...]] |
根据行标签获取对应行的所有列的数据 结果为:DataFrame |
df.loc[:, [列标签1, ...]] |
根据列标签获取所有行的对应列的数据 结果为:DataFrame |
df.loc[行标签] |
1)如果结果只有一行,结果为:Series 2)如果结果有多行,结果为:DataFrame |
df.loc[[行标签]] |
无论结果是一行还是多行,结果为DataFrame |
df.loc[[行标签], 列标签] |
1)如果结果只有一列,结果为:Series, 行标签作为 Series 的索引标签 2)如果结果有多列,结果为:DataFrame |
df.loc[行标签, [列标签]] |
1)如果结果只有一行,结果为:Series, 列标签作为 Series 的索引标签 2)如果结果有多行,结果为DataFrame |
df.loc[行标签, 列标签] |
1)如果结果只有一行一列,结果为单个值 2)如果结果有多行一列,结果为:Series, 行标签作为 Series 的索引标签 3)如果结果有一行多列,结果为:Series, 列标签作为 Series 的索引标签 4)如果结果有多行多列,结果为:DataFrame |
iloc函数获取指定行列的数据
基本格式:
| 语法 | 说明 |
|---|---|
df.iloc[[行位置1, ...], [列位置1, ...]] |
根据行位置和列位置获取对应行的对应 列的数据,结果为:DataFrame |
df.iloc[[行位置1, ...]] |
根据行位置获取对应行的所有列的数据 结果为:DataFrame |
df.iloc[:, [列位置1, ...]] |
根据列位置获取所有行的对应列的数据 结果为:DataFrame |
df.iloc[行位置] |
结果只有一行,结果为:Series |
df.iloc[[行位置]] |
结果只有一行,结果为:DataFrame |
df.iloc[[行位置], 列位置] |
结果只有一行一列,结果为:Series, 行标签作为 Series 的索引标签 |
df.iloc[行位置, [行位置]] |
结果只有一行一列,结果为:Series, 列标签作为 Series 的索引标签 |
df.iloc[行位置, 行位置] |
结果只有一行一列,结果为单个值 |
loc和iloc的切片操作
基本格式:
| 语法 | 说明 |
|---|---|
df.loc[起始行标签:结束行标签, 起始列标签:结束列标签] |
根据行列标签范围获对应行的对应列的数据,包含起始行列标签和结束行列标签 |
df.iloc[起始行位置:结束行位置, 起始列位置:结束列位置] |
根据行列标签位置获对应行的对应列的数据,包含起始行列位置,但不包含结束行列位置 |
[] 语法获取指定行列的数据
基本格式:
| 语法 | 说明 |
|---|---|
df[['列标签1', '列标签2', ...]] |
根据列标签获取所有行的对应列的数据,结果为:DataFrame |
df['列标签'] |
根据列标签获取所有行的对应列的数据 1)如果结果只有一列,结果为:Series, 行标签作为 Series 的索引标签 2)如果结果有多列,结果为:DataFrame |
df[['列标签']] |
根据列标签获取所有行的对应列的数据,结果为:DataFrame |
df[起始行位置:结束行位置] |
根据指定范围获取对应行的所有列的数据,不包括结束行位置 |
CodeDemo
1 | # -*- coding: utf-8 -*- |
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.


