当前pandas
版本为:1.2.5。
pandas
数据结构在jupyter notebook
中以表格形式呈现。这些表格的格式化依赖于pandas
中的styler
对象。dateframe.style
属性返回值为styler
对象。
styler
对象的方法的返回值大部分还是styler
对象,styler
对象支持链式调用,这样就可以将多种样式叠加在一起。
1. 显示值格式化
pandas
在notebook中的值分为显示值和实际值。styler.format()
方法可以格式化显示值。
styler.format()
方法的签名如下:styler.format(formatter, subset=none, na_rep=none)
styler.format()
方法具有以下参数:
formatter
:格式。类型为字符串、可调用对象、字典或none
。默认值为none
。- 字符串:格式化字符串。
- 字典:键为列索引,值为对应列的格式化字符串。
- 可调用对象:参数为单独的一个值即元素,返回值为字符串。
- 可调用对象字典:键为列索引,值为可调用对象。
subset
:用于指定生效范围,即dataframe
的索引。na_rep
:缺失值的显示值。类型为字符串。默认为none
,即不作任何更改。
styler.format()
方法的返回值为styler
对象。
案例:styler.format()
方法formatter
参数演示
本案例案例中,formatter
参数分别采用字符串、字典、可调用对象字典对dataframe
进行格式化。
首先对设置所有单元格均保留小数点后2位数字,然后再设置b列显示为百分比保留2位小数,最后将c列字符串设置为大写。
import numpy as np
import pandas as pd
df = pd.dataframe(np.random.randn(4, 2), columns=['a', 'b'])
df['c'] = ['a', 'b', 'c', 'd']
df.style.format("{:.2f}").format({
'b':"{:.2%}"}).format({
'c': str.upper})
运行df
可知,df
的通过styler
对象格式化的显示值不影响实际值。
2. 内置显示值格式化方法
为了便于格式化显示值,styler
类内置了一些针对所有单元格的全局性的内置方法。
设置浮点数精度
styler.set_precision()
方法用于全局设置浮点数的显示精度。
styler.set_precision()
方法的签名如下:styler.set_precision(precision)
styler.set_precision()
方法具有一个参数: precision
:指定浮点数的显示精度。类型为整数。
styler.set_precision()
方法的返回值为styler
对象。
设置缺失值显示值
styler.set_na_rep()
方法可用于全局设置缺失值的显示值。
styler.set_na_rep()
方法的签名如下:styler.set_na_rep(na_rep)
styler.set_na_rep()
方法只有一个参数: na_rep
:指定缺失值显示值。类型为字符串。
styler.set_na_rep()
方法的返回值为styler
对象。
案例:演示styler.set_precision()
方法和styler.set_na_rep()
方法
import numpy as np
import pandas as pd
df = pd.dataframe(np.random.randn(4, 2), columns=['a', 'b'])
df.iloc[1, 1] = np.nan
df.style.set_precision(3).set_na_rep('fail')
3. 表格外观
styler
类还定义了一些与数据无关的控制表格外观的方法
设置表格标题
styler.set_caption()
方法可用于设置表格的标题。
styler.set_caption()
方法的签名如下:styler.set_caption(caption)
styler.set_caption()
方法只有一个参数: caption
:指定表格的标题。类型为字符串。
styler.set_caption()
方法的返回值为styler
对象。
隐藏行索引
styler.hide_index()
方法可用于隐藏行索引。
styler.hide_index()
方法的签名如下:styler.hide_index()
styler.hide_index()
方法的返回值为styler
对象。
隐藏列
styler.hide_columns()
方法可用于隐藏列。
styler.hide_columns()
方法的签名如下:styler.hide_columns(subset)
styler.hide_columns()
方法只有一个参数 subset
:用于指定生效范围,即dataframe
的索引。
styler.hide_columns()
方法的返回值为styler
对象。
案例:演示设置标题、隐藏行索引、隐藏列
import numpy as np
import pandas as pd
df = pd.dataframe(np.random.randn(4, 3), columns=['a', 'b', 'c'])
df.style.set_caption("标题").hide_index().hide_columns("a")
4. 样式复用
通过styler
对象构建的样式可以复用。styler.export()
方法用于输出样式,styler.use()
方法用于应用样式,两者往往配合使用。
输出样式
styler.export()
方法可用于输出样式,往往与styler.use()
方法配合使用。
styler.export()
方法的签名如下:styler.export()
styler.export()
方法的返回值为样式函数列表。
输出样式
styler.use()
方法可用于应用样式,往往与styler.export()
方法配合使用。
styler.use()
方法的签名如下:styler.use(styles)
styler.use()
方法具有一个参数 styles
:指定样式。类型为样式函数列表,通常为styler.use(styles)
方法的返回值。
styler.use()
方法的返回值为styler
对象。
案例:复用样式
import numpy as np
import pandas as pd
df = pd.dataframe(np.random.randn(4, 2), columns=['a', 'b'])
style1 = df.style.highlight_max()
style1
df2=-df
df2.style.use(style1.export())