题目
主观题 56.(10分)import pandas as pd#创建一个包含'Name','Age','City'列的DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],'Age': [25, 30, 35, 40, 45],'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix']}df = pd.__ (data)#取出DataFrame的最后两行数据last_two_rows = df.__#计算'Age'列的平均值average_age = df['Age']. __#根据'Name'列对DataFrame进行排序sorted_df = df.sort_values(by='Name')#选取'Name'列和'City'列name_city = df[__, __]
主观题 56.(10分)
import pandas as pd
#创建一个包含'Name','Age','City'列的DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],
'Age': [25, 30, 35, 40, 45],
'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix']
}
df = pd.__ (data)
#取出DataFrame的最后两行数据
last_two_rows = df.__
#计算'Age'列的平均值
average_age = df['Age']. __
#根据'Name'列对DataFrame进行排序
sorted_df = df.sort_values(by='Name')
#选取'Name'列和'City'列
name_city = df[__, __]
题目解答
答案
1. 创建DataFrame:`df = pd.DataFrame(data)`。
2. 取最后两行:`last_two_rows = df.tail(2)`。
3. 计算'Age'平均值:`average_age = df['Age'].mean()`,结果为35.0。
4. 按'Name'排序:`sorted_df = df.sort_values(by='Name')`。
5. 选'Name'和'City'列:`name_city = df[['Name', 'City']]`。
完整代码:
```python
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],
'Age': [25, 30, 35, 40, 45],
'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix']
}
df = pd.DataFrame(data)
last_two_rows = df.tail(2)
average_age = df['Age'].mean()
sorted_df = df.sort_values(by='Name')
name_city = df[['Name', 'City']]
```
解析
本题主要考查Pandas库的基本操作,包括:
- 创建DataFrame对象:将字典数据转化为结构化数据框;
- 数据选取:通过
tail()方法提取最后几行数据; - 统计计算:使用
mean()计算列的平均值; - 数据排序:通过
sort_values()按指定列排序; - 列选择:通过列名列表筛选特定列。
解题核心思路是理解Pandas常用方法的调用方式,并注意语法细节(如方法参数、括号使用等)。
1. 创建DataFrame
- 关键方法:
pd.DataFrame(data)将字典转化为DataFrame。 - 注意:
pd.DataFrame首字母大写,且需要传入字典参数。
2. 取出最后两行
- 关键方法:
df.tail(2)默认提取最后n行,此处n=2。 - 注意:
tail()是无参数时默认提取最后5行,需显式传入2。
3. 计算Age平均值
- 关键方法:
df['Age'].mean()对Age列计算均值。 - 注意:
mean()方法无需参数,直接返回数值结果。
4. 按Name排序
- 关键方法:
df.sort_values(by='Name')按Name列升序排序。 - 注意:
sort_values()默认升序,by参数指定排序依据。
5. 选取Name和City列
- 关键语法:
df[['Name', 'City']]通过列名列表筛选多列。 - 注意:双括号
[[ ]]表示选择多列,单列用单括号[ ]。