← 返回题库
初级

删除缺失率超过30%的字段

未完成
初级参考 完整示例代码供参考,建议自己理解后重新输入
def solve():
    from pyodide.http import open_url
    from io import StringIO
    loans_raw_csv = open_url("https://data.zuihe.com/dbd/riskctrl/state_02/loans_raw.csv").read()
    loans_clean_csv = open_url("https://data.zuihe.com/dbd/riskctrl/state_02/loans_clean.csv").read()
    import pandas as pd
    from io import StringIO
    df = pd.read_csv(StringIO(loans_raw_csv))
    high_miss = df.columns[df.isnull().mean()>0.3].tolist()
    print(f"缺失率>30%的列: {high_miss}")
    df2 = df.drop(columns=high_miss)
    print(f"删除后列数: {df2.shape[1]}(原{df.shape[1]}列)")

示例

输入
solve()
期望输出
缺失率>30%的列: []
删除后列数: 47(原47列)
Python 代码 🔒 登录后使用
🔒

登录后即可练习

注册免费账号,在浏览器中直接运行 Python 代码