中级
用G-mean寻找最优分类阈值
未完成
中级参考
代码结构已给出,请填写 ____ 处
def solve():
from pyodide.http import open_url
from io import StringIO
loans_featured_csv = open_url(____).read()
import pandas as pd, numpy as np
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix
from io import StringIO
df = pd.read_csv(StringIO(____))
num_cols=[c for c in df.select_dtypes(____).columns if c not in ['____','____'] and not c.endswith(____)]
X=df[num_cols].fillna(____); y=df['____']
X_tr,X_te,y_tr,y_te=train_test_split(____)
gb=GradientBoostingClassifier(____)
gb.fit(____)
prob=gb.predict_proba(____)[:,____]
best_gm,best_thr=____,____
for thr in np.arange(____,____,____):
pred=(____).astype(____)
tn,fp,fn,tp=confusion_matrix(____).ravel()
gm=np.sqrt(tp/(____)*tn/(____))
if gm>best_gm: best_gm,best_thr=gm,thr
print(____)
print(____)
示例
输入
solve()
期望输出
最优阈值: 0.20 最优G-mean: 0.6440
👑
升级 VIP
解锁全部题目,畅通无阻地学习
- ✓ 解锁全部训练包所有题目
- ✓ 查看完整参考代码和提示
- ✓ 浏览器内直接运行 Python 代码
- ✓ 自动批改 + 进度追踪
30天
¥18
1年
¥99
2年
¥158
3年
¥199