初级
Default数据集验证集方法
未完成
初级参考
完整示例代码供参考,建议自己理解后重新输入
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
default = pd.read_csv('https://liangdaima.com/static/data/statistics/Default.csv')
default['default'] = (default['default'] == 'Yes').astype(int)
X = default[['income', 'balance']]
y = default['default']
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.3, random_state=42)
model = LogisticRegression()
model.fit(X_train, y_train)
pred = model.predict(X_val)
print('验证集错误率:', 1 - accuracy_score(y_val, pred))
示例
输入
solve()
期望输出
验证集错误率: 0.026666666666666616
👑
升级 VIP
解锁全部题目,畅通无阻地学习
- ✓ 解锁全部训练包所有题目
- ✓ 查看完整参考代码和提示
- ✓ 浏览器内直接运行 Python 代码
- ✓ 自动批改 + 进度追踪
30天
¥18
1年
¥99
2年
¥158
3年
¥199