初级

Boston数据集随机森林

未完成

初级参考完整示例代码供参考，建议自己理解后重新输入

import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
data_url = "http://lib.stat.cmu.edu/datasets/boston"
raw_df = pd.read_csv(data_url, sep="\\s+", skiprows=22, header=None)
data = np.hstack([raw_df.values[::2, :], raw_df.values[1::2, :2]])
target = raw_df.values[1::2, 2]
boston = pd.DataFrame(data, columns=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B','LSTAT'])
boston['MEDV'] = target
X = boston.drop('MEDV', axis=1)
y = boston['MEDV']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=1)
for n_est in [50, 100, 200]:
    rf = RandomForestRegressor(n_estimators=n_est, random_state=1)
    rf.fit(X_train, y_train)
    pred = rf.predict(X_test)
    mse = mean_squared_error(y_test, pred)
    print(f'n_estimators={n_est}的测试MSE: {mse:.2f}')

示例

输入

solve()

期望输出

n_estimators=50的测试MSE: 12.36
n_estimators=100的测试MSE: 12.03
n_estimators=200的测试MSE: 11.90

Python 代码 🔒 登录后使用

def solve():
    pass

🔒

登录后即可练习

注册免费账号，在浏览器中直接运行 Python 代码

登录免费注册

Boston数据集随机森林

示例

登录后即可练习

升级 VIP

联系客服