# Questão: Predição de Preços de Casas com Scikit-learn Um cientista de dados deseja criar um modelo de regressão linear para prever o preço de uma casa com base em seu tamanho (em metros quadrados). Ele coletou os seguintes dados: | Tamanho (m²) | Preço (mil reais) | |-------------|------------------| | 50 | 200 | | 80 | 320 | | 100 | 400 | | 150 | 600 | | 200 | 800 | --- ## Parte 1 - Preparação dos Dados Com base nos dados acima, qual das seguintes opções representa corretamente a separação das variáveis `X` (entrada) e `y` (saída) no Scikit-learn? **a)** ```python X = [50, 80, 100, 150, 200] y = [200, 320, 400, 600, 800] ``` **b)** ```python X = [[50], [80], [100], [150], [200]] y = [200, 320, 400, 600, 800] ``` **c)** ```python X = [50, 80, 100, 150, 200] y = [[200], [320], [400], [600], [800]] ``` **d)** ```python X = [[50, 80, 100, 150, 200]] y = [200, 320, 400, 600, 800] ``` ## Parte 2 - Treinamento do Modelo Após definir corretamente X e y, o cientista de dados quer criar e treinar o modelo de regressão linear no Scikit-learn. Qual das seguintes opções completa corretamente o código abaixo? ```python from sklearn.linear_model import LinearRegression modelo = LinearRegression() _____ # Linha que falta aqui modelo.fit(X, y) ``` **a)** `modelo.train(X, y)` **b)** `modelo.learn(X, y)` **c)** `modelo.fit(X, y)` **d)** `modelo.prepare(X, y)` ## Parte 3 - Predição O modelo treinado agora pode prever preços de casas com base no tamanho. Se o cientista de dados usar o seguinte código: ```python preco_previsto = modelo.predict([[120]]) print(preco_previsto) ``` E sabendo que a relação entre tamanho e preço é linear, qual será o preço previsto para uma casa de 120m²? **a)** 500 mil reais **b)** 450 mil reais **c)** 480 mil reais **d)** 420 mil reais