dst-lola/DST-2021.R

105 lines
2.6 KiB
R

# ouverture du dataset
forest <- read.csv("forest.txt", sep="", stringsAsFactors=TRUE)
forest$Observation <- as.factor(forest$Observation) # observation comme facteur
summary(forest)
### Q1
forest_P <- forest[,1:10]
library(ade4)
forest_pca <- dudi.pca(forest_P)
# pourcentage expliqué par chaque variable
forest_pca$eig/sum(forest_pca$eig)
# premier 57.27 % et le deuxième 15.83%
### Q2
s.corcircle(forest_pca$co)
### Q3
boxplot(forest$FWI ~ forest$Observation,
xlab = "Présence de feu",
ylab = "FWI",
names = c("pas de feu", "feu"),
col = c("blue","orange" ),
main = "FWI en fonction de la présence de feu")
hist(forest$FWI[forest$Observation=="0"])
hist(forest$FWI[forest$Observation=="1"])
var.test(forest$FWI ~ forest$Observation)
t.test(forest$FWI ~ forest$Observation)
wilcox.test(forest$FWI ~ forest$Observation)
### Q4
reg <- lm(forest$FWI ~ forest$Temperature + forest$Ws)
summary(reg)
# les deux sont significatifs
# une augmentation d'un degré augmente le FWI de 1.28
# une augmentation du vent de 1 km/h augmente le FWI de 0.55
par(mfrow=c(2,2))
plot(reg)
# cond application ok mais bof
### Q5
summary(lm(forest$FWI ~ forest$Temperature * forest$Ws))
# température et vent plus significatifs
# mais forte intéraction entre les deux
cor.test(forest$Temperature , forest$Ws)
cor(forest$Ws , forest$Temperature)
# forte corrélation
### Q6
modèle <- glm(forest$FWI ~ forest$FFMC + forest$DMC + forest$DC + forest$ISI + forest$BUI)
exp(modèle$coefficients)
summary(modèle)
mod <- lm(forest$FWI ~ forest$FFMC + forest$ISI + forest$BUI)
summary(mod)
anova(modèle, mod)
### Q7
library(MASS)
mon_image<-kde2d(x=forest$FFMC + forest$ISI + forest$BUI,y=forest$FWI,n=100)
image(mon_image,
legend = T,
las=1)
par(mfrow=c(2,2))
plot(mod)
# y a des outliers
### Q8
mode <- glm(forest$Observation ~ forest$Temperature + forest$RH + forest$Ws + forest$Region, family = "binomial")
summary(mode)
# humidité et température effet significatif
exp(mode$coefficients)
# température qui multiplie l'OR = risque de 1.38 donc qd température augmente d'un degré le risque augmente de 38 %
# humidité augmente d'une unité diminutio du risque d'envirion 3% (1-0.97)
### Q9
model <- glm(forest$Observation ~ forest$Region, family = "binomial")
summary(model)
# région B plus que feu que région A significatif
# être région B augmente risque de feu de 94%
exp(model$coefficients)
#OR départ 1
1.94/(1+1.94)
# nv proba = 0.66 => 66 %
### Q11
chisq.test(table(forest$Observation, forest$Region))
# c'est bien significatif
table(forest$Observation, forest$Region)
# plus de feu en B que en A