# ouverture du dataset forest <- read.csv("forest.txt", sep="", stringsAsFactors=TRUE) forest$Observation <- as.factor(forest$Observation) # observation comme facteur summary(forest) ### Q1 forest_P <- forest[,1:10] library(ade4) forest_pca <- dudi.pca(forest_P) # pourcentage expliqué par chaque variable forest_pca$eig/sum(forest_pca$eig) # premier 57.27 % et le deuxième 15.83% ### Q2 s.corcircle(forest_pca$co) ### Q3 boxplot(forest$FWI ~ forest$Observation, xlab = "Présence de feu", ylab = "FWI", names = c("pas de feu", "feu"), col = c("blue","orange" ), main = "FWI en fonction de la présence de feu") hist(forest$FWI[forest$Observation=="0"]) hist(forest$FWI[forest$Observation=="1"]) var.test(forest$FWI ~ forest$Observation) t.test(forest$FWI ~ forest$Observation) wilcox.test(forest$FWI ~ forest$Observation) ### Q4 reg <- lm(forest$FWI ~ forest$Temperature + forest$Ws) summary(reg) # les deux sont significatifs # une augmentation d'un degré augmente le FWI de 1.28 # une augmentation du vent de 1 km/h augmente le FWI de 0.55 par(mfrow=c(2,2)) plot(reg) # cond application ok mais bof ### Q5 summary(lm(forest$FWI ~ forest$Temperature * forest$Ws)) # température et vent plus significatifs # mais forte intéraction entre les deux cor.test(forest$Temperature , forest$Ws) cor(forest$Ws , forest$Temperature) # forte corrélation ### Q6 modèle <- glm(forest$FWI ~ forest$FFMC + forest$DMC + forest$DC + forest$ISI + forest$BUI) exp(modèle$coefficients) summary(modèle) mod <- lm(forest$FWI ~ forest$FFMC + forest$ISI + forest$BUI) summary(mod) anova(modèle, mod) ### Q7 library(MASS) mon_image<-kde2d(x=forest$FFMC + forest$ISI + forest$BUI,y=forest$FWI,n=100) image(mon_image, legend = T, las=1) par(mfrow=c(2,2)) plot(mod) # y a des outliers ### Q8 mode <- glm(forest$Observation ~ forest$Temperature + forest$RH + forest$Ws + forest$Region, family = "binomial") summary(mode) # humidité et température effet significatif exp(mode$coefficients) # température qui multiplie l'OR = risque de 1.38 donc qd température augmente d'un degré le risque augmente de 38 % # humidité augmente d'une unité diminutio du risque d'envirion 3% (1-0.97) ### Q9 model <- glm(forest$Observation ~ forest$Region, family = "binomial") summary(model) # région B plus que feu que région A significatif # être région B augmente risque de feu de 94% exp(model$coefficients) #OR départ 1 1.94/(1+1.94) # nv proba = 0.66 => 66 % ### Q11 chisq.test(table(forest$Observation, forest$Region)) # c'est bien significatif table(forest$Observation, forest$Region) # plus de feu en B que en A