105 lines
2.6 KiB
R
105 lines
2.6 KiB
R
# ouverture du dataset
|
|
forest <- read.csv("forest.txt", sep="", stringsAsFactors=TRUE)
|
|
forest$Observation <- as.factor(forest$Observation) # observation comme facteur
|
|
summary(forest)
|
|
|
|
### Q1
|
|
forest_P <- forest[,1:10]
|
|
library(ade4)
|
|
forest_pca <- dudi.pca(forest_P)
|
|
|
|
# pourcentage expliqué par chaque variable
|
|
forest_pca$eig/sum(forest_pca$eig)
|
|
# premier 57.27 % et le deuxième 15.83%
|
|
|
|
### Q2
|
|
s.corcircle(forest_pca$co)
|
|
|
|
### Q3
|
|
boxplot(forest$FWI ~ forest$Observation,
|
|
xlab = "Présence de feu",
|
|
ylab = "FWI",
|
|
names = c("pas de feu", "feu"),
|
|
col = c("blue","orange" ),
|
|
main = "FWI en fonction de la présence de feu")
|
|
|
|
hist(forest$FWI[forest$Observation=="0"])
|
|
hist(forest$FWI[forest$Observation=="1"])
|
|
var.test(forest$FWI ~ forest$Observation)
|
|
|
|
t.test(forest$FWI ~ forest$Observation)
|
|
wilcox.test(forest$FWI ~ forest$Observation)
|
|
|
|
|
|
### Q4
|
|
|
|
reg <- lm(forest$FWI ~ forest$Temperature + forest$Ws)
|
|
summary(reg)
|
|
# les deux sont significatifs
|
|
# une augmentation d'un degré augmente le FWI de 1.28
|
|
# une augmentation du vent de 1 km/h augmente le FWI de 0.55
|
|
|
|
par(mfrow=c(2,2))
|
|
plot(reg)
|
|
# cond application ok mais bof
|
|
|
|
### Q5
|
|
|
|
summary(lm(forest$FWI ~ forest$Temperature * forest$Ws))
|
|
# température et vent plus significatifs
|
|
# mais forte intéraction entre les deux
|
|
|
|
cor.test(forest$Temperature , forest$Ws)
|
|
cor(forest$Ws , forest$Temperature)
|
|
# forte corrélation
|
|
|
|
### Q6
|
|
|
|
modèle <- glm(forest$FWI ~ forest$FFMC + forest$DMC + forest$DC + forest$ISI + forest$BUI)
|
|
exp(modèle$coefficients)
|
|
summary(modèle)
|
|
|
|
mod <- lm(forest$FWI ~ forest$FFMC + forest$ISI + forest$BUI)
|
|
summary(mod)
|
|
|
|
anova(modèle, mod)
|
|
|
|
### Q7
|
|
library(MASS)
|
|
mon_image<-kde2d(x=forest$FFMC + forest$ISI + forest$BUI,y=forest$FWI,n=100)
|
|
image(mon_image,
|
|
legend = T,
|
|
las=1)
|
|
par(mfrow=c(2,2))
|
|
plot(mod)
|
|
# y a des outliers
|
|
|
|
### Q8
|
|
|
|
mode <- glm(forest$Observation ~ forest$Temperature + forest$RH + forest$Ws + forest$Region, family = "binomial")
|
|
summary(mode)
|
|
# humidité et température effet significatif
|
|
exp(mode$coefficients)
|
|
# température qui multiplie l'OR = risque de 1.38 donc qd température augmente d'un degré le risque augmente de 38 %
|
|
# humidité augmente d'une unité diminutio du risque d'envirion 3% (1-0.97)
|
|
|
|
|
|
### Q9
|
|
model <- glm(forest$Observation ~ forest$Region, family = "binomial")
|
|
summary(model)
|
|
|
|
# région B plus que feu que région A significatif
|
|
# être région B augmente risque de feu de 94%
|
|
exp(model$coefficients)
|
|
#OR départ 1
|
|
1.94/(1+1.94)
|
|
# nv proba = 0.66 => 66 %
|
|
|
|
|
|
### Q11
|
|
|
|
chisq.test(table(forest$Observation, forest$Region))
|
|
# c'est bien significatif
|
|
table(forest$Observation, forest$Region)
|
|
# plus de feu en B que en A
|
|
|