############################################################################################################################### # Objet : TP 3 - HAB711B Description et inference DESINF - UE Master 1 # # # Responsables UE : Bastien Merigot et Julien Claude ############################################################################################################################### ############################################################################################################################### # Comparaison de deux moyennes # Test-t de Student # L'exercice vise à déterminer l'effet d'un traitement (nature de la vitamine C) sur la longueur cellulaire. # Pour cela l'objectif est de comparer les deux moyennes de longueurs cellulaires soumises à un traitement vitamine C naturelle et un traitement vitamine C synthétique. # ############################################################################################################################### #Charger les données orange.csv orange<-read.table(file.choose(), sep=";", dec=",", header=T) edit(orange) # Penser à fermer la fenetre ensuite, sinon impossible d'exécuter des commandes dans la console head(orange) dim(orange) # lister les variables names(orange) # lister le contenu d'une variable longueur # reconnaissance de la variable attach(orange) longueur # Nombre d'observations pour chaque modalité d'une variable qualitative table(traitement) # Statistiques calculées sur une variable quantitative mean(longueur) var(longueur) sd(longueur) summary(longueur) # Statistiques par modalité de la variable qualitative tapply(longueur, traitement, mean) tapply(longueur, traitement, sd) tapply(longueur, traitement, summary) # Que déduisez vous des comparaisons des valeurs de moyennes, écart types et des autres statistiques ? data<-split(orange, traitement) data boxplot(longueur~as.factor(traitement)) # Etape 1 = évaluer la normalité des données shapiro.test(data$Ascorbique$longueur) qqnorm(data$Ascorbique$longueur) qqline(data$Ascorbique$longueur, col="red") shapiro.test(data$Orange$longueur) qqnorm(data$Orange$longueur) qqline(data$Orange$longueur, col="red") # Que déduisez vous concernant la normalité des données ? # Quelle est donc l'étape suivante ? # Etape 2 = Evaluer l'homogénéité des variances (homoscédasticité) var.test(data$Ascorbique$longueur, data$Orange$longueur) # Que déduisez vous concernant l'homogénéité des variances ? # Quelle est donc l'étape suivante ? # Etape 3 = Test de student sur échantillons non appariés avec hypothèse d'homoscédasticité vérifiée t.test(data$Orange$longueur, data$Ascorbique$longueur, alternative = c("two.sided"), var.equal = TRUE, paired=F) # Test bilatéral t.test(data$Orange$longueur, data$Ascorbique$longueur, alternative = c("greater"), var.equal = TRUE, paired=F) # test unilatéral à droite avec H1: mu(Orange)>mu(ascorbique) t.test(data$Orange$longueur, data$Ascorbique$longueur, alternative = c("less"), var.equal = TRUE, paired=F) # test unilatéral à gauche avec H1: mu(Orange)