TC. Statistiques à deux variables

Sommaire

Nuage de points. Point moyen.

Série statistique à deux variables

Dans une population, on étudie deux caractères quantitatifs x et y.

Dans cet exemple, les deux séries sont : le rang de l’année et le nombre de naissances de jumeaux comme dans le tableau ci-dessous.

Définition:

Dans un repère, le nuage de points associé à la série statistique est l’ensemble des points de coordonnées   (x_i;y_i).

Par exemple les points (0;11483) , (1;11479483) , (2;11431) , …

Le point moyen de ce nuage est le point G de coordonnées \bar x et \bar y\bar x est la moyenne des x_i et \bar y est la moyenne des y_i.

Exercice n°1 : voici la série à deux variables :

  1. Représenter dans un repère le nuage de points.

a. A l’aide de la TI 83 Premium CE.

b. A l’aide de Géogébra.

Lors de l’ouverture de la fenêtre Géogébra, cliquer à droite sur Tableur.

Saisir les valeurs de x dans la colonne  A et les valeurs de y dans la colonne  B.

On sélectionne les deux colonnes A et B.

On clique sur le deuxième onglet en haut à partir de la gauche.On clique dans le menu déroulant sur statistiques à deux variables.

Le graphique apparaît à droite.

2. Déterminer les coordonnées du point moyen noté G.

a. A l’aide de la TI 83 Premium CE.

b. A l’aide de Géogébra.

On a déjà obtenu la représentation graphique à la question 1.b.

On clique sur le premier onglet en haut à droite de l’écran symbolisé par \Sigma X .Au milieu apparaît une colonne  Statistiques. Les coordonnées de G sont les deux premières moyennes.

Exercice n°2 : Le tableau ci-dessous donne le nombre de pages visitées, exprimé en milliers, durant chacune des
quatre semaines suivant l’ouverture d’un site internet.

  1. Représenter dans un repère le nuage de points.

a. A l’aide de la TI 83 Premium CE.

b. A l’aide de Géogébra.

Lors de l’ouverture de la fenêtre Géogébra, cliquer à droite sur Tableur.

Saisir les valeurs de x dans la colonne  A et les valeurs de y dans la colonne  B.

On sélectionne les deux colonnes A et B.

On clique sur le deuxième onglet en haut à partir de la gauche.On clique dans le menu déroulant sur statistiques à deux variables.

Le graphique apparaît à droite.

2. Déterminer les coordonnées du point moyen noté G.

a. A l’aide de la TI 83 Premium CE.

b. A l’aide de Géogébra.

On a déjà obtenu la représentation graphique à la question 1.b.

On clique sur le premier onglet en haut à droite de l’écran symbolisé par \Sigma X .Au milieu apparaît une colonne  Statistiques. Les coordonnées de G sont les deux premières moyennes.

Ajustement affine d’un nuage de points.

Droite d’ajustement affine.Droite des moindres carrés.

Définition :

Lorsque les points d’un nuage sont sensiblement alignés, réaliser un ajustement affine revient à tracer une droite qui passe au plus près des points du nuage. 

Propriété :

La droite des moindres carrés a pour équation y=ax+b avec a=\frac{cov(x,y)}{var(x)} et b=\bar y-a\bar x.

Pour calculer cov(x,y) qui est la covariance des séries statistiques x et y, on applique la formule suivante : 

cov(x,y)=\frac{(x_1-\bar x)(y_1-\bar y)+(x_2-\bar x)(y_2-\bar y)+…+(x_n-\bar x)(y_n-\bar y)}{n}

On reprend l’exercice n°1 avec les naissances de jumeaux. On va déterminer l’équation de la droite des moindres carrés avec la calculatrice TI-83 Premium :

On reprend l’exercice n°1 avec les naissances de jumeaux. On va déterminer l’équation de la droite des moindres carrés avec Géogébra.

On reprend où on en était arrivés à l’exercice 1 question 2.b.

En bas de l’écran, sous Modèle d’ajustement, il y a un cadre. Cliquer sur le petit triangle et sélectionner Linéaire dans le menu déroulant.

Exercice n°3 : Une machine est achetée 3000 euros.
Le prix de revente y, exprimé en euros, est donné en fonction du nombre x d’années d’utilisation par
le tableau suivant :

  1. Représenter dans un repère le nuage de points.

2. Déterminer, à l’aide de la calculatrice, une équation de la droite d’ajustement affine de y en x par la méthode des moindres carrés (on donnera les coefficients sous forme décimale, arrondis au centième).
Tracer cette droite sur le graphique précédent.

Coefficient de corrélation.

Définition : coefficient de corrélation linéaire

Le coefficient de corrélation linéaire d’une série statistique de variables x et y est le nombre r défini par :

r=\frac{cov(x,y)}{\sigma(x)\sigma(y)}.

Propriété :

Le coefficient de corrélation linéaire d’une série statistique  r vérifie -1\leq r\leq 1.

  • si r=- 1 ou r= 1 alors les points du nuage sont quasiment alignés et l’ajustement affine est adapté.
  • si r= 0 les points sont très dispersés autour de la droite et l’ajustement affine n’est pas adapté.

Exercice n°4 : voici une série à deux variables :

Déterminer r, le coefficient de corrélation linéaire de cette série statistique et tracer la droite d’ajustement affine de y en x par la méthode des moindres carrés.

Ajustement et changement de variable.

Exercice n°5 :

Un centre d’appel comptait en 2001 soixante-six employés. Le tableau ci-dessous donne l’évolution
du nombre d’employés en fonction du rang de l’année.

On cherche à étudier l’évolution du nombre y d’employés en fonction du rang x de l’année.
Une étude graphique montre qu’un ajustement affine ne convient pas.
On pose alors z=\sqrt y -3
1. Recopier et compléter le tableau suivant (on donnera les résultats sous forme décimale, arrondis au centième)

2. Représenter le nuage de points M_i(x_i;z_i) associé à cette série statistique, dans le plan muni
d’un repère orthonormal d’unité graphique 1 cm.
Un ajustement affine vous paraît-il approprié ? Justifier la réponse.

3. Déterminer, à l’aide de la calculatrice, une équation de la droite d’ajustement affine de z en x par la méthode des moindres carrés (on donnera les coefficients sous forme décimale, arrondis
au centième).
Tracer cette droite sur le graphique précédent.

4. En utilisant cet ajustement, à partir de quelle année peut-on prévoir que l’effectif de ce centre
d’appel dépassera 900 employés ?

Exercice n°6 ES Antilles 2008

Le tableau suivant donne l’évolution du nombre d’adhérents d’un club de rugby de 2001 à 2006.

On cherche à étudier l’évolution du nombre y d’adhérents en fonction du rang x de l’année.
Partie A : un ajustement affine.
1. Dans le plan muni d’un repère orthogonal d’unités graphiques : 2 cm pour une année sur
l’axe des abscisses et 1 cm pour 20 adhérents sur l’axe des ordonnées, représenter le nuage de
points associé à la série (x_i;y_i)

2. Déterminer une équation de la droite d’ajustement de y en x obtenue par la méthode des moindres carrés et la tracer sur le graphique précédent (aucune justification n’est exigée, les
calculs seront effectués à la calculatrice et les coefficients seront arrondis à l’unité).

3. En supposant que cet ajustement reste valable pour les années suivantes, donner une estimation du nombre d’adhérents en 2007.

Partie B : un ajustement exponentiel.
On pose z = ln y.
1. Recopier et compléter le tableau suivant en arrondissant les valeurs de zi au millième.

2. Déterminer une équation de la droite d’ajustement de z en x obtenue par la méthode des moindres carrés (aucune justification n’est exigée, les calculs seront effectués à la calculatrice et les coefficients seront arrondis au millième).

3. En déduire une approximation du nombre d’adhérents y en fonction du rang x de l’année.

4. En prenant l’approximation y\approx 57.1e^{0.224x} et en supposant qu’elle reste valable pour les années suivantes, donner une estimation du nombre d’adhérents en 2007.

Partie C : comparaison des ajustements.
En 2007, il y a eu 280 adhérents. Lequel des deux ajustements semble le plus pertinent ?
Justifier la réponse.

Exercice n°7 : centres étrangers juin 2008 ES

Une association organise chaque année un séjour qui s’adresse à des adultes handicapés. À sa création en 1997, dix adultes handicapés sont partis durant cinq jours. Ainsi, on dira qu’en 1997 le nombre de « journées participant » est de 5\times 10 soit 50.
Le tableau suivant donne le nombre de « journées participant » de 1997 à 2004. L’année 1997 a le rang 0.

On représente les données à l’aide ce nuage de points :

On considère qu’un ajustement affine n’est pas pertinent. L’allure du nuage suggère de chercher un ajustement de y en x de la forme y = k ln(ax +b)k, a, b sont trois nombres réels.
Pour cela on pose z_i= e^{\frac{y_i}{100}}

Dans cette question les calculs seront effectués à la calculatrice. Aucune justification n’est demandée. Les résultats seront arrondis au centième.
1.a. Recopier et compléter le tableau suivant :

b. Représenter le nuage de points associé à la série (x_i;z_i) dans un repère orthonormal.

c. Donner les coordonnées du point moyen.

d. Déterminer une équation de la droite D d’ajustement affine de z en x par la méthode des moindres carrés. Représenter la droite D sur le graphique. 

e. Sachant que  z_i=e^{\frac{y_i}{100}}  déterminer l’expression de y en fonction de x.

2. On suppose que l’évolution du nombre de « journées participant » se poursuit dans un futur
proche selon le modèle précédent.
 Estimer, à l’unité près, quel serait le nombre de « journées participant » prévu pour l’année
2007.

Interpolations et extrapolations.

Vocabulaire : Lorsqu’on utilise un ajustement pour estimer 

en dehors du nuage de points, on fait une extrapolation

à l’intérieur du nuage de points, on fait une interpolation.

Exemples d’extrapolations : Exercice n°5, question 4; Exercice n°6, question 4 ; Exercice n°7, question 2. 

Exercice n°8 : Distance de freinage

Voici un document de la sécurité routière.

  1. A l’aide du logiciel Géogébra, déterminer un ajustement par une fonction du second degré.

2. Interpolation (on estime la distance de freinage pour des vitesses comprises entre 10 et 140)

Déterminer à l’aide de l’ajustement précédent les distances de freinage pour les vitesses 20km/h, 60km/h et 120 km/h.

3. Extrapolation (on estime la distance de freinage pour des vitesses non comprises entre 10 et 140)

Déterminer à l’aide de l’ajustement précédent les distances de freinage pour les vitesses 160km/h, 180km/h et 200 km/h.

Voici le nuage de points.

Le résultat n’est pas trop lisible mais en classe si nous n’avez pas d’ordinateur, ça fera l’affaire.

 

Voici ce que l’on doit obtenir. Le graphique est plus exploitable que celui obtenu à la calculatrice.

Voici comment utiliser la TI-83 Premium, les coordonnées de G correspondent aux moyennes \bar x et \bar y.

G(4.5;12121.4).

Dans la colonne Statistiques, les coordonnées correspondent à MoyenneX c’est-à-dire 4.5 et MoyenneY c’est-à-dire 12121.4.

 G(4.5;12121.4).

On clique sur \Sigma X en haut à droite de la fenêtre et les coordonnées de latex]G[/latex] sont les deux premières valeurs qui apparaissent :  (2.5;52.5)

Le plus simple est d’utiliser la calculatrice en allant directement dans le mode STAT.

Quand on ouvre Géogébra, on clique sur Tableur à droite de l’écran.

On remplit les colonnes A et B.

On sélectionne ces deux colonnes et on clique sur le deuxième onglet en haut à gauche. Dans le menu déroulant, on clique sur Statistiques à deux variables.

Dans le repère le nuage de oints apparaît.

Voici comment utiliser la TI 83 pour déterminer et tracer la droite d’ajustement affine à l’aide des moindres carrés.

Pour obtenir l’équation de la droite et la tracer avec Géogébra:  dans le cadre situé sous Modèle d’ajustement, il faut cliquer sur le triangle et  dans le menu déroulant, cliquer sur Linéaire.

L’équation s’affiche et le logiciel trace la droite dans le repère.

A l’aide de la calculatrice, on obtient le coefficient de corrélation linéaire r=-0.94. Comme r est proche de -1, l’ajustement affine est un bon modèle de corrélation entre les variables x et y.

Dans la colonne statistiques, on lit r=-0.94 sur la cinquième ligne.

Le plus simple est d’utiliser la calculatrice en allant directement dans le mode STAT.

Sur la fenêtre géogébra ci-dessous, on voit que pour le nuage de points à droite associé aux séries x et y, la disposition des points ne justifie pas un ajustement affine.

Pour remplir le tableau de la question, on crée deux colonnes : la colonne C où on recopie les valeurs de la colonne A et la colonne D .

Dans la cellule D1 , saisir la formule =\sqrt{B}-3 et tirer vers le bas.

Pour répondre à la question posée, recopier les valeurs de la colonne D dans le tableau.

Voici comment représenter le nuage de points de coordonnées M_i(x_i;y_i) à l’aide de la TI-83 premium.

On voit que dans le nuage les points sont presque alignés. L’ajustement affine est justifié.

Pour construire le nuage de points M_i(x_i;y_i), sélectionner les deux colonnes C et D. Cliquer sur le deuxième onglet en haut à gauche et dans le menu déroulant, cliquer sur Statistiques à deux variables. Le nuage de points apparaît dans le repère.

Les points semblent presque alignés, un ajustement affine est approprié.

Voici comment obtenir l’équation de la droite d’ajustement par la méthode des moindres carrés en utilisant la TI 83 premium et aussi comment la tracer.

On exprime  z en fonction de x.

z=2.15x+2.76

Pour obtenir l’équation de la droite d’ajustement :  dans le cadre situé sous Modèle d’ajustement cliquer sur le petit triangle et cliquer sur linéaire dans le menu déroulant.

La droite apparaît dans le repère.

L’équation cherchée est z=2.15x+2.76.

On va chercher pour quelle valeur de x,

y>900.

On détermine la valeur de z qui correspond à y=900.

On remplace y par 900 dans z=\sqrt{y}-3.

z=\sqrt{900}-3

\hspace{0.3cm}=30-3

\hspace{0.3cm}=27

Il ne reste qu’à déterminer x en remplaçant z par 27 dans l’équation de la droite d’ajustement z=2.15x+2.76.

On résout l’inéquation suivante :

2.15x+2.76>27

2.15x>27-2.76

2.15x>24.24

x>\frac{24.24}{2.15}

x>11.27

Il faudra donc attendre 2000+12 soit 2012 pour que le nombre d’employés dépasse 900 personnes.

 

Pour calculer le nombre d’adhérents en 2007 , on remplace x par 7 dans y=29x+33 et on calcule y.

y = 29×7+33 = 203+33 = 236

On prévoit qu’il y aura 236 adhérents en 2007.    

Pour la suite, recopier les valeurs de la colonne A dans la colonne C.

Pour la colonne D, saisir la formule =ln(B1) dans la cellule D1 , faire entrer et tirer la formule vers le bas.

On a obtenu précédemment la relation suivante : z=0.224x+4.044.

On sait que z=ln(y)

Donc ln(y)=0.224x+4.044\\y=e^{0.224x+4.044}

On pourrait s’arrêter là. Si on a lu la question suivante, on peut continuer ainsi :

y=e^{0.224x}e^{4.044}

Comme e^{4.044}\approx 57.1

y=57.1e^{0.224x}

L’année 2007 correspond à  x=7.

On remplace x par 7 dans y=57.1e^{0.224x} et on calcule  pour déterminer y.
y=57.1e^{0.224\times 7}

y=273.91

Il y aura 274 adhérents  en 2007.

L’ajustement exponentiel est le plus proche de la réalité : c’est lui le plus pertinent.

Pour plus de commodité plus tard, on recopie dans la colonne C, les valeurs x_i. Dans la cellule D1, on saisit la formule =e^{B1/100} on fait entrer puis on la recopie vers le bas.

Remarque : on peut utiliser le pavé numérique qui apparaît en bas de la fenêtre géogébra pour saisir la formule.

Pour afficher les moyennes \bar x et \bar y, cliquer en haut à droite de la fenêtre sur l’onglet \Sigma X. Une colonne apparaît au centre de la fenêtre, les coordonnées du point moyen se lisent sur les deux premières lignes.

G(3.5;12.12).

La droite d’ajustement de z en x a pour équation z=3.22x+0.85 .

Remarque : pour les calculatrices et logiciels on aura bien sûr y=3.22x+0.85

Pour tracer la droite d’ajustement, cliquer en bas dans le cadre situé sous Modèle d’ajustement et sélectionner Linéaire.

Apparaît alors y=3.22x+0.84.

La droite d’ajustement de z en x a pour équation z=3.22x+0.84.

On a obtenu l’équation de droite suivante : z=3.22x+0.85 et on sait que z=e^{\frac{y}{100}}. Donc:

e^{\frac{y}{100}}=3.22x+0.85
\frac{y}{100}=ln(3.22x+0.85)
y=100 ln(3.22x+0.85)

L’année 2007 correspond à x=10.

On remplace x par 10 dans l’équation y=100ln(3.22x+0.85) et on calcule pour trouver la valeur de y.

y=100ln(3.22\times 10+0.85)

y=100ln(40.05)

y=349.8
Donc le nombre de journées participant sera 350.

On recopie les valeurs dans les deux colonnes A et B.

On les sélectionne et on clique sur le deuxième onglet en haut à gauche. Dans le menu déroulant, on clique sur séries à deux variables et le nuage de points apparaît.

Pour le modèle d’ajustement, on choisit polynôme.

Pour trouver par exemple la distance de freinage pour une vitesse de 20 km/h, on saisit 20 dans la case à droite de Evaluer et on fait enter.

Pour calculer les distances correspondant aux vitesses proposées dans la question j’ai choisi d’utiliser la calculatrice.

Pour calculer les distances correspondant aux vitesses proposées dans la question j’ai choisi d’utiliser la calculatrice.

Réponse:

\overrightarrow{DC}=\overrightarrow{HG}.

Résoudre graphiquement f(x)=1

C’est une autre façon de demander de déterminer graphiquement les antécédents de 1.

Je place 1 sur l’axe des ordonnées, je trace alors la parallèle à l’axe des abscisses passant par 1 toute entière. Je repère les points d’intersection avec la courbe. Les abscisses de ces points sont les antécédents de 1.

Les antécédents sont -2 et 2.

Donc S=\{-2;2\}

Remarque : comme on demande de résoudre une équation, il faut écrire ainsi l’ensemble des solutions.