La somme des n premiers carrés

La formule pour calculer la somme des \(n\) premiers entiers est : \[s = \frac{n(n+1)}{2}\]Je vous épargne l’histoire, bien connue, du jeune Carl Friedrich Gauss et de sa sommation des 100 premiers entiers… alors qu’il était en sixième année.  La technique employée pour retrouver cette formule est bien connue.  On somme \[s=1+2+3+ \, \dots \,+ (n-2)+(n-1)+n\]On permute chacun des termes \[s = n+(n-1) +(n-2)+ \, \dots \, +3+2+1\]Il suffit ensuite d’additionner ces équations terme à terme \[2s = (n+1) + (n+1) + (n+1) + \, \dots \, + (n+1)+(n+1)+(n+1)\]Il y a en outre \(n\) fois ces termes \((n+1)\) et en divisant par \(2\) on obtient \[s = \frac{n(n+1)}{2}\]Moins connue est la formule pour calculer la somme des n premiers carrés.  Ou peut-être je m’exprime mal :  la formule en elle-même est connue et, dans la plupart des livres, on fournit même une preuve de sa validité en utilisant le principe d’induction.  Or, pour ce type de preuve, il faut connaître la formule au départ.  Ça prend beaucoup d’intuition pour trouver, en jonglant avec quelques nombres \[S=\frac{n(n+1)(2n+1)}{6}\]Une façon d’y arriver est de considérer les sommes des cinq premiers carrés, \(1\), \(5\), \(14\), \(30\), \(55\).  On trouve que les accroissements entre les accroissements entre les accroissements entre deux carrés consécutifs sont constants, ce qui est caractéristique d’une fonction polynomiale de degré trois. En utilisant quatre des ces sommes et en résolvant le système d’équations, on trouve ladite fonction.  Par la suite, il suffit de prouver, par induction, sa validité pour \(n\in \mathbb{N}\). Je vous propose une autre façon de procéder, plus élégante.

Mais d’abord un petit préambule. Nous allons commencer avec la preuve d’une autre formule, celle de la somme des \(k\) premiers impairs, qui utilise, en quelque sorte, la même stratégie.

La somme des \(k\) premiers impairs

En étudiant les différences des carrés de nombres entiers successifs suivantes \begin{align*}1^{2}-0^{2}&=1 \\ \\ 2^{2}-1^{2}&=3 \\ \\ 3^{2}-2^{2}&=5 \\ \\ 4^{2}-3^{2}&=7 \\ \\ 5^{2}-4^{2}&=9 \\ \\ &\dots \end{align*}quelque chose de remarquable apparait ! D’une part, on génère la suite des nombres impairs à droite, d’autre part ces différences de carrés sont égales à la somme des nombres entiers consécutifs considérés \begin{align*}1+0 &=1 \\ \\ 2+1&=3 \\ \\ 3+2 &= 5 \\ \\ 4+3 &=7 \\ \\ 5+4&=9 \\ \\ &\dots \end{align*}En général, si on pose \[k^{2}-(k-1)^{2}\](donc le carré de l’entier \(k-1\) et le carré de l’entier immédiatement supérieur \(k\)) on obtient \[k^{2}-\left(k^{2}-2k+1\right)\]ce qui donne \[2k-1\]ou \[k + (k-1)\]C’est bien un nombre impair : que \(k\) soit pair ou impair, \(2k-1\) est impair.  Et c’est aussi bien la somme des deux nombres entiers consécutifs \((k-1) + k\).

Quel est la somme des \(k\) premiers impairs ?  On pose \[i=2k-1\]et on somme ces égalités jusqu’au \(k\)-ième impair \begin{align*}1^{2}-0^{2}&=1 \\ \\ 2^{2}-1^{2}&=3 \\ \\ 3^{2}-2^{2}&=5 \\ \\ 4^{2}-3^{2}&=7 \\ \\ 5^{2}-4^{2}&=9 \\ \\ &\dots \\ \\ k^{2}-(k-1)^{2} &=i\end{align*}On obtient, à gauche et à droite : \[-0^{2}+1^{2}-1^{2}+2^{2}-2^{2}+3^{2}-3^{2}+ \, \dots \, + (k-1)^{2}-(k-1)^{2}+k^{2}=1+3+5+7+\, \dots \, + i\]Tous ces termes s’annulant deux-à-deux, sauf le dernier, et c’est là la beauté de la chose, on obtient simplement \[k^{2} = 1 + 3 + 5 + 6 + \, \dots \, + i \]La somme recherchée, celle des \(k\) premiers impairs, est donc égale au carré de \(k\).

La somme des \(n\) premiers carrés

Procédons de façon analogue pour trouver la formule de la somme des \(n\) premiers carrés.  On commence par développer \[(n+1)^{3}= n^{3}+3n^{2}+3n+1\]Et puisque \begin{align*}1&=0+1 \\ \\ 2&=1+1 \\ \\ 3&=2+1 \\ \\ 4&=3+1 \end{align*}et qu’en général, évidemment, \[n = (n-1) + 1\]on remarque que \begin{align*}1^{3}&=0^{3}+3(0)^{2}+3(0)+1 \\ \\ 2^{3}&=1^{3}+3(1)^{2}+3(1)+1 \\ \\ 3^{2}&=2^{3}+3(2)^{2}+3(2)+1 \\ \\ 4^{3}&=3^{3}+3(3)^{2}+3(3)+1 \\ \\ &\dots \\ \\ n^{3} &= (n-1)^{3}+3(n-1)^{2}+3(n-1)+1 \\ \\ (n+1)^{3}&=n^3 + 3n^{2}+3n + 1\end{align*}Nous allons maintenant additionner ces égalités terme à terme.  À gauche, on obtient la somme des \(n+1\) premiers cubes.  À droite on obtient \(4\) termes :

La somme des \(n\) premiers cubes

Trois fois la somme des \(n\) premiers carrés (ce qui, en particulier, nous intéresse)

Trois fois la somme des \(n\) premiers entiers

\(n+1\) (et non pas seulement \(n\))

Ensuite,  quatre choses plutôt qu’une :

Les \(n\) premiers cubes se simplifient, il reste seulement le cube de \(n+1\) à gauche

La somme des \(n\) premiers carrés étant ce qui nous intéresse, nous appellerons cette somme \(S\)

La somme des \(n\) premiers entiers est connue, c’est \[\frac{n(n+1)}{2}\]

\(n+1\) est simplement \(n+1\)

En tenant compte des points mentionnés ci-dessus, on obtient \[(n+1)^{3}= 3S + 3\left(\frac{n(n+1)}{2}\right)+n+1\]puis en développant \[n^{3}+3n^{2}+3n+1 = 3S + \frac{3n^{2}+3n}{2}+n+1\]Enfin, en isolant \(3S\), qui inclut la somme qui nous intéresse, \[3S = n^{3} + 3n^{2}+3n + 1-\left(\frac{3n^{2}+3n}{2}\right)-(n+1)\]En multipliant par \(2\), on obtient \[6S = 2n^{3}+6n^{2}+6n+2-3n^{2}-3n-2n-2\]et en simplifiant le tout \[6S = 2n^{3}+3n^{2}+n\]La formule recherchée se dévoile.  On effectue d’abord la mise en évidence simple \[6S = n(2n^{2}+3n+1)\]et ensuite la factorisation du trinôme \[6S=n(n+1)(2n+1)\]Enfin, en divisant par \(6\), on obtient la formule recherchée \[S = \frac{n(n+1)(2n+1)}{6}\]

Citation

Dear Meg,

It’s not hard to see, in your question, a sense of – I don’t know – anticipated boredom, or perhaps some worry about what you’ve let yourself in for.  It’s all reasonably interesting now, but, as you say, “Is this all there is ?”  You’re reading Shakespeare, Dickens, and T.S. Eliot in your english class, and you can reasonably assume that while this is of course only a tiny sample of the world’s greatest writing, there is not some higher level of English literature whose existence has not been disclosed to you.  So you naturally wonder, by analogy, wether the math you’re learning in high school is what mathematic is. Does anything happen at higher levels besides biggers numbers and harder calculations ?

What you’ve seen so far is not really the main event.  Mathematicians do not spend the most of their time doing numerical calculations, even though calculations are sometimes essential to making progress.  They do not occupy themselves with grinding out symbolic formulas, but formulas can nontheless be indispensable.  The school math you are learning is mainly some basic tricks of the trade, and how to use them in very simple contexts.  If we were talking woodwork, it’s like learning to use a hammer to drive a nail, or a saw to cut wood to size.  You never see a lathe or an electric drill, you do not learn how to build a chair, and you absolutly do not learn how to design and build an item of furniture no one has thought of before.

Not that a hammer and saw arent’s useful.  You can’t make a chair if you don’t know how to cut the wood to the correct size.  But you should not assume that because that’s all you ever did at school, it’s all carpenters ever do.

– Ian Stewart dans Letters to a young mathematician

Les caractères gras sont de moi.  Je dis souvent à mes élèves : « vous pouvez tous aller à la bibliothèque et chercher les grands classiques de la littérature française : avec un peu de volonté, vous pouvez dévorer Notre-Dame de Paris ou Madame Bovary et apprécier l’oeuvre à juste titre.  Vous serez émerveillés, vous serez émus.  Personne parmi vous ne peut cependant aller à cette même bibliothèque et lire les grands classiques de la mathématique.   Personne ne sera ému par Introductio in analysin infinitorum d’Euler, personne ne sera émerveillé par Disquisitiones arithmeticae de Gauss et aucun d’entre-vous, certainement, ne sera en mesure de déchiffrer une seule phrase de Über die Hypothesen welche der Geometrie zu Grunde liegen de Riemann.  Pour y arriver, cela vous prendrait encore au moins 10 ans d’études en mathématiques.  C’est une distinction importante. »

La parabole comme enveloppe

Considérons la parabole suivante, avec son foyer \(F\) et sa droite directrice \(D_{1}\) et un point \(P\) sur cette parabole.

Comme tout point de la parabole est équidistant du foyer et de la droite directrice (sa définition usuelle comme lieu de points), on trouve \[\overline{FP}\cong \overline{AP}\](avec, au passage, \(\overline{AP}\) perpendiculaire à \(D_{1}\)).

Relions \(A\) et \(F\). Dans le billet sur la droite d’Euler, on montre que tout point de la médiatrice d’un segment est équidistant des extrémités de ce segment (et réciproquement). Le point \(P\) est donc sur la médiatrice de \(\overline{AF}\).

Bien ! Montrons que cette médiatrice est tangente à la courbe. Dans ce cas, il faudrait que la médiatrice et la parabole ne se touche qu’en un point, le point \(P\). Supposons que la médiatrice coupe la parabole en deux endroits et déduisons une contradiction.

En effet, supposons que la médiatrice de la droite \(AF\) coupe aussi la parabole en \(B\). Comme le point \(B\) est sur la médiatrice, il est à la même distance de \(A\) que de \(F\). On a donc \[\overline{AB}\cong \overline{BF}\]

Or, par définition, si \(B\) est aussi sur la parabole, on trouve aussi \[\overline{BC}\cong \overline{BF}\](encore une fois, ici, \(BC\) perpendiculaire à \(D_{1}\)). Par transitivité, \[\overline{AB}\cong \overline{BC}\]

Est-ce que, vraiment, \(m\overline{AB}\) peut être égal à \(m\overline{BC}\) ? Réfléchissons un peu. Si c’était le cas, alors le triangle \(ABC\) serait isocèle et \(ABC\) étant isocèle, il serait aussi isoangle. Mais comme l’angle \(ACB\) est droit, on aurait aussi \(BAC\) droit. Et alors on obtiendrait ce résultat \begin{align*}m\angle BAC + m\angle ACB + m\angle ABC &= 90^{\circ}+90^{\circ} + m\angle ABC \\ \\ &=180^{\circ}+m\angle ABC \\ \\ &> 180^{\circ}\end{align*}ce qui est la contradiction recherchée. La médiatrice est donc tangente à la parabole. En déplaçant le point \(A\) sur la droite directrice, on obtient donc une infinité de médiatrices toutes tangentes à la parabole. Cela donne lieu à une construction très belle !

Cette propriété permet aussi d’expliquer la construction de la parabole par pliage.