Resi­du­al Sum of Squa­res

Resi­du­al Sum of Squa­res (RSS) – eine kri­ti­sche Ein­ord­nung

Die Resi­du­al Sum of Squa­res – im deut­schen Sprach­raum häu­fig als „Resi­du­en­qua­drat­sum­me“ bezeich­net – ist eine der ältes­ten und zugleich meist­ge­nutz­ten Güte­ma­ße in der Regres­si­ons­ana­ly­se. Ihr Ruf als schein­bar unkom­pli­zier­te Kenn­zahl führt jedoch leicht dazu, dass ihre Tücken unter­schätzt wer­den.

Was RSS misst – und was nicht
RSS ist die Sum­me der qua­drier­ten Abwei­chun­gen zwi­schen beob­ach­te­ten Ziel­grö­ßen [math]y_i [/math]und den vom Modell pro­gnos­ti­zier­ten Wer­ten [math]\hat{y}_i=f(x_i,\hat{\beta}[/math]):

[math]RSS=\sum_{i=1}^{n}(y_i-\hat{y}_i)^{2}\;[/math].

Die Ein­heit ent­spricht dem Qua­drat der abhän­gi­gen Varia­ble, wes­halb RSS mit zuneh­men­der Ska­lie­rung von [math]y [/math] dras­tisch wächst. Ver­dop­pelt man z. B. alle Ziel­wer­te, ver­vier­facht sich die RSS. Ein nied­ri­ges RSS bedeu­tet also nur rela­tiv zur gewähl­ten Ska­la, dass das Modell gut passt.

Ver­gleich mit dem Resi­du­al Stan­dard Error (RSE)
Der häu­fig als „Stan­dard­feh­ler der Regres­si­on“ über­setz­te RSE nor­ma­li­siert die RSS durch ihre Frei­heits­gra­de:

[math]RSE=\sqrt{\frac{RSS}{n‑p}}\;[/math],

wobei [math]p[/math] die Zahl der geschätz­ten Para­me­ter (inklu­si­ve Kon­stan­te) ist. Dadurch ist RSE dimen­si­ons­gleich mit [math]y[/math] und bes­ser zwi­schen Model­len ver­schie­de­ner Daten­sät­ze oder unter­schied­li­cher Kom­ple­xi­tät ver­gleich­bar. Wer den­noch RSS ver­wen­det, läuft Gefahr, Model­le allein wegen unter­schied­li­cher Stich­pro­ben­grö­ßen oder Ska­lie­run­gen als ungleich gut zu beur­tei­len.

Opti­mie­rung via Metho­de der kleins­ten Qua­dra­te
Die gewöhn­li­che Kleins­te-Qua­dra­te-Schät­zung mini­miert per Defi­ni­ti­on die RSS. Das garan­tiert einen intern opti­ma­len Fit, sagt aber nichts dar­über, ob das Modell extern – also auf neu­en Daten – ver­läss­lich pro­gnos­ti­ziert. Over­fit­ting bleibt ein laten­tes Risi­ko, wenn man RSS ohne Kreuz­va­li­die­rung oder Pena­li­sie­rung (etwa Ridge oder Las­so) inter­pre­tiert.

Emp­find­lich­keit gegen­über Aus­rei­ßern
Qua­drie­rung ver­leiht Aus­rei­ßern dis­pro­por­tio­na­len Ein­fluss: Ein ein­zel­ner Feh­ler von 10,0010,00 erhöht die RSS um 100,00100,00. Robus­te Alter­na­ti­ven wie die Medi­an-Abso­lu­te-Devia­ti­on (MAD) oder quan­til­sen­si­ble Ver­lust­funk­tio­nen (Huber, Tukey) reagie­ren weni­ger hys­te­risch auf Extrem­wer­te.

RSS im Kon­text ande­rer Güte­ma­ße

  • MSE / RMSE: mathe­ma­tisch iden­tisch mit RSS, jedoch durch [math]n[/math] bzw. [math]\sqrt{n}[/math] geteilt – des­we­gen bes­ser ver­gleich­bar.
  • [math]R^{2}[/math]: setzt RSS direkt ins Ver­hält­nis zur Total Sum of Squa­res (TSS) und zeigt, wel­cher Anteil der Gesamt­va­ri­anz erklärt wird.[math]R^{2}=1-\frac{RSS}{TSS}[/math].
  • MAE: basiert auf abso­lu­ten statt qua­drier­ten Abwei­chun­gen, ist daher robus­ter, aber weni­ger emp­find­lich für gro­ße Feh­ler.
    Ein blin­des Ver­trau­en auf ein ein­zi­ges Kri­te­ri­um – gleich­gül­tig ob RSS oder [math]R^{2}[/math] – wider­spricht guter Modell­ent­wick­lung.

Anwen­dung in der Finanz­welt
Öko­no­me­tri­sche Model­le zur Ertrags- oder Vola­ti­li­täts­pro­gno­se wer­den oft über RSS (bzw. deren log­arith­mi­sche Pen­dants bei Likeli­hood-Funk­tio­nen) jus­tiert. Gera­de hier sind jedoch Aus­rei­ßer – Markt­crashs, Liqui­di­täts­knapp­hei­ten – die Regel, nicht die Aus­nah­me. Ana­lys­ten, die ledig­lich auf ein mini­ma­les RSS star­ren, ris­kie­ren Model­le, die in ruhi­gen Markt­pha­sen glän­zen, aber in Stress­zei­ten dra­ma­tisch ver­sa­gen. Moder­ne Risi­ko­ma­nage­ment-Frame­works ver­knüp­fen des­halb RSS-basier­te Fits mit back-test­ing, Value-at-Risk-Ana­ly­sen und Sze­na­ri­en.

Gren­zen und typi­sche Fehl­an­nah­men

  1. Linea­ri­tät: RSS ist nur dann aus­sa­ge­kräf­tig, wenn die Modell­form – meis­tens line­ar – die Daten­struk­tur tat­säch­lich abbil­det. Nicht­li­nea­re Mus­ter blei­ben uner­kannt.
  2. Homo­s­ke­da­s­ti­zi­tät: Vari­anz der Feh­ler wird als kon­stant vor­aus­ge­setzt. Bei hete­ro­s­ke­das­ti­schen Daten (häu­fig in Finanz­zeit­rei­hen) wird RSS ver­zerrt.
  3. Unab­hän­gig­keit: Auto­kor­re­la­ti­on in Resi­du­en ver­letzt die Grund­la­ge des RSS-Tests. Dur­bin-Wat­son- oder Ljung-Box-Sta­tis­ti­ken sind hier Pflicht.
  4. Stich­pro­ben­grö­ße: Ein Modell mit zusätz­li­cher erklä­ren­der Varia­ble senkt RSS zwangs­läu­fig. Ohne Adjus­tie­rung (Adj. [math]R^{2}[/math], AIC, BIC) droht Schein­ge­nau­ig­keit.

Fazit
RSS ist zwei­fel­los ein zen­tra­les Werk­zeug der Regres­si­ons­dia­gnos­tik. Doch sein unkri­ti­scher Ein­satz lie­fert schnell fal­sche Sicher­heit. Eine soli­de Modell­be­wer­tung kom­bi­niert RSS mit ska­len­un­ab­hän­gi­gen oder robus­ten Metri­ken, prüft Modell­an­nah­men und tes­tet Pro­gno­se­kraft auf unab­hän­gi­gen Daten. Nur so wird aus einer simp­len Qua­drat­sum­me ein ver­läss­li­cher Indi­ka­tor für ech­te Erklä­rungs­kraft.


Wie hilf­reich war die­ser Bei­trag?

Kli­cke auf die Ster­ne um zu bewer­ten!

Durch­schnitt­li­che Bewer­tung 0 / 5. Anzahl Bewer­tun­gen: 0

Bis­her kei­ne Bewer­tun­gen! Sei der Ers­te, der die­sen Bei­trag bewer­tet.

Es tut uns leid, dass der Bei­trag für dich nicht hilf­reich war!

Las­se uns die­sen Bei­trag ver­bes­sern!

Wie kön­nen wir die­sen Bei­trag ver­bes­sern?

Disclaimer: Dieser Beitrag dient lediglich zu allgemeinen Informationszwecken und stellt keine Anlageberatung dar. Bitte konsultieren Sie vor jeder Anlageentscheidung einen unabhängigen Finanzberater