Du hast erwartete Häufigkeiten von 100 und 100 bei empirischen Häufigkeiten von 80 und 120. Du rechnest für jede Zelle
(emp. Häufigkeit - erw. Häufigkeit)² / erw. Häufigkeit
und addierst die Werte, also:
[(80-100)² / 100] + [(12-100)² / 100]
(eckige Klammern nur der Übersicht halber).
Das Ergebnis ist dein Chi²-Prüfwert. Beim Goodness-of-fit-Test hast du die Zahl der Ausprägungen minus eins als Freiheitsgrade, also df=1.
Jetzt vergleichst du den Wert auf deinem Signifikanzniveau mit dem Chi²-Wert für einen Freiheitsgrad. Liegt er drüber, ist das Ergebnis auf diesem Niveau signifikant. Willst du es genauer, gibst du den Wert hier in den Rechner ein und erhältst mit einem Klick auf den Pfeil nach rechts den genauen p-Wert.
http://eswf.uni-koeln.de/glossar/surfstat/chi.htm Dieser gibt die Wahrscheinlichkeit dafür an, dass du einen so hohen oder höheren Chi²-Wert erhältst, obwohl die erwarteten Häufigkeiten der Grundgesamtheit entsprechen.