Die Theorie des sinkenden Grenznutzens

Mathematische Zusammenhänge des Skatspieles

Die Theorie des sinkenden Grenznutzens

Beitragvon ohne11 » 25. Mai 2018 10:42

Werte Kartenliebhaber,

da ich mich ja äußerst gern dann und wann mit den Zusammenhängen zwischen dem Skat und der Mathematik beschäftige, möchte ich hier mal einen Gedankengang skizzieren, der mich schon eine Weile beschäftigt.
Häufig geht es um Spiel xy und Spieler A meint, man müsse das so weit reizen, Spieler B meint jener Reizwert wäre richtig und man könne dies und das finden und die Wahrscheinlichkeit beträge xx%, was uns zu einem Erwartungswert (EW) von ABC führt und demnach korrekt wäre... Andere entgegnen dann wieder, dass sie lieber den Spatz in der Hand nehmen als die Taube auf dem Dach und so ganz kann man das nicht von der Hand weisen. Ich möchte darauf ein wenig detaillierter eingehen.

Teil A: Einleitung - Erwartungswerte.
Im Sinne einer "naiven Entscheidungstheorie" ist den meisten zumindest grob klar, von was sie ihre Entscheidung abhängig machen. Nämlich vom Erwartungswert.
Dieser berechnet sich sehr einfach, nämlich
EW = Summe über alle Ereignisse * Wahrscheinlichkeit des Ereignis * Ereignis
Beispiel: Ich habe einen Null Ouvert Ansatz und spiele Cent-Skat an einem 4er Tisch. Wo liegt der "Break-Point" an Karten, die ich finden kann, dass sich das Spiel auf Dauer lohnt?
Ich lasse jetzt hier bewusst sowas wie "Mir helfen Kreuz-Karten und einer reizt 24, damit sinkt doch die Wahrscheinlichkeit, dass ich gut finde, oder?" außer Acht, denn das ist mathematisch schwer zu fassen und bringt uns hier nicht weiter.
Die Frage ist recht leicht beantwortet. Die Wahrscheinlichkeit eine von x möglichen Karten im Skat zu finden, beträgt x/22+(22-x)22*x/21. Wieso? Naja, ich nehme die erste Karte auf und mit x/22 ist sie eine derer, die meine NO sicher machen. Ist sie es nicht (Wahrscheinlichkeit (22-x)/22 ), so nehme ich die nächste auf und habe nochmal die Chance (x/21). Das ergibt demnach für die Wahrscheinlichkeit die NO sicher zu finden, wenn man eine von x Karten findet:
P=x/22+(22-x)/22*x/21 = x/22 + (1-x/22)*x/21 = x/22 + x/21 - x²/462 = 1/462 * (43x-x²) .
Der gewonnene NO bringt auf Liste 96 Punkte * 3 Spieler = 288. (Bei 1 Cent-Tarif also 2,88€, das soll aber hier egal sein. Ob 1,2 oder 5 Cent spielt keine Rolle, da das Geld linear mit der Punktzahl geht.)
Der verlorene NO kostet -172 Punkte * 3 Spieler = -516.

Somit erhalten wir für den Erwartungswert: EW = 288 * 1/462*(43x-x²) - 516 * [1-1/462*(43x-x²)].
aufgelöst erhält man
EW = -804/462 x² + 34572/462 x -516.

Da wir wissen wollen, wo der Break Point ist zwischen Gewinn und Verlust setzen wir das also Null und erhalten eine triviale quadratische Gleichung
0 = x² - 43x + 20124/67
x = 43/2 - Wurzel (1849/4-20124/67) macht gerundet
= 21.5 - Wurzel (161.892) = 21.5 - 12.72 = 8.78.
(Die "+-Lösung" der quadratischen Gleichung ist eine Scheinlösung, die auf über 32 Karten führt.)

M.a.W. es muss 9 Karten geben, die man finden kann, damit man in diesem Modus (4er Tisch mit Listenpunkten + Fabian) auf Dauer Plus macht.

Das war nun der einfache Teil, machen wir weiter.

Teil B) Das St. Petersburg-Paradoxon:

Für alles nachstehende möchte ich eine kleine Motivation aus der Mathematik voranstellen. Diesen Gedankengang versuche ich dann auf den Skat zu abstrahieren.

Ein Casino (in der ursprünglichen Variante ein St. Petersburger Casino, daher der Name) bietet folgendes Spiel an. Wir werfen eine Münze und gewinnen, wenn "Kopf" kommt. Entscheidend ist dabei, wie lange es dauert, bis zum ersten Mal Kopf kommt. Kommt Kopf beim ersten Mal, erhalten wir einen Euro. Kommt erst Zahl, dann Kopf gibt es zwei Euro. Kommt es erst beim dritten Mal, gibt es vier Euro usw. Sodass wir,
wenn n mal Zahl kommt, bevor endlich Kopf kommt, wir 2^n Euro gewinnen.
Die Fragestellung ist nun: Welchen Einsatz sind wir bereit zu zahlen für dieses Spiel?
Gehen wir von einer naiven Entscheidungsfindung im Sinne eines Erwartungswertes aus, so ergibt sich nämlich:
EW = 1/2*1 + 1/4*2 + 1/8 * 4 + ... = 1/2 * [ 1 + 2/2 + 4/4 + ...] = unendlich.
D.h. wir müssten nach dieser Rechnung bereit sein jeden Einsatz zu zahlen, da der Erwartungswert divergiert!
Nun widerspricht das ja aber jeder inneren Logik. Der Erwartungswert divergiert, weil eben nach oben hin, die Gewinne so astronomisch werden, dass sie jeden Einsatz rechtfertigen für unendlich ofte Wiederholung des Spiels. Allerdings würde niemand viel Geld zahlen, wenn bei einer einzigen Ausführung es sehr wahrscheinlich ist, dass man nur 1, 2 oder 4 € bekommt oder? Und genau dieser Gedankengang führt uns weg von der klassischen, "naiven"
Entscheidungstheorie zur "Erwartungsnutzentheorie" bzw "Theorie des sinkenden Grenznutzens". Grob gesprochen könnte man sagen, es ist mir nämlich total egal, ob ich 5 oder 10 Mrd gewinne, weil ich eh nie alles verjubeln könnte. Obwohl die absolute Differenz identisch ist, stimmt mir wohl jeder zu, dass ein Mensch mit Null Euro mehr von 5 Mrd profitiert, als ein Mensch mit 5 Mrd von weiteren 5 Mrd, oder? Praktisch angewandt auf das Casino ist ohnehin da Sense, wo das Kapital des Casinos begrenzt ist, weil spätestens da, wäre das Casino gezwungen, das Spiel abzubrechen. Aber das soll hier nicht im Vordergrund stehen. Bernoulli schlug die Einführung einer Art "Nutzenfunktion" vor, mit der er die Divergenz im Erwartungswert behob. In seinem Falle ließ er den "Nutzen" nämlich logarithmisch steigen und erhielt einen endlichen EW.

Teil C) Was hat das alles mit Skat zu tun?

Unzweifelhaft ist und bleibt der Erwartungswert das Mittel zur korrekten Entscheidungsfindung, wenn es um Cent-Skat geht. Jedes Spiel wird für sich bewertet und es gibt kein "Ende der Liste", wenn man so will. Abgesehen von etwaigem Ableben durch Leberzirrhose, was an einem durchschnittlichen Skattisch nicht so abwegig ist,  könnte man ja theoretisch ewig weiterspielen und jedes Spiel für sich genommen wirft halt den Ertrag ab, den es eben abwirft.

ABER: Im Turnier ist eine Liste endlich. In der Mannschaftsmeisterschaft über 6 oder 7 Listen hat das sicherlich einen Einfluss, wenn auch einen geringen. Noch viel interessanter wird das Ganze im Bereich der Liga. Jede Serie für sich gibt Punkte und, wie viele aus Erfahrung wissen, erscheint es doch manchmal sinnvoller die sicheren 20 Punkte zu nehmen als den 95%-Grand, auch wenn der aus Sicht des Erwartungswertes auf Dauer (und damit im Cent-Skat immer), die richtige Entscheidung darstellt. Nur lässt sich das eben schwer quantifizieren, oder? Und genau da, denke ich, ist eine Art Erwartungsnutzentheorie der richtige Ansatz. Mit den richtigen Daten könnte ich ein Modell erstellen, was die Entscheidungsfindung eben genau nach diesen Parametern modifiziert. Nun wäre eine logarithmische Nutzenfunktion nicht nur geraten, sondern einfach grob falsch. Die Idee Bernoullis ist ja, dem exponentiellen Wachstum des Gewinns entgegenzuwirken und von daher ist eine Logarithmusfunktion die trivialst mögliche Lösung. Für den realen Skat wäre es mir möglich, mit eurer Hilfe, so etwas aufzustellen, in Form eines "Taylor-Polynoms".
Was ich dazu bräuchte wären (theoretisch) Abstände zu allen Mitspielern über die ganze Mannschaft nach jedem einzelnen Spiel. :lol:
Und dann noch eine große Anzahl an Listen. :lol:
Aber im Ernst: Für ein sehr vereinfachtes Modell
würde es mir womöglich reichen, die Abstände zu den anderen Mannschaften nach einzelnen Spielen während der Liste und am Ende zu kennen. Manche schreiben ja zu Spiel 16 und 32 alles auf... vielleicht behält der ein oder andere ja solche Zettelchen?
Die Idee dahinter ist relativ simpel: Der Abstand zu den gegnerischen Mannschaften geteilt durch die Anzahl der verbleibenden Spiele stellt sowas wie einen "Vorsprungskoeffizienten" dar, welcher wiederum als Parameter in die Nutzenfunktion eingeht und den Erwartungswert modifiziert.
Denn (und das sollte jedem klar sein): Wenn ich in Spiel 48 125 Punkte Vorsprung habe und noch einfach Herz spielen kann, dann mach ich das. Auch, wenn der Grand 99% hat. :lol:

Puh, das war jetzt ne Menge. Danke an alle, die bis hierhin durchgehalten haben und ich bin gespannt auf euer Feedback. :)

LG
ohne11
"Viele Menschen sind gut erzogen, um nicht mit vollem Mund zu sprechen, aber sie haben keine Bedenken, es mit leerem Kopf zu tun."

- Orson Welles

http://gruenejungsdresden.wordpress.com/
Benutzeravatar
ohne11
 
Beiträge: 2230
Registriert: 24. Nov 2013 15:23
Wohnort: Dresden

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon mr.kite » 25. Mai 2018 12:14

Fangen wir mal mit Teil B an, dem St.Petersburg-Paradoxon:
Das Spiel ist sehr nett und für die Bank ruinös wenn sie es anbietet. Dennoch ist es offensichtlich nicht sinnvoll, ein Spiel mit positivem Erwartungswert einzugehen.

Oder doch? Die Antwort auf diese Frage hängt in wesentlichen von einer Frage ab: Was ist der Wert von 1€? Deine Ausführungen gehen davon aus, dass 1€ immer 1€ ist. Der Wert von 1€ ist aber sehr flexibel.

Auch hierzu ein Spiel: Ich stelle Dir nebeneinander eine Flasche vom billigsten Wasser eines Discounters auf der einen Seite und daneben ein 1€-Stück. Was nimmst Du?
Ändert sich diese Entscheidung, wenn Du dieses Angebot auf der Hälfte eines 7-Tages-Trips durch unbewohnte Wüste bekommst und Deine Wasservorräte bereits zu 75% aufgebraucht sind?

Offensichtlich hängt der Wert des Geldes stark von Ort und Gelegenheit ab. Es hängt aber auch von persönlichen Gegebenheiten des (zukünftigen) Besitzers ab. Für praktisch jeden Menschen in Westeuropa ist 1€ auch 1€ wert. Wer aber an einer seltenen tödlichen Krankheit leidet, deren Heilung 500.000€ kostet wird für 1€ wenig Verwendung haben. Der Wert des 1€ ist also wesentlich geringer für ihn. Ähnlich wird es ihm mit 2,4,8,16,...1024 etc gehen. Sicherlich sind diese nicht ganz wertlos und das Verhältnis von Wert/Preis wird konstant bleiben. 256€ werden immernoch das doppelte von 128€ wert sein, aber eben nichtmehr 256€. Dafür wird der Sprung von 262.144€ auf 524.288€ nicht ansatzweise mit einer Verdopplung des Wertes getan sein. Der tatsächliche Zusatznutzen für den Kranken kann das 10fache, 100fache oder auch 1.000.000fache betragen. Die Steigerung auf 1.048.576€ ist für ihn nun aber überwiegend wertlos. Seinen Erwartungwert müsste man also in etwa so berechnen:
50%*0,2€+25%*0,4€+...1/1Mio*500.000€ + 1/2Mio*500.000€ +1/4Mio*500.000€
Nun bekommt man einen für den Spieler fairen Preis für das Spiel. Ob der Wert "für ein Menschenleben" nun 500.000€ ist oder höher oder niedriger soll nun erstmal keine Rolle spielen. Es ändert sich nur der Preis, aber der Preis bleibt in jedem Fall berechenbar.

Was ich sagen möchte ist folgendes: Es ist aussichtslos, versuchen zu wollen eine "Masterformel" für den Wert von 1€ mehr (bzw im Skat 1 Punkt mehr) ermitteln zu wollen. Solche Formeln haben Sprünge, unstetige Steigungswechsel und variieren von Situation zu Situation. Bei der Berechnung des individuellen Erwartungswert einer Entscheidung kommt es immer zuallererst auf die konkrete Situation des Entscheiders an.
Ritter des Ordens der unsichtbaren Hand
mr.kite
 
Beiträge: 6832
Registriert: 22. Apr 2010 14:06
Wohnort: München

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon HomerJay » 25. Mai 2018 12:44

Durchgehalten. Und sogar die Ausführungen verstanden. Gute Idee :top:
Der Optimist glaubt, dass wir in der besten aller möglichen Welten leben, und der Pessimist befürchtet, dass das stimmt.
HomerJay
 
Beiträge: 1743
Registriert: 21. Okt 2005 08:50
Wohnort: Frankfurt

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon mr.kite » 25. Mai 2018 13:39

Um es mal etwas produktiver zu halten:
Beispiel:
Wir nehmen mal eine Situation mit vollständiger Information an. Das bedeutet, jeder am Tisch weiß über den genauen Stand an allen Tischen Bescheid. 8 Spiele (insgesamt; noch 2 an jedem Tisch, jede Mannschaft gibt noch geau 2mal) vor Schluß steht es:
A: 3900
B: 3700
C: 2400
D: 3200
Ein Spieler von Mannschaft A hat nun 3 Möglichkeiten:
- Einen Herz mit 1 zu gewinnen ->3970
- Einen Grand mit 1 zu gewinnen -> 3998
- Einen Grand mit 1 zu verlieren -> 3724 (GS-Punkte zur Vergleichbarkeit mit abgezogen)

Die Frage ist jetzt: Wie wahrscheinlich ist es, mit den jeweiligen Punktzahlen nach 7 weiteren Spielen Sieger, Zweiter oder Dritter zu werden. Hieraus kann man dann errechnen, wie hoch die Wahrscheinlichkeit sein muss die notwendig ist, um einen Grand mit 1 zu gewinnen. Ersatzweise bei gegebener Gewinnwahrscheinlichkeit, ob das Risiko lohnt.

Das Problem der Herangehensweise: Ich weiß nicht wie man an belastbare Zahlen dafür kommen kann, um wieviel die Wahrscheinlichkeit, Sieger zu werden tatsächlich ansteigt wenn 28 Punkte mehr bzw 246 Punkte weniger zu Buche stehen. Klar ist, dass man die 246 stärker gewichten muss als das Reine Verhältnis 246/28=8,8 , aber ob der Faktor 10 oder 20 notwendig ist halte ich für sehr schwer zu bestimmen, da sich das Spiel- und Risikoverhalten aller Teilnehmer an die in welche Richtung auch immer geänderte Situation anpassen wird.
Ritter des Ordens der unsichtbaren Hand
mr.kite
 
Beiträge: 6832
Registriert: 22. Apr 2010 14:06
Wohnort: München

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon Schotte » 25. Mai 2018 13:46

Das heißt also "St. Petersburg-Paradoxon". Ich habe davon vor Jahrzehnten mal bei Jack London gelesen. Da wurde die Theorie bei Roulette angewandt. Festen Einsatz, z.B. 10 Euro, auf Rot, bei Erfolg wieder 10 Euro, bei Misserfolg so lange verdoppeln, bis Erfolg. Damit Geld wieder drin und wieder 10 Euro auf Rot usw. Man muss halt lange genug verdoppeln können und dürfen...
Schotte
 
Beiträge: 122
Registriert: 7. Nov 2016 19:58

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon mr.kite » 25. Mai 2018 13:48

Schotte hat geschrieben:Das heißt also "St. Petersburg-Paradoxon". Ich habe davon vor Jahrzehnten mal bei Jack London gelesen. Da wurde die Theorie bei Roulette angewandt. Festen Einsatz, z.B. 10 Euro, auf Rot, bei Erfolg wieder 10 Euro, bei Misserfolg so lange verdoppeln, bis Erfolg. Damit Geld wieder drin und wieder 10 Euro auf Rot usw. Man muss halt lange genug verdoppeln können und dürfen...

Das ist ein anderes Spiel. Bei Deinem Spiel bringt der Setzer immer wieder einen neuen Einsatz. Bei ohne11s Spiel bringt der Spieler nur einen einzigen Einsatz. Das ist ein Unterschied.
Ritter des Ordens der unsichtbaren Hand
mr.kite
 
Beiträge: 6832
Registriert: 22. Apr 2010 14:06
Wohnort: München

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon ohne11 » 25. Mai 2018 13:50

@mr.kite: Dass das Spiel für die Bank ruinös wäre, ist ja nicht per se klar. Es gilt aus Sicht der Bank ja zu bestimmen, welcher Einsatz zur Teilnahme am Spiel zu fordern ist. Der mittlere Ertrag der Bank ist ja Einsatz - Erwartungswert. Nehmen wir einmal an, der Gewinn würde sicht nicht mit jedem Spiel verdoppeln, sondern einfach immer um einen Euro steigen. Also 1 € bei direkt Kopf, 2 €, wenn einmal Zahl vorher kam, 3 € bei Zahl-Zahl-Kopf usw..., dann ergibt sich für den Erwartungswert:
EW = 1/2*1 + 1/4*2+1/8*3+1/16*4+... = 1/2 * Summe_(k=0 bis unendlich) (k+1)/2^k = Summe_(k=1 bis unendlich) k/2^k = 2.
D.h. in diesem Falle wäre der Erwartungswert 2. Folglich würde das Casino 2,50 € Einsatz verlangen und macht auf Dauer 50 Cent pro Teilnehmer Gewinn.
Das paradoxe an dem exponentiellen Zuwachs ist vielmehr, dass der Erwartungswert zwar unendlich ist, aber trotzdem niemand sich auf
dieses Spiel einlassen würde. Es wäre denkbar, dass man einen endlichen Einsatz festlegt (sagen wir 100€) und das Casino trotz mathematisch negativem Erwartungswert für ihr eigenes Spiel massiv Kohle scheffelt. Weil nämlich das Ereignis an dem sie zu Grunde gehen würden schlicht so weit entfernt in der Zukunft liegt, dass unser Finanzsystem bis dahin längst zusammengebrochen ist oder die Sonne als roter Riese an die Haustür klopft. :lol: M.a.W. auf eine kurze Dauer kann eine objektiv "schlechte" Entscheidung vorteilhaft sein. Den Kollaps des Finanzsystems verkörpert im Skat nun unsere Liste.
Natürlich ist jede Entscheidung abhängig von so vielen Faktoren, dass eine exakte mathematische Analyse absolut hoffnungslos wäre. Umgekehrt gibt es viele Situationen taktischer Natur, die ohnehin jegliche Rechnerei obsolet machen ("Wir brauchen zwingend Punkte, Kreuz ohne 11 muss gehen!"). Aber

darum geht es mir hier nicht.
Ich denke, wir stimmen überein, dass die Randbedingungen (Spiel 1, Spiel 48) als fix angesehen werden können. Man stelle sich vor, ich habe ein einfaches Karo auf der Hand mit 95% (EW=58.8) oder den Grand mit 90% (EW=70.6). Zu Spiel 1 auf der Liste sollte man klar den Grand wählen (ja, ich weiß, auch das ist wieder abhängig von der Ligasituation etc... wenn ich am letzten Spieltag nur noch einen Ligapunkt brauche gg den Nichtabstieg, dann kann man auch mal versuchen nur die absolut sicheren auf einen Punkt hin zu steuern. Aber bitte, darum soll es hier wirklich nicht gehen).
Umgekehrt bin ich bei Spiel 48, weiß ich aufgrund der Punktestände ganz genau welches Spiel ich brauche oder welches ich evtl verlieren darf etc.Darum soll es ebenso wenig gehen.
Vielmehr ist doch die Frage der Interpolation spannend.
Was mache ich z.B. mit dieser Karte zu Spiel 37, wenn
ich 182 Punkte Vorsprung habe? Natürlich hat der Grand den höheren EW, aber letztenendes genügt mir das Spiel, welches mir höhere Chancen auf die 3 Ligapunkte bietet. Und das kann durchaus das Karo sein! Die Nutzenfunktion würde demnach Erwartungswerte in Abhängigkeit von Rückstand (Vorsprung) und Zeitpunkt auf der Liste in einen Erwartungswert für Ligapunkte übersetzen. Natürlich muss man sich dann nicht daran halten, aber für manch einen sind das bestimmt wertvolle Anhaltspunkte (oder zumindest mal interessant).
"Bei wievielen Spielen vor Schluss ist der Break-Point zwischen einfach Karo und einfach Grand bei einem Vorsprung x Punkten?" könnte eine Fragestellung lauten.
Oder umgekehrt:
"Wieviel Vorsprung muss ich haben zu Spiel 43, dass das Karo sinnvoller ist, als den Grand zu spielen?" (oder umgekehrt) usw...
Letztenendes gebe ich dir recht, es kann kein exaktes mathematisches Modell
geben, was alle Begleitumstände berücksichtigt. Aber es kann eines geben, was zumindest in der Sinnhaftigkeit, der des Erwartungswertes überlegen ist. Abgesehen vom Cent-Skat. Da ist und bleibt der EW alles. :D
"Viele Menschen sind gut erzogen, um nicht mit vollem Mund zu sprechen, aber sie haben keine Bedenken, es mit leerem Kopf zu tun."

- Orson Welles

http://gruenejungsdresden.wordpress.com/
Benutzeravatar
ohne11
 
Beiträge: 2230
Registriert: 24. Nov 2013 15:23
Wohnort: Dresden

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon Peanuts » 29. Mai 2018 09:04

In den letzten Beispielen hast du das Spiel ja schon aber wie ist's wenn du noch beim reizen bist? Müsste man dann ja auch den Erwartungswert berücksichtigen den ich hab wenn ich ein Spiel nicht Spiele und der Gegenpartei eins umbiegen.?
Peanuts
 
Beiträge: 68
Registriert: 4. Jul 2017 16:34

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon Skatfuchs » 29. Mai 2018 13:30

Peanuts hat geschrieben:In den letzten Beispielen hast du das Spiel ja schon aber wie ist's wenn du noch beim reizen bist? Müsste man dann ja auch den Erwartungswert berücksichtigen den ich hab wenn ich ein Spiel nicht Spiele und der Gegenpartei eins umbiegen.?


Hallo,

ja das wird dann noch komplizierter, da man eigentlich das Spiel gegen alle 231 möglichen Skatfindungen betrachten muss.
So machen wir das auch hier beim "Skatfux".

@Ohne11: im letzten "Skatfreund" las ich, dass der DSKV in der 1. BL nun testweise das Spielen mit ner App ("Skat-Guru") und Eingabe über ein Tablett vollziehen will. Damit hätten ja alle Mannschaften just in time den aktuellen Stand.
Ein Gut Blatt

Skatfuchs

Wer sich nach Regeln ängstlich richtet und hinter die Schablone flüchtet, den weihte nie mit seinem Kuß des Skates höchster Genius!
www.skatfuchs.eu
Benutzeravatar
Skatfuchs
 
Beiträge: 8023
Registriert: 25. Sep 2005 14:31
Wohnort: Chemnitz

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon ohne11 » 29. Mai 2018 15:49

Skatfuchs hat geschrieben:
@Ohne11: im letzten "Skatfreund" las ich, dass der DSKV in der 1. BL nun testweise das Spielen mit ner App ("Skat-Guru") und Eingabe über ein Tablett vollziehen will. Damit hätten ja alle Mannschaften just in time den aktuellen Stand.

Nicht nur vollziehen will: es ist schon Tatsache. :wink:
Hab grad erst mit den Bundesliga- Meistern 2016 und 2017 geredet und seit dieser Saison wird bereits so verfahren.
"Viele Menschen sind gut erzogen, um nicht mit vollem Mund zu sprechen, aber sie haben keine Bedenken, es mit leerem Kopf zu tun."

- Orson Welles

http://gruenejungsdresden.wordpress.com/
Benutzeravatar
ohne11
 
Beiträge: 2230
Registriert: 24. Nov 2013 15:23
Wohnort: Dresden

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon marvin » 15. Jun 2018 21:36

Das ist ein spannendes Thema. Wie im Eingangspost dargestellt, ist der Erwartungswert des mit dem einen Spiel verbundenen Punktgewinns / -Verlusts in der Tat nur dann das richtige Entscheidungskriterium, wenn man Centskat oder eine unendlich lange Liste spielt.

Nehmen wir nun die Liga. Im Normalfall ist relativ egal, wie viele Spielpunkte man im Laufe der Saison sammelt - die sind ja nur zweitrangiges Kriterium bei Gleichheit der Wertungspunkte. Deshalb ist in eine Ligaserie auch egal, wie viele Spielpunkte macht, es kommt nur auf die relative Position im Vergleich zu den anderen Teams an. Man sollte daher im Ligamodus den Erwartungswert nicht auf die Spielpunkte beziehen, sondern auf die zu erwartenden Mannschaftspunkte. Was meine ich damit?

Angenommen, es sind zum Betrachtungszeitraum von den 192 Spielen der Serie (4x48) noch 40 übrig (also ungefähr nach dem 38. Spiel der Serie). Meine Mannschaft habe 270 Spielpunkte Vorsprung auf die drei anderen Teams, die alle punktgleich sind.

Mit einem mathematischen Modell, das es noch zu beschreiben gilt, könnte man aus diesen Punktständen einen Erwartungswert für die Mannschaftspunkte, die mein Team am Ende der Serie bekommen wird, ableiten. Ich greife jetzt einfach mal aus der Luft und behaupte, dass der Erwartungswert in dieser Situation bei genau 2,00 liegt (wenn alle vier Teams punktgleich sind, wären es 1,50).

Jetzt habe ich die Wahl zwischen einem sicheren Null (+73) oder einem 90% Grand mit Dreien (+146 oder -272). Wenn ich Null wähle, steht mein Team bei 39 Restspielen bei 343 Spielpunkten Vorsprung auf die Konkurrenz. Der Erwartungswert steigt damit auf 2,10. D.h. das Nullspiel bringt mir einen sicheren Ertrag in Form einer Erhöhung des Erwartungswerts der Mannschaftspunkte um 0,10.

Die andere Option Grand hat zwei mögliche Ausgänge (Erwartungswerte wieder geschätzt):
1. Gewinn: Meine Mannschaft hat 416 Spielpunkte Vorsprung, der Erwartungswert steigt damit auf 2,15 (+0,15)
2. Verlust: Alle vier Teams sind nahezu punktgleich, der Erwartungswert sinkt auf 1,50 (-0,50)

Wenn diese Annahmen zum Erwartungswert realistisch sind (und ich habe keine Ahnung, ob sie es sind), dann hat der Grand einen Erwartungswert der Erwartungswertveränderung in Höhe von
0,9 x 0,15 - 0,1 x 0,50 = 0,085
Immer noch positiv, aber schlechter als das Nullspiel. Daher wäre in dieser taktischen Situation das Nullspiel besser.

Die spannende Frage ist nun: Wie kann man die Punktstände unter Berücksichtigung der Restspiele in Erwartungswerte umrechnen. Ich habe da so eine Idee, mir ist aber noch nicht klar, ob sie funktioniert. Auf jeden Fall muss ich dafür noch etwas basteln, was ich aber heute und morgen nicht schaffe...
marvin
 
Beiträge: 1189
Registriert: 23. Mär 2007 01:31
Wohnort: Idstein

Re: Die Theorie des sinkenden Grenznutzens

Beitragvon marvin » 25. Jun 2018 19:51

Es hat etwas gedauert, aber hier nun meine Idee, wie man das Problem des sinkenden Grenznutzens beschreiben und berechnen kann.

Wir betrachten dazu zwei Mannschaften M1 und M2 und die Differenz D der aktuellen Mannschaftsergebnisse (Vorsprung von M1 auf M2 bzw. Rückstand, wenn D negativ ist). Es seien noch – von allen vier Spielern zusammen – N Spiele in der Serie zu spielen. Also zum Beispiel N=48, wenn alle vier Tisch gerade mit dem Spiel 36 fertig sind. Wir wollen wissen, wie wahrscheinlich es ist, dass Mannschaft M1 am Ende der Serie vor M2 landet. Diese Wahrscheinlichkeit nennen wir P, sie hängt logischerweise von D und N ab.

Wenn wir diese Wahrscheinlichkeit kennen, dann können wir auch den Nutzen berechnen, den zusätzliche Punkte für Mannschaft M1 bringen: Der Nutzen besteht nämlich darin, dass diese zusätzlichen Punkte diese Wahrscheinlichkeit erhöhen. Oder anders ausgedrückt: Die Veränderung der Wahrscheinlichkeit, dass M1 vor M2 landet, ist ein Maß dafür, wie nützlich zusätzliche Punkte (oder analog wie schädlich Minuspunkte) sind.

Nun aber zur Berechnung von P. Jedes der restlichen N Spiele hat einen Einfluss auf D, den wir mit X(1), X(2), …, X(N) bezeichnen. Zum besseren Verständnis drei Beispiele:

1. Das nächste Spiel macht ein Spieler der Mannschaft M1. Wenn er gewinnt, ist X(1) = s+50 (mit dem Spielwert s), wenn er verliert, ist X(1) = -2s-50-30
2. Das nächste Spiel macht ein Spieler der Mannschaft M2. Dann ist X(1) wie im ersten Fall, nur mit umgekehrtem Vorzeichen
3. Das nächste Spiel macht ein anderer Spieler oder es wird eingepasst. Dann ist X(1)=0

Diese X(i) sind aus mathematischer Sicht Zufallsvariablen, die einen Erwartungswert E und eine Standardabweichung S haben. Der Erwartungswert gibt das durchschnittliche Ergebnis der X(i) an und die Standardabweichung ist ein Maß dafür, wie weit die tatsächlichen Ergebnisse um den Erwartungswert streuen.

Jetzt kommt eine Vereinfachung, die uns das Rechnen erleichtert und hoffentlich nicht so schlimm ist, dass sie das Ergebnis wesentlich verfälscht: Wir nehmen an, dass alle X(i) unabhängig voneinander und identisch verteilt sind. Vermutlich ist das nicht ganz richtig, da man am Ende der Serie taktiert und daher die möglichen Ergebnisse der letzten Spiele davon abhängen, was in den Spielen zuvor passiert ist. Ich glaube aber, dass dieses taktische Element keinen Einfluss auf E und wahrscheinlich auch kaum einen Einfluss auf S hat.

Wenn man von Unabhängigkeit ausgeht, dann ist die Zufallsvariable Z(N) = X(1) + … + X(N), welche die Veränderung von D im Rest der Liste beschreibt, näherungsweise normalverteilt mit Erwartungswert E * N und Standardabweichung S * wurzel(N).
Nun müssen wir nur noch E und S kennen, dann können wir mit der Excel-Formel

NORM.VERT( D; E*N; S*wurzel(N); WAHR)

die Wahrscheinlichkeit P ausrechnen.

Die Ermittlung von E und S ist freilich nicht so leicht. E gibt an, um wieviel die Mannschaft M1 pro Spiel im Durchschnitt besser ist als M2. Wir nehmen einfach mal an, dass E=0 ist, also beide Mannschaften gleich stark sind. Man könnte genauso gut auch mit einem positiven oder negativen E rechnen, wenn man davon ausgeht, dass eine Mannschaft stärker als die andere ist. S können wir durch Auswertung von realistischen Ligaergebnissen bestimmen. Ich habe eine kleine Stichprobe von 48 Ligaserien ausgewertet und erhalte S = 78.

Der Wert erscheint mir auch aus theoretischen Erwägungen heraus recht vernünftig. Mit einer Vielzahl von Serienergebnissen kann man ihn sicher noch etwas mehr statistisch untermauern – ich glaube aber, dass der korrekte Wert nicht viel davon abweicht.

Nun ein paar praktische Anwendungen. Nehmen wir an, es sind noch 3 Runden pro Tisch, also N=48. Welchen Wert hat ein Grand mit Vieren in Abhängigkeit von D? Die These des Eingangsposts war ja, dass dieser Wert abnimmt, je größer D ist. Tatsächlich gilt:

D = 0  P2 steigt durch ein Spiel mit 170 Punkten von 50,0% auf 62,4%, also um 12,4 %P.
D = 500  P2 steigt von 82,2% auf 89,4%, also nur noch um 7,2%P
D = 1000  P2 steigt von 96,7% auf 98,5%, also nur noch um 1,8%P

Das gleiche gilt aber auch in die andere Richtung:

D = -500  P2 steigt von 17,8% auf 26,9%, also nur um 9,1% (ca. 3/4 des Nutzens bei D=0)

D.h. der Nutzen von Pluspunkten ist umso größer, je näher die Mannschaften beieinander liegen. Das ist zwar auch intuitiv klar, aber mit diesem Ansatz kann man es mathematisch untermauern.

Das faszinierende ist, dass bei positivem D der Schaden von Minuspunkten langsamer abnimmt als der Nutzen von Pluspunkten. Damit wird mathematisch bestätigt: Wenn ich deutlich in Führung bin, sollte ich weniger riskieren als bei einer ausgeglichenen Liste. Umgekehrt ist es bei negativem D: Jetzt nimmt der Schaden von Minuspunkten schneller ab als der Nutzen von Pluspunkten.

Konkretes Rechenbeispiel: Zu einem möglichen Gewinn von 170 Punkten gehört ein Verlustrisiko von 320 Punkten.

D = 0  +170 bringt einen Nutzen von 12,4%P; -320 einen Schaden von 22,4%P – das entspricht einem Verhältnis Schaden/Nutzen von 1,8:1.
D = 500  potentieller Nutzen 7,2%P; potentieller Schaden 19,0%P; Schaden-Nutzen-Verhältnis 2,6:1
D = 1000  potentieller Nutzen 1,8%P; potentieller Schaden 7,0%; Schaden-Nutzen-Verhältnis 3,9:1
D = -1000  potentieller Nutzen 2,8%P; potentieller Schaden 2,6%P; Schaden-Nutzen-Verhältnis 0,9:1

In der Praxis ist es natürlich komplexer, weil man in der Liga gegen drei Teams gleichzeitig spielt und somit die Differenzen zu den drei anderen Teams gleichzeitig betrachten muss. Dann kann es sein, dass ich gegen die eine Mannschaft deutlich führe und daher nichts riskieren sollte, gegen die andere aber zurückliege und ein höheres Risiko eingehen könnte.
marvin
 
Beiträge: 1189
Registriert: 23. Mär 2007 01:31
Wohnort: Idstein


Zurück zu Skat und Mathe

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste