Royal Skat = Testsieger?

von **Chevalier** » 1. Mai 2009 18:51

Habe gestern eine Email erhalten, dass Royal Skat Testsieger unter den PC-Skatprogrammen geworden und gleichzeitig das spielstärkste Programm (stärker als Skat 3000 !) im Test gewesen sei. Royal Skat soll eine Weiterentwicklung von Skat24 sein. Hat das mal jemand ausprobiert?

von **Karlzberg** » 1. Mai 2009 20:51

auf http://www.skat24.de/download/download.php kann man sich eine testversion ziehen. bisher kann mich das programm allerdings nicht überzeugen.

von **Skatfuchs** » 2. Mai 2009 10:31

Guten Morgen,

die Aussage des "Testsiegers" bezieht sich auf von mir durchgeführte Tests, die hier nachzulesen sind: http://www.skatfox.com/seite26.htm

In der Spielstärke ist es etwas besser als Skat 3000 und die anderen Programme, es haut aber wirklich da noch keinem vom Hocker.
Insgesamt spielen diese Programme alle auf Anfängerniveau.
:oops:

von **Chevalier** » 2. Mai 2009 11:50

In der Spielstärke ist es etwas besser als Skat 3000 und die anderen Programme

Gegen welche anderen Programme hast Du es denn spielen lassen?

von **Skatfuchs** » 2. Mai 2009 17:41

Hallo,

ich habe die Programme nicht untereinander bzw. gegen einander spielen lassen- diese technische Möglichkeit hatte ich nicht.
Inzwischen gibt es ja einen solchen Skatserver, wo man das machen könnte, wenn man die Schnittstellen beachtet und programmiert.

Ich habe aber persönlich gegen alle diese Programme mindestens 25 Serien a 36 Spiele gespielt; teilweise sogar 50 Serien a 36 Spiele.

In dem Sinne war also das Vergleichsnormal ich selbst! :lol:

von **Chevalier** » 2. Mai 2009 22:06

In dem Sinne war also das Vergleichsnormal ich selbst!

:lol:

von **marvin** » 3. Mai 2009 20:50

OK, du hast also gemessen, welches Programm am besten gegen dich klarkommt. Aussagekräftiger wäre es, wenn verschiedene Testspieler gegen die Programme anträten, am besten solche mit verschiedenen Spielstärken. Aber immerhin ist dein Test ein Anfang.

von **Chevalier** » 3. Mai 2009 21:14

Marvin schreibt: Aussagekräftiger wäre es, wenn verschiedene Testspieler gegen die Programme anträten, am besten solche mit verschiedenen Spielstärken.

Das haben einige Skatfreunde vor einigen Jahren schon getan, siehe hier:

http://www.skat-extra.de/pc_skat/staerke/staerke.html

Allerdings war Royal Skat damals noch nicht auf dem Markt.

Die "Schweinearbeit" würde ich mir heute nicht mehr antun und meinen damaligen Leidensgenossen auch nicht mehr zumuten.

von **marvin** » 4. Mai 2009 19:09

Chevalier hat geschrieben:Das haben einige Skatfreunde vor einigen Jahren schon getan, siehe hier:

http://www.skat-extra.de/pc_skat/staerke/staerke.html

Den Test kannte ich noch nicht, aber mit zwei Testspielern ist er auch nicht sooo viel aussagekräftiger als bei nur einem Testspieler. Aber das soll auch kein Vorwurf sein, ich weiß selber, wie aufwändig solche Tests sein wollen. Das ufert schnell zur Doktorarbeit aus.

Wenn man nicht messen will, welches Programm für eine bestimmte Zielgruppe das Spielstärkste ist, braucht man wohl um die 10 Testspieler: starker Ligaspieler (BL), schwacher Ligaspieler (LL), starker Freizeitspieler, Hobbyspieler, Anfänger - und das ganze jeweils in den Ausprägungen "offensiv" und "defensiv".

Jeder von denen muss dann gegen jedes Programm einige Serien spielen, und zwar am besten so, dass er nach jeder Serie das Programm wechselt. Oder aber alle Serien gegen ein Programm und dann wieder vier Wochen Realskat. Ansonsten kann es passieren, dass er nach dem dritten Programm sich so an den Computerskat gewöhnt hat (der ja vom Realskat abweichen könnte), dass die Messergebnisse verzerrt werden.

Zur Auswertung schlage ich vor, in jeder Serie die Differenz zwischen dem Wert des Menschen und dem Mittelwert der Computerspieler zu bilden. So wird auch das Programm belohnt, das ein starkes Gegenspiel hat.

Eine Alternative - aber wohl Zukunftsmusik - wäre ein Spielserver, auf dem sich Menschen und Computerprogramme tummeln und der für jeden, der dort jemals gespielt hat, eine Art ELO-Zahl führt. Für die, die damit nichts anfangen können: Das ist das Ranglistensystem beim Schach. Es funktioniert - vereinfacht gesagt so: Wenn zwei Spieler X und Y mit ELO x und y gegeneinander spielen, so sagt die Differenz x-y etwas darüber aus, wie viele Punkte der Spieler X im Durchschnitt pro Partie machen müsste. Erfüllt er genau diesen Durchschnitt, so bleiben die ELO unverändert. Macht er mehr Punkte, so gibt Y ein bischen von seiner ELO an X ab, macht er weniger Punkte, so ist es umgekehrt.

Der Vorteil dieses Systems ist: Man muss Tests nicht normieren! Mit einem ganzen Rudel von Testspielern, die keine strenge Aufgabe bekommen (spiele 5 Serien gegen Programm 1 und dann 5 Serien gegen Programm 2), sondern nur den Auftrag haben, fleißig gegen mehrere Programme zu spielen, ohne genau auf die Anzahl der Serien und die Reihenfolge zu achten, könnte man aussagekräftige Ergebnisse erzielen. Wichtig wäre nur, dass alle Programme ungefähr gleich oft dran kommen (über die gesamte Testgruppe gerechnet, nicht auf jeden einzelnen Tester heruntergebrochen!). Schöner Nebeneffekt wäre, dass auch die Menschen eine Leistungszahl bekämen.

Wie ein ELO-artiges System beim Skat funktionieren könnte, habe ich dort beschrieben: http://www.32karten.de/forum/viewtopic. ... hlight=elo


Kartenbilder mit Genehmigung der Spielkartenfabrik Altenburg GmbH ©2022 ASS Altenburger Kopieren und Vervielfältigen ist verboten!

Royal Skat = Testsieger?

Royal Skat = Testsieger?

Wer ist online?