Zum Inhalt wechseln


Foto

Subjektivität bei Einschätzung von Matchups

Matchup Legacy Matchups Sideboarding Subjektivität

  • Bitte melde dich an um zu Antworten
15 Antworten in diesem Thema

#1 Tigris Geschrieben 12. Oktober 2013 - 00:34

Tigris

    Erfahrenes Mitglied

  • Mitglied
  • PIPPIPPIPPIP
  • 1.664 Beiträge

Man kann zwar in allen Formaten immer wieder feststellen, dass Leute Matchups sehr subjektiv einschätzen, dies ist im Legacy jedoch besonders deutlich.

 

Nun ist die Frage woran liegt das?

 

Eine mögliche Erklärung ist, dass Legacy als (fast) nicht Turnierrelevantes Format viele "halben Casualspieler" anlockt und deswegen viele schlechte Spieler hat.

 

Dadurch gewinnt man als mittelmässiger oder guter Spieler egal in welchem Matchup besonders oft.

 

(Oder weil die Leute suboptimale Listen spielen, sei es aus Budgedgründen oder präferenz (nur die Karten gealtert).

 

 

Eine andere Erklärung ist, dass durch die teilweise lokal sehr verschiedenen Metagames die Decks auch anders ausgerichtet sind weil sie dem Metagame sehr angepasst sind.

 

Aber macht das so viel aus? Machen ein paar Metaentscheidungen bei der Kartenwahl wirklich den Unterschied zwischen einer 30% Matchup und einer 60% Matchup aus?

 

 

Die dritte Erklärung, ist dass man halt nicht objektiv beobachtet. Dass man Siege besser in Erinnerung hält als Niederlagen und dem Pech Schuld gibt, wenn man verliert.

Dies trifft man in allen möglichen Formaten an und kann sicher auch bis zu einem gewissen Mass dafür verantwortlich gemacht werden.

 

Jedoch erklärt es nicht, wieso es im Legacy stärker der Fall ist.

 

 

 

Neustes Beispiel:

 

UW-Miracle gegen Goblins

 

Eine Seite sagt Goblins gewinnen (fast) immer.

 

Andere Seite sagt UW-Miracle gewinnt meistens.

 

 

Nun die Frage an die beteiligten woran liegen diese Unterschiede?

 

Der UW-Spieler spielt eine anere Deckliste als die meisten, dies scheint so zu sein, aber macht das so viel aus?

 

Sind allenfalls die Goblinlisten von denen gesprochen wird auch andere?

 

 

Wie kann man sich diese Diskrepanz in der Wahrnehmung erklären?

 

 

//Edith und Anmerkung der Moderation: In diesem Thread geht es nur um die allgemeine subjektive Wahrnehmung, die zu verschiedenen Einschätzungen eines MU oder einer Situation führen kann. Es geht hier nicht um ein bestimmtest MU und soll auch nicht zu einer Matchupdiskussion im speziellen führen. Erfolgt dieses hier im Thread behalten wir uns vor diesen erneut sofort zu schließen. 


Bearbeitet von Pee-Dee-2, 14. Oktober 2013 - 10:03.

                        Wieso man Judge werden sollte:

 

Wie schon angedeutet, ich bin so ein Versager im RL, darum bin ich Judge geworden. Einmal wirklich was zu sagen haben und Jugendliche zusammenscheißen, wenn sie vor dem Enttappen ziehen bereitet mir feuchte Träume. Du kannst auch jeden hier im Forum fragen, der mich schonmal als Judge erlebt hat: Ich brauch immer 2-3 Minuten Alone-time nach jedem Call, bei dem ich jemanden das Spiel gekostet habe oder einen GL gegen ihn ausgesprochen habe (natürlich ungerechtfertigt), weil ich seine köstlichen, köstlichen Tränen trinke.

 

 

 


#2 Nekrataal der 2. Geschrieben 14. Oktober 2013 - 14:00

Nekrataal der 2.

    Big Furry Monster

  • Moderator
  • PIPPIPPIPPIPPIP
  • 9.182 Beiträge

Ich denke, dass das weder im Legacy besonders deutlich hervortritt, noch darin begründet liegt, dass

 

  • die Spielerschaft eine spezielle Zusammensetzung hat
  • die lokalen Metas sehr verschieden sind
  • die Spieler nicht objektiv sind

 

Alle diese Punkte Treffen auch für andere Formate, Themen und Menschen generell zu und sind imho nicht legacyspezifisch. Gute Spieler gewinnen in jedem Format gegen schlechtere Spieler mit einer höheren Wahrscheinlichkeit. Metagames sind überall verschieden und teilweise auch nach Ländern, Läden oder Wochen unterschiedlich. Und Menschen sind sowohl überall insofern gleich, als dass ihre Subjektivität nicht nur im Legacy ein Faktor ist.

 

Die Einschätzung von Matchups ist eh eine schwierige Sache und z.B. auch bei Primern immer der Teil, der am längsten dauert, da man nicht nur theoretische, sondern auch praktische Erfahrung benötigt. Im Legacy, wo Decks teilweise über Jahre existieren, gibt es auch reichlich Erfahrung mit bestimmten Decks. Im T2 ist dann ein Deck schon wieder rausrotiert und kein Hahn kräht mehr danach. Diese Langlebigkeit führt dazu, dass Debatten über einzelne Karten, Plays usw. bis in kleinste Feinheiten ausdiskutiert werden (können) und auch das Leute sich stärker mit bestimmten Decks identifizieren. Das ist für mich einer der Hauptgründe, warum manche Diskussion im Legacy (aber auch Modern) emotionaler geführt wird.

 

Hinzu kommt das gerade im Falle von UW Miracle dieses extrem flexibel gebaut werden kann und ich mir für jede Gelegenheit mein eigenes Miracle "schustern" kann, was von esperbladedesken Listen, die nur ein paar Miraclekarten splashen bis hin zu Helm/RiP Listen geht (siehe Blog von Einherjer). Daher ist eine Matchupanalyse hier mit Sicherheit besonders schwer. Aber: Meine, und die Erfahrung von vielen anderen Leuten, war, dass Goblins mit denen von Ihnen getesteten bzw. gespielten Listen kein gutes Matchup ist, was sich durch diverse Internetberichte, die ich ausgegraben habe, bestätigen lässt (übrigens beidseitig aus Miracle und aus Goblins Sicht). Das heisst, von allen möglichen Listen, die so gespielt werden, sind anscheinend viele eher schlecht gegen Goblins aufgestellt. Damit leveln sich für mich subjektive Elemente wie Skill etc. auch heraus und es entsteht ein objekives (statistischen) Bild. Das es auch Listen gibt, die tendenziell besser aufgestellt sind, ist da nur logisch. Der Dissenz im Miraclethread rührte  zum einen daraus, dass

 

  • der Grad in wieweit das Goblins Matchup zu verbessern wäre unterschiedlich bewertet wird (nicht jeder hat die Zeit auch jede Liste intensiv zu testen)
  • der Grad an Commitment zu bestimmten Cardchoices für ein solches Matchup zu vertreten wäre, denn typischerweise verschlechtern sich dadurch andere Matchups. (ich glaube an dem Punkt sind wir nicht mehr angelangt im UW Miracle Thread, aber das ist die natürlicherweise nächste Frage)

 

Aber auch diese Fragen stellt man sich immer bei den Mainboard Flexslots und beim Sideboard und sind damit nicht prinzipiell legacyspezifisch. Insbesonders für Kontrolldecks ist diese Flexibiltät imho archetypenbezeichnend im Gegensatz zu Combodecks, die idR sehr wenig Abweichung ermöglichen bzgl. Liste (dafür muss man Storm allerdings in seine spez. Inkarnationen von Spanish Inq. bis DDFT sehen ;-) )

 

Ähnliche flexible Listen gab es ja bei BUG Anfang des Jahres bis sich die BUG Shardless Listen herauskristallisiert haben. Bei Miracle denke ich aber, werden wir auch dauerhaft einen Zoo an Builds haben. Die Shardless Listen sind aber halt auch keine reinrassigen Kontrolldeck mehr (im Stile von Draw-Go).


Bearbeitet von Nekrataal der 2., 14. Oktober 2013 - 18:39.


#3 Gast_GoboLord_* Geschrieben 24. Oktober 2013 - 20:26

Gast_GoboLord_*
  • Gast

Hallo zusammen.

 

Ich habe mir vor ca. 3 Jahren mal eine ähnliche Frage gestellt und habe mich damals damit abgemüht Statistiken zu erstellen um herauszufinden wie die Matchup-% "tatsächlich" verteilt sind.

Ist vielleicht ganz interessant das mal zu lesen: http://www.mtgthesou...tions-gone-wild

 

Auch wenn die Resultate im einzelnen nicht mehr relevant sind, ist doch meine Einleitung und die anschließende Diskussion lesenswert.


Bearbeitet von GoboLord, 24. Oktober 2013 - 20:28.


#4 Nekrataal der 2. Geschrieben 24. Oktober 2013 - 21:50

Nekrataal der 2.

    Big Furry Monster

  • Moderator
  • PIPPIPPIPPIPPIP
  • 9.182 Beiträge

Das klingt vllt trivial und wird bei dem Verlangen nach harten statistischen Zahlen ev. gerne vergessen, aber letztendlich ist es doch so, dass viele Matchup Prozente nur eine systematische Schwäche gegen bestimmte Strategien bestätigt, die sich auch allein aus theoretischen Überlegungen ermitteln lässt, aber ohne genaue Prozentzahlen dranpappen zu können. Typischerweise lassen sich stark negative Matchups dann auch nicht durch ein SB kitten, weil niemand ein komplettes Hass SB gegen ein Deck spielt und eine systematische Schwäche kaum auszugleichen ist. Wenn die Statistik sowieso einer gewissen Varianz unterliegt, ist das im Endeffekt genausogut oder schlecht als wenn ich ein theoretische Aussage mache der Kategorie: " Das Matchup ist negativ" oder "Das Matchup ist stark negativ". So brauche ich z.B. nicht eine statistisch relevante Anzahl an Partien Goblins vs. Belcher zu spielen, um zu wissen, dass das Matchup negativ für Goblins ist, einfach weil Goblins jetzt ganz platt formuliert keine Disruption spielt, die gegen Belcher zieht, noch irgendwas kurzfristig gegen die Gewinnbedingungen macht. Das ist sicherlich nicht bei allen Matchups so klar.



#5 Accendor Geschrieben 24. Oktober 2013 - 22:33

Accendor

    Erfahrenes Mitglied

  • Moderator
  • PIPPIPPIPPIP
  • 3.423 Beiträge

Eine mögliche Erklärung ist, dass Legacy als (fast) nicht Turnierrelevantes Format viele "halben Casualspieler" anlockt und deswegen viele schlechte Spieler hat.

 

Wenn ich mich zu einem Modern- oder Standardturnier begebe kann ich davon ausgehen bei jeweils 5 Runden mindestens 3:1:1, in der Regel aber wohl so 4:1 zu gehen. Gehe ich auf ein Legacyturnier stehe ich irgendwie meistens bei einem 3:2 oder einem 2:3 - mit Tendenzen nach unten. Und das liegt ganz offensichtlich nicht daran, dass ich Casualdecks spiele oder keinen Plan habe, sondern daran, dass die anderen Legacyspieler einfach besser sind als ich. Auf Standard- und Modernturnieren treffe ich gefühlte 90% Leute die keine Ahnung haben was sie tun und auch auf einem GPT mit einem Randomhaufen antreten. Im Legacy sehe ich hingegen nur bis ans Maximum optimierte Decks, weil alle Casuals, nachdem sie auf dem ersten Turnier auf die Nase bekommen haben, entweder direkt quitten oder massiv aufstocken. Ja, auf manchen Turnieren hat man dann schon mal ein oder zwei von ~20 Personen, die Haufen spielen und keine Ahnung haben was sie tun (Böse Zungen würden jetzt behaupten jedes Turnier bei dem ich mitspiele hat mindestens eine solche Person ;-) ).

kA, Legacy als Casualformat (auch als halbes) klingt für mich persönlich völlig abwegig.


Bearbeitet von Accendor, 24. Oktober 2013 - 22:33.

Nachts höre ich oft ihren Klang,
ihren donnernden Gesang
und mit Grausen liege ich wach.
Ich verfluche sie hundertfach


#6 Gast_GoboLord_* Geschrieben 24. Oktober 2013 - 22:56

Gast_GoboLord_*
  • Gast

Das klingt vllt trivial und wird bei dem Verlangen nach harten statistischen Zahlen ev. gerne vergessen, aber letztendlich ist es doch so, dass viele Matchup Prozente nur eine systematische Schwäche gegen bestimmte Strategien bestätigt, die sich auch allein aus theoretischen Überlegungen ermitteln lässt, aber ohne genaue Prozentzahlen dranpappen zu können. Typischerweise lassen sich stark negative Matchups dann auch nicht durch ein SB kitten, weil niemand ein komplettes Hass SB gegen ein Deck spielt und eine systematische Schwäche kaum auszugleichen ist. Wenn die Statistik sowieso einer gewissen Varianz unterliegt, ist das im Endeffekt genausogut oder schlecht als wenn ich ein theoretische Aussage mache der Kategorie: " Das Matchup ist negativ" oder "Das Matchup ist stark negativ". So brauche ich z.B. nicht eine statistisch relevante Anzahl an Partien Goblins vs. Belcher zu spielen, um zu wissen, dass das Matchup negativ für Goblins ist, einfach weil Goblins jetzt ganz platt formuliert keine Disruption spielt, die gegen Belcher zieht, noch irgendwas kurzfristig gegen die Gewinnbedingungen macht. Das ist sicherlich nicht bei allen Matchups so klar.

 

ICh habe meine Analyse noch weiter geführt als im Startposting (und auch bei einem späteren Update) zu sehen ist und das einzig große Fazit dass ich ziehe konnt war, dass die allermeisten MU sich den 50%-50% annähern je mehr Daten man sammelt. Selbst bei Matchups die sich sehr eindeutig anfühlen sind die wirklichen Chancen (in%) eher wenig beeindruckend aufgeteilt.

 

Heißt übersetzt und anhand eines spontan erfundenen Beispiels:

 

Matchup: Merfolk vs. Goblin wird sich für die meisten spontan anfühlen wie "30%-70%" ist aber in Wirklichkeit eher 48%-52%

Matchup: TES vs. Goblins fühlt sich an wie "90"-10%" ist aber in Wirklichkeit 57%-43%.

 

Das lässt für mich unter anderem die Vermutung zu dass man sich nicht auf seine Gefühle verlassen sollte und dass man die jeweiligen Matchups IMMER anhand meherer Variabelen relativieren sollte, wenn man sie richtig einschätzen will. z.B.
 

* Erfahrung der Spieler mit dem Format,

* ...mit dem Deck,

* ...mit dem MU

* Fehlertoleranz des Decks

* individuelle Tweaks im MD und SB

 

und vieles mehr. Es ist also nahezu unmöglich ein MU richtig einzuschätzen, weil es immer auf einen Coinflip hinausläuft wenn man die o.g. Variabelen nicht richtig kennt. Das befriedigende an dieser Erkenntnis ist, dass man dadurch auch mal ganz gelassen als Goblin Spieler gg Comboantreten kann ohne sich darauf einzulassen das Ergebnis des Spiel im Voraus auszudiskutieren. Wenn jedes Spiel mit den Wahrscheinlichkeiten verloren (bzw. gewonnen) würde, die viele Spieler ihm zugestehen (also die Vorhersagen in Form von MU-%), dann bräuchte man ja gar nicht mehr zu spielen sondern könnte sich anhand von Statistiken auf ein Ergebnis einigen. 

 

In diesem Sinne: 

 

"Ein Hoch auf die Variabelen!"


Bearbeitet von GoboLord, 24. Oktober 2013 - 22:59.


#7 Nekrataal der 2. Geschrieben 25. Oktober 2013 - 11:45

Nekrataal der 2.

    Big Furry Monster

  • Moderator
  • PIPPIPPIPPIPPIP
  • 9.182 Beiträge
Hehe, das waere ja mal was. Dann gehen die Spiraltidespieler jedenfalls nicht mehr in die time.

Der Zufallsfaktor, d.h. welche der 60 Karten ich in meinen 7+ x, die ich im Spiel sehe, bekomme, hat natuerlich massgeblichen Einfluss auf die Statistik. Auch die anderen von Dir genannten Faktoren.
Trotzdem denke ich nicht das jedes Matchup vs. 50/50 tendiert. Das ist nicht Deine Aussage, oder ?

Ich moechte auch nochmal Dein Beispiel mit TES herausnehmen. Die Matchupprozente finde ich auch theoretisch einleuchtend. TES spielt im Vergleich zu Belcher Disruptionelemente wie Discard oder Silence und tauscht damit Geschwindigkeit vs. Gewinnsicherheit. Waehrend Belcher quasi alles auf eine Karte setzt und ein Force quasi Gameloss bedeutet, hat TES hier Vorteile. Den Geschwindigkeitsverlust kann Goblins nutzen, da es als schnelles Aggrodeck und gerade mit Lackey Piledriver eine enorme Clock haben kann.

Bearbeitet von Nekrataal der 2., 25. Oktober 2013 - 11:48.


#8 Fyren Geschrieben 25. Oktober 2013 - 12:25

Fyren

    Erfahrenes Mitglied

  • Mitglied
  • PIPPIPPIPPIP
  • 2.858 Beiträge
  • Level 1 Judge
Bei dem Versuch die Gewinnwahrscheinlichkeit eines Decks gegen ein anderes rein durch statistische Analyse zu bestimmen trifft man zwangsläufig auf ein Problem: die Varianz des Spiels Magic an sich.
Egal wie man sein Deck auch baut, es besteht immer das Risiko ein Spiel durch "schlechte" Draws zu verlieren. Prominenteste Beispiele dafür sind wohl Screw und Flood. Das bedeutet, dass man bei jedem gespielten Spiel vor der Aufnahme in die Statistik eruieren muss, ob der Spielverlauf auch wirklich representativ für die jeweiligen Decks war.

Dazu kommen dann noch die Unzulänglichkeiten des Testens: die Spieler.
Qualitative Unterschiede zwischen den Spielern führen zwangsläufig ebenfalls zu einer Verzerrung des Ergebnisse. Ein guter Goblinspieler wird gegen einen schlechten Stonebladespieler deutlich häufiger gewinnen als gegen einen guten.
Darüber hinaus können auch bereits leichte Abweichungen in den Decklisten Auswirkungen auf das Testergebnis haben. Um bei meinem Beispiel zu bleiben: mehr Lingering Souls verschieben das MU zugunsten des Stonebladespielers.


Ein meiner Meinung nach besserer Ansatz ist es ein MU zunächst auf dem Papier zu analysieren um dann die getroffenen Annahmen in Testspielen zu verifizieren. Dann erhält man zwar keine absoluten Gewinnwahrscheinlichkeiten, aber es lassen sich sehr leicht Tendenzen ablesen und vor allem identifiziert man auf diese Weise gleichzeitig noch die besten Gewinnstrategien pro MU.

aber mal im ernst, ich glaube combospieler sind nerds die von papa gestillt wurden.

Für alle, die eine Budgetlösung fürs Legacy suchen, hier werdet ihr fündig.
Und hier gibts den entsprechenden Post, der das Deck erklärt.

#9 Chickenfood Geschrieben 25. Oktober 2013 - 18:11

Chickenfood

    Mitglied

  • Mitglied
  • PIP
  • 355 Beiträge

Ich bin inzwischen zu der überzeugung gelangt das reines "zielloses" Testen um am Ende Prozentzahlen zu bekommen nicht viel bringt.

Am Ende musst du immer mit den 1-2 Matches im Turnier auskommen.

 

Die meisten Decks sind "bekannt" also Mana, Kern des Decks steht usw. Man muss keine großen Änderungen mehr austechen.

Man macht also am besten ~20 games in denen man eine oder zwei kritische Situationen absichtlich durch "cheaten" herbeiführt und guckt was passiert. Z.b. man will wissen ob Turn 1 Vial oder Lackey besser ist bietet es sich an einer 20 spiele mit den beiden auf der starthand zu beginnen. Oder man spielt mit Pseudo Splitcards.

Wenn man dem Testpartner vertraut und beide ehrlich spielen kann man da viele schlüsse draus ziehen. Wie häufig die Situation A z.B. Miracle zieht Turn 5 oder 6 Engel von Oben für den einen oder andern ausgeht.

Man optimiert seine entscheidungen für bestimmte kritischen situationen. Das ist offensichtlich nur gut wenn danach unklar ist was passiert. Eine Starthand mit CoS, Lackey, SGC und PIledriver muss ich nicht durchtesten.

Ich hab aber ca. 50+ mal eine Explorer/Therapie Starthand gegen ein Jacedeck mit und ohne Brainstorm getestet.

 

Wie häufig die Situation auftaucht kann man ausrechnen wenn mans wichtig findet. Die besseren Entscheidungen helfen einem viel mehr.


Bearbeitet von Chickenfood, 25. Oktober 2013 - 18:16.

Wissen ist Nacht, aber 42 ist die Antwort auf alles.

#10 Gast_GoboLord_* Geschrieben 27. Oktober 2013 - 12:20

Gast_GoboLord_*
  • Gast

Trotzdem denke ich nicht das jedes Matchup vs. 50/50 tendiert. Das ist nicht Deine Aussage, oder ?

Jein. Meine Aussage war, dass man, wenn man Daten objektiv erfasst, feststellen wird, dass die meisten MU sich einer 50-50 Chancenverteilung annähernd, gerade bei besonders großen Mengen von Daten. Das liegt meiner Meinung nach daran, dass die unzähligen Faktoren die ein Spiel beeinflussen können sich in deutlicher in den Daten abzeichnen als man erwarten würde. Man geht bei Einschätzungen von MU default immer davon aus, dass beide Spieler gleich gut sind, gleich viel Erfahrung haben etc. d.h. man DENKT man beurteilt die Chancenverteilung des bevorstehenden Spiels (z.B. Goblins gg TES: 20%-80%), aber in WIRKLICHKEIT hat man Decklisten vor Augen und vergleicht diese miteinander. Meine Aussage war, daher:

 

die spontanen Einschätzungen von MU% mögen zwar richtig sein (bspw. Goblins gg TES: 20%-80%), aber die se muss man noch nachträglich korrigieren, unter Berücksichtigung der o.g. Variablen. Heißt: Wenn ich (Goblins) gg Mark Mustermann (TES) spiele, wären die Chancen vielleicht aufgrund meiner Erfahrung auf 30%-70% zu korrigieren. Wenn ich aber gg Bryant Cook (TES) spiele, dann ist es logischer die Korrektur in die andere Richtung ( 10%-90%) vorzunehmen. 

 

Meine Message war daher, dass die Durchschnittswerte die ich damals ermittelt habe nicht wiedergeben wie zwei Decks gegeneinander performen, sondern sie geben wieder wie zwei Decks unter der Auswirkung aller Variabelen gegeneinder performen. Und damit die Variablen größtenteils zufällig verteilt sind, sind auch die Ergebnisse (annähernd) zufällig verteilt.


Bearbeitet von GoboLord, 27. Oktober 2013 - 12:22.


#11 Nekrataal der 2. Geschrieben 28. Oktober 2013 - 22:59

Nekrataal der 2.

    Big Furry Monster

  • Moderator
  • PIPPIPPIPPIPPIP
  • 9.182 Beiträge

Ja, ich verstehe Deine Aussage. Es ist quasi so als würde man theoretischen und einen praktischen Wirkunsggrad vergleichen. Bei praktischen Wirkunsggraden spielen viele Faktoren eine Rolle (wie Reibungswärmeverlust), die den theoretisch erzielbaren Wirkungsgrad schmälern. Allerdings ist hierbei stets die Richtung klar, da es keinerlei Effekte gibt, die den Wirkungsgrad über den theoretischen Wert anheben würden.

 

In Deinem Beispiel möchte ich explizit darauf hinweisen, dass die Waagschale sich in beide Richtungen bewegen kann, sowohl pro Belcher als auch pro Goblins um "den" oder einen angenommenen theoretischen Wert, sagen wir 20/80 herum. Genau so beschreibst Du es ja auch: Einmal als 30/70 ein anderes Mal 10/90. Insofern würde man bei einer statistischen Erhebung, gerade bei vielen Samples erwarten, das Variablen wie Skill sich "herausmitteln", da es ja (obwohl das auch nur eine Annahme ist) statisch genauso viele gute wie schlechte Goblins- bzw. Belcherspieler geben sollte. Warum ist der Effekt den Du beschreibst dann gerichtet? Warum sollte Skill (wie beim Reibungsverlust) Matchupprozente quasi "nivellieren" und in Richtung 50/50 drücken? Deine Ergebnisse sprechen ja für einen solchen Effekt auch wenn sie ja letztendlich nicht 50/50 aussagen, sondern immer noch "Echoes" der theoretischen Matchupprozente enthalten, in dem Sinne, das z.B. Belcher ein sehr schlechtes oder Bant CT ein gutes Matchups darstellt.

 

Die Antwort, die mir dazu einfällt, ist vermutlich trivial, aber hat genau diese nivellierende Eigenschaft: Der Zufall. Magic ist ja immernoch ein Kartenspiel, bei dem man Random from the Top 10-12 Karten zieht, bevor das Belcher Deck gewinnt. Das theoretische Matchup (20/80) ergibt sich ja daraus, dass man a) sagt Belcher geht im Durchschnitt T2 in die Combo und gewinnt, sofern es über Belcher abgeht und b) Goblins machen nichts dagegen. Aber wie oft ist das wirklich der Fall? Wie oft geht der Belcherspieler später ab? Wie oft muss man sich mit 10 Goblintokens zufrieden geben, die ev. doch nicht gegen die nachgelegten Goblins auf der Seite des Goblinspielers ausreichen. Wie oft connected der Lackey und raced den Belcher Spieler, weil der nur Murks zieht?

 

Man könnte jetzt ja behaupten, dass der Goblinsspieler genauso häufig eine miese Hand zieht wie der Belcherspieler und sich der Effekt herausmittelt und ebenfalls nicht gerichtet ist wie Skill. Und hier kommt etwas ins Spiel, was man als Konsistenz bezeichnet. Combodecks sind notorisch inkonsistent als Tradeoff für Ihre rohe Power T1 den Gegner einfach zu überfahren. Ist ein Combodeck konsistent (Hulk Flash) muss es immer gebannt werden. Konsistenz ist quasi ein Mass dafür wie wenig ich vom Zufall der obersten Karte meines Decks abhänge. Vermutlich müsste Deine Auswertung dann zeigen, dass insb. bei Combodecks die Varianz der Matchups grösser ist als bei gleich konsistenten Decks.

 

Ein weiterer gerichtete Effekt sind vermutlich individuelle Tweaks. Während sich Combo eher selten Sorgen um Aggro macht und tendenziell weniger SB Karten dagegen spielt, besteht das Goblins SB tendenziell zu einem nennenswerten Teil aus Anti-Combo Karten. Damit verschiebt sich das Matchup nach dem Boarden fast immer zugunsten des Nicht-Combodecks.

 


Bearbeitet von Nekrataal der 2., 28. Oktober 2013 - 23:04.


#12 I use Arch btw Geschrieben 28. Oktober 2013 - 23:48

I use Arch btw

    Erfahrenes Mitglied

  • Mitglied
  • PIPPIPPIPPIP
  • 3.482 Beiträge

Wenn ich mich zu einem Modern- oder Standardturnier begebe kann ich davon ausgehen bei jeweils 5 Runden mindestens 3:1:1, in der Regel aber wohl so 4:1 zu gehen. Gehe ich auf ein Legacyturnier stehe ich irgendwie meistens bei einem 3:2 oder einem 2:3 - mit Tendenzen nach unten. Und das liegt ganz offensichtlich nicht daran, dass ich Casualdecks spiele oder keinen Plan habe, sondern daran, dass die anderen Legacyspieler einfach besser sind als ich. Auf Standard- und Modernturnieren treffe ich gefühlte 90% Leute die keine Ahnung haben was sie tun und auch auf einem GPT mit einem Randomhaufen antreten. Im Legacy sehe ich hingegen nur bis ans Maximum optimierte Decks, weil alle Casuals, nachdem sie auf dem ersten Turnier auf die Nase bekommen haben, entweder direkt quitten oder massiv aufstocken. Ja, auf manchen Turnieren hat man dann schon mal ein oder zwei von ~20 Personen, die Haufen spielen und keine Ahnung haben was sie tun (Böse Zungen würden jetzt behaupten jedes Turnier bei dem ich mitspiele hat mindestens eine solche Person ;-) ).

kA, Legacy als Casualformat (auch als halbes) klingt für mich persönlich völlig abwegig.

Offensichtlich sind damit nicht die wöchentlichen Modern bzw Anfänger Turniere im Spielraum, sondern das PTQ-Level gemeint...


Bearbeitet von JDK, 28. Oktober 2013 - 23:49.

I use Arch btw


#13 Gast_GoboLord_* Geschrieben 29. Oktober 2013 - 00:42

Gast_GoboLord_*
  • Gast

Warum ist der Effekt den Du beschreibst dann gerichtet? Warum sollte Skill (wie beim Reibungsverlust) Matchupprozente quasi "nivellieren" und in Richtung 50/50 drücken? 

 

Meine Erklärung wäre, dass die %-Verteilung in den meisten MU tatsächlich sehr nahe an 50-50 herankommt. Wir haben zwar als Beispiel immer von "Storm vs Goblins" gesprochen, aber ich habe das Beispiel nur gewählt weil es besonders anschauliches Beispiel für extreme Verteilungen ist.

Wenn man (über die ganz Diskussion hinweg) mal ANT vs. TES als Beispiel nimmt, oder Natural Order Bant vs. The Rock (im Hinblick auf das Alter meiner Daten)dann macht die Annäherung an 50-50 schon mehr Sinn.

 

Letztendlich wollte ich (unter anderem) auch darauf hinweisen, dass viele MU-% in Wirklichkeit nicht so extrem verteilt sind wie man annimmt. Ich habe damals mit der Analyse angefangen weil ich es mir nicht mehr anhören konnte dass Storm Spieler behaupten Goblins wäre ein "95%-MU". Das hielt ich für eine statistische Unmöglichkeit (unter anderem deshalb weil sich meine Goblin-Listen seit 2007 immer noch mit einer positiven Win-Loss Ratio gg. Storm COmbo rühmen dürfen - auch das habe ich in Daten festgehalten) und habe Daten gesammelt, damit ich eine Grundlage hatte um diesen Leuten zu widersprechen.

 

---------ACHTUNG, AB HIER WERDEN MANCHE LESER ÜBERFORDERT---------------

 

Ich weiß nicht ob du mit Regression Models vertraut bist, aber aufgrund der Daten (die ich nicht überbewerten möchte) vermute ich mal dass der Beitrag der Decklisten (bzw der Beitrag den das MU auf die % Verteilung hat) im Vergleich zu anderen Variabelen sehr gering ist.

 

 

Als Formel ausgedrückt:

 

y= a*2+b*2+c*2....+x*2+z*0,1

 

Die Variabelen a bis x stehen dann für alle Faktoren die eine Rolle spielen können bei einem Spiel, außer der Deckliste.

z.B.

 

a= Differenz der Erfahrung der beiden Spieler

b= Differenz der Müdigkeit der beiden Spieler

c= Differenz der Motivation der beiden Spieler 

etc.

 

y steht dann für die relativen Gewinnchancen des Spielers. Und z wäre der Vorteil der einen Deckliste gegenüber der anderen (das was man angeblich bewertet wenn man von einem "95%-MU" redet). 

Wenn man davon ausgeht dass die Variabelen a bis x zufällig verteilt sind, und die weightings (*2) mit dem weight des MUs (*0,1) vergleicht dann sieht man dass man leicht bei 50-50 auskommt. In meinem Beispiel wäre der Vorteil den ein Spieler aufgrund seiner Erfahrung hat 20mal so wichtig wie den Vorteil den ein Spieler aufgrund seiner Deckliste hat (wenn man beide Listen im Vakuum betrachtet).

 

Vereinfacht gesagt heißt dass, wenn ich doppelt so viel Spielerfahrung habe wie mein Gegner (a=2), dann müsste seine Deckliste im Vakuum schon mindestens 41mal so gut sein wie meine (z=41) bzw sie müsste meine Deckliste im Vakuum mit 41 zu 1 schlagen können, damit sie einen wichtigeren Faktor darstellt als meine Erfahrung.

 

Natürlich sind die weights in Wirklichkeit unbekannt und vermutlich ist der Unterschied auch nicht so extrem wie ich ihn gerade dargestellt habe - es ging mir nur um ein anschauliches Beispiel. Wirklich große Abweichungen von den 50/50 kommen dann nur zustande wenn z entsprechend groß ist. Und das ganze Modell wird nicht gerade anschaulicher wenn man bedenkt wie viele Faktoren eine Rolle spielen können und dass die weights der einzelenen Faktoren nicht alle gleich groß sind


Bearbeitet von GoboLord, 29. Oktober 2013 - 00:52.


#14 Cheatsrichter Geschrieben 29. Oktober 2013 - 10:10

Cheatsrichter

    Mitglied

  • Mitglied
  • PIP
  • 258 Beiträge

Interessante Überlegung. Neben der Tatsache, dass diese weights unbekannt sind, würde ich aber auch annehmen, dass sie eben nicht für jedes Deck gleich sind. Je linearer ein Deck ist, desto weniger Erfahrung brauche ich und desto weniger Einfluss hat Müdigkeit. Ein Deck dagegen, welches sehr optionen- und Interaktionsreich ist und dazu die Möglichkeit hat zu beeinflussen welche Karten man auf der Hand hat (durch Cantrips und Tutoren) "erfordert" eher einen wachen und erfahrenen Spieler. Zu einem gewissen Grad lassen sich "wach" und "erfahren" wahrscheinlich auch austauschen. Ich gehe zumindest davon aus, dass Leute wie z.B. der Alzheimer auch nach einer durchzechten Nacht einen Doomsday-Pile gebaut bekommen, während ein völliger Storm-Anfänger wahrscheinlich ins Grübeln kommt, wenn keiner der X Standard-Piles funktioniert. Ist er allerdings mental fit, wird er evtl. trotzdem noch auf eine Lösung kommen.


Ich bin Jacks Medulla Oblongata.


#15 Pee-Dee-2 Geschrieben 29. Oktober 2013 - 10:28

Pee-Dee-2

    Erfahrenes Mitglied

  • Super-Moderator
  • PIPPIPPIPPIP
  • 4.892 Beiträge

Ich musst eben viel Text nachlesen und ich habe vermutlich vieles gar nicht richtig wahr genommen, wenn also das eine oder andere schon gesagt worden ist, dann seht es mir nach.

 

Natürlich gibt es Unterschiede zwischen der subjektiven Wahrnehmung eines Matchups und der tatsächlichen. Und auch wenn es eigentlich total egal ist, wie eine Prozentverteilung aussieht, so sehe ich das aber nicht, dass sie in der Regel zu 50:50 tendiert.

 

Natürlich gibt es sowas wie "optimale Decklisten" gegen Archetyp X und auch kann man mal Flood und Screw haben, aber das sind Faktoren, die in eine Bewertung gar nicht einfließen dürfen. Bei der Erstellung einer Prozentzahl ist das individuelle Testing maßgeblich und hierzu sollte man einen Gegner wählen, der das MU ebenso gut kennt wie man selbst und auch das zu testende Deck. Zu Der Matchupanalyse gehören aber nicht nur Situationen mit 7 Handkarten und einer deckidealen Verteilung von Ländern zu Spells. Nein, zur Einschätzung und zuletzt auch zum Skill gehören auch Mulligans und auch mal das Einsetzen von splitcards.

 

Beispiel: Man muss kein Held sein um zu wissen, dass ein Deck mit 20 Massremoval 10 Pointremoval und 6 unblockbaren Kreaturen mit Pro: Red gut gegen Goblins abschneidet. Von daher sollte man beim Testen auch immer von normalen Decklisten ausgehen, also Decklisten, die im Moment viel gespielt werden. 

 

Varianz der Starthände: Klar kann eine suboptimale Hand zum Loss führen oder auch dass man keine Spells/Länder nachzieht. Aber es bleibt doch jedem selbst überlassen diese Testgames dann in die Statistik einfließen zu lassen. Auf der anderen Seite weiß man beim Testen aber vor Beginn schon, was der Gegner spielt. Was bedeutet das? Vorteil? Nachteil? Ausgewogen? Auch hier liegt es am Deck. Der Belchermann findet es vielleicht doof, wenn der Gegner das schon weiß. Dem Goblinmann ist es vielleicht egal. Andere Decks können besser bluffen und es mit einfließen lassen (Beipiel: "Ich muss um ein Daze herumspielen oder?").

 

Es gibt X Faktoren undich bin zwar auch der Meinung, dass man Zahlen nicht in Stein meißeln kann, aber ich bin ganz und gar nicht der Meinung, dass sich alle MU Richtung 50% bewegen. Gerade wenn man die ganzen blöden von Gobolord genannten Faktoren der Gleichung, die sich für mich ziemlich willkürlich anhört, außen vor lässt. Man muss vermutlich gegen ein Deck mindestens 110 Spiele machen. 100 sind dann valide und 10 fallen durch Faktoren weg. Dann hat man eine Prozentzahl, wem die auch immer wichtig ist. Dann macht man wieder 110 Spiele und vergleich die Ergebnisse und nochmal und nochmal. Vermutlich kann man dann nach 10x110 Spielen den Schnitt bilden. Anmerkung: 10x110 Spiele sind was anderes als 1.100 Spiele in meinem Beispiel ;)


El muerte nunca es finalmente.

Eingefügtes Bild

#16 Nekrataal der 2. Geschrieben 29. Oktober 2013 - 20:14

Nekrataal der 2.

    Big Furry Monster

  • Moderator
  • PIPPIPPIPPIPPIP
  • 9.182 Beiträge

Natürlich sind die weights in Wirklichkeit unbekannt und vermutlich ist der Unterschied auch nicht so extrem wie ich ihn gerade dargestellt habe - es ging mir nur um ein anschauliches Beispiel. Wirklich große Abweichungen von den 50/50 kommen dann nur zustande wenn z entsprechend groß ist. Und das ganze Modell wird nicht gerade anschaulicher wenn man bedenkt wie viele Faktoren eine Rolle spielen können und dass die weights der einzelenen Faktoren nicht alle gleich groß sind

 

Jahahaha ! OK, verstehe. Die Richtung oder Drift in 50/50 Richtung kommt Deiner Meinung also dadurch zustande, dass die theoretischen Matchup Prozente eigentlich, ich übertreibe mal, keinen Einfluss auf den Ausgang des Spiels haben (z=0). Das erklärt dann auch, dass sich Skill nicht herausmittelt, wie ich es dargestellt hatte, weil meine Grundannahme, dass das Matchup Goblins/Belcher sich um die theoretischen Matchupprozente als Maximum einer Gausskurve herum entwickeln, einfach falsch ist. Platt gesagt - und auch hier übertreibe ich mal, um das Argument im Extremfall klar zu machen - zählen nur soziale / menschliche Faktoren (ggf. andere Faktoren wie Glück etc.). Im Prinzip könnte man auf diese Weise einen Fragebogen vor dem Turnier ausfüllen, der meinen Skill und meine körperlich/seelische Verfassung misst. Das Abscheiden bei dem Test entspricht dann gleichzeitig den finalen Standings. ;-)
 

Wir sind uns wahrscheinlich einig, dass die Wahrheit irgendwo in der Mitte liegt. Dein Anliegen war ja nachzuweisen, dass theoretische Matchupprozente mit Vorsicht zu geniessen sind, da auch andere Faktoren eine Rolle spielen, die quasi nivellierend wirken. Umgekehrt sind auch in diesen Zahlen immer noch Graduierungen erkennbar, die auf die theoretischen Matchupverhältnisse schliessen lassen. (Aus Goblinssicht Belcher = tendenziell schlecht, CounterTop = tendenziell gut). Und wie Cheatsrichter und Du schon sagen, ist auch z von Deck zu Deck verschieden (und vermutlich auch nie 0).

 

Letztendlich sollen Matchupprozente ja helfen, Matchups besser einzuschätzen, um daraus weitere Entscheidungen abzuleiten

 

- auf welche Decks ich mein SB vorbereiten muss

- auf welche Decks ich mit welchem Playstyle reagieren muss

- wie ich Siege / Niederlagen vs. bestimmte Decks werte und daraus Schlüsse ziehe (so könnte ich als Goblinsspieler einen Loss vs. Belcher einfach unter "That's how it is" abhaken)

usw.

 

Hierbei finde ich die theoretischen Werte nach wie vor nützlicher (Entscheidungshilfe), weil sie stärker polarisieren und die Entscheidungsfindung damit einfacher wird. Natürlich sollte man sich bewusst sein, dass die Praxis ggf. anders aussieht und durch viele weitere Faktoren "verwässert" wird. Wenn jetzt alle Matchups annähernd 50/50 wären - ich übertreibe nochmal - wie willst Du da noch sinnvoll Entscheidungen treffen z.B. die Auswahl von SB Karten?


Bearbeitet von Nekrataal der 2., 30. Oktober 2013 - 10:21.






Auch mit einem oder mehreren dieser Stichwörter versehen: Matchup, Legacy, Matchups, Sideboarding, Subjektivität

© 2003 - 2016 | @MTG_Forum auf Twitter | MTG-Forum.de auf Facebook | Impressum | Disclaimer/Datenschutz | Magic-Markt | DeckStats
Diese Webseite steht in keiner Verbindung zu Wizards of the Coast, Inc. oder Hasbro, Inc. Magic: The Gathering ist ein eingetragenes Warenzeichen von Wizards of the Coast, Inc, einem Tochterunternehmen von Hasbro, Inc. Alle Rechte an den Kartennamen, dem Tap-Symbol, den Mana-Symbolen und den Editions-Symbolen liegen bei Wizards of the Coast, Inc. Alle Rechte an Bildern liegen bei dem jeweiligen Künstler oder Wizards of the Coast, Inc. Alle Rechte vorbehalten.