Arbeiten mit Modell
Monodeep Mukherjee
Folgen
--
Hören
Aktie
Autor: Luca Scrucca, Mohammed Saqr, Sonsoles López-Pernas, Keefe Murphy
Zusammenfassung: Heterogenität ist ein heißes Thema in der neueren Bildungsliteratur. Es wurden mehrere Forderungen laut, Methoden einzuführen, die unterschiedliche Muster oder Untergruppen im Verhalten oder Funktionieren von Schülern erfassen. Unter der Annahme, dass es ein durchschnittliches Muster gibt, das die Gesamtheit der Schülerpopulationen repräsentiert, muss das gemessene Konstrukt denselben Kausalmechanismus und dasselbe Entwicklungsmuster haben und die Schüler auf genau die gleiche Weise beeinflussen. Mithilfe einer personenzentrierten Methode (Finite-Gaußsches Mischungsmodell oder latente Profilanalyse) zeigt das vorliegende Tutorial, wie man die Heterogenität innerhalb von Engagement-Daten aufdeckt, indem man drei latente oder unbeobachtete Cluster identifiziert. Dieses Kapitel bietet eine Einführung in das modellbasierte Clustering, die die Prinzipien der Methoden, einen Leitfaden zur Auswahl der Clusteranzahl, die Bewertung der Clustering-Ergebnisse und einen detaillierten Leitfaden mit Code und einem realen Datensatz umfasst. In der Diskussion wird auf die Interpretation der Ergebnisse, die Vorteile des modellbasierten Clusterings sowie dessen Vergleich mit anderen Methoden eingegangen.
2. Ein Überblick über Bayesianisches modellbasiertes Clustering (arXiv)
Autorin: Clara Grazian
Zusammenfassung: Clustering ist eine wichtige Aufgabe in vielen Wissensbereichen: Medizin und Epidemiologie, Genomik, Umweltwissenschaften, Wirtschaftswissenschaften, visuelle Wissenschaften und andere. Methoden zur Durchführung von Rückschlüssen auf die Anzahl der Cluster haben sich oft als inkonsistent erwiesen, und die Einführung einer Abhängigkeitsstruktur zwischen den Clustern bringt zusätzliche Schwierigkeiten im Schätzprozess mit sich. In einer Bayes'schen Umgebung wird das Clustering durchgeführt, indem die unbekannte Partition als zufälliges Objekt betrachtet und eine vorherige Verteilung darauf definiert wird. Diese vorherige Verteilung kann durch Modelle der Beobachtungen induziert oder direkt für die Partition definiert werden. Mehrere neuere Ergebnisse haben jedoch gezeigt, dass es schwierig ist, die Anzahl der Cluster und damit die Partition konsistent zu schätzen. Das Problem selbst, die posteriore Verteilung auf der Partition zusammenzufassen, bleibt angesichts der großen Dimension des Partitionsraums offen. Diese Arbeit zielt darauf ab, die in der Literatur verfügbaren Bayes'schen Ansätze zur Durchführung von Clustering zu überprüfen und die Vor- und Nachteile jedes einzelnen davon darzustellen, um zukünftige Forschungslinien vorzuschlagen