HINWEIS: Die IDRE Statistische Beratungsgruppe wird die Website im Februar auf das WordPress CMS migrieren, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata Class Notes Zählen von n bis N Einführung Stata hat zwei eingebaute Variablen namens n und N. N ist Stata-Notation für die aktuelle Beobachtungsnummer. N ist 1 in der ersten Beobachtung, 2 in der zweiten, 3 in der dritten, und so weiter. N ist die Stata-Notation für die Gesamtzahl der Beobachtungen. Wir können sehen, wie n und N arbeiten. Wie Sie sehen können, enthält die Variable id die Beobachtungsnummer, die von 1 bis 7 läuft, und nt die Gesamtzahl der Beobachtungen, die 7 ist. Zählen mit mit n und N in Verbindung mit dem Befehl kann einige sehr nützliche Ergebnisse liefern. Natürlich, um den Befehl zu verwenden, müssen wir zuerst unsere Daten auf der Variablen sortieren. Nun ist n1 die Beobachtungsnummer innerhalb jeder Gruppe und n2 die Gesamtzahl der Beobachtungen für jede Gruppe. Um die niedrigste Punktzahl für jede Gruppe aufzulisten, verwenden Sie die folgenden Punkte: Um die höchste Punktzahl für jede Gruppe aufzulisten, verwenden Sie die folgenden: Eine andere Verwendung von n Lets verwenden n, um herauszufinden, ob es doppelte ID-Nummern in den folgenden Daten gibt: Wie sich herausstellt, Beobachtungen 6 und 7 haben die gleichen ID-Nummern und aber unterschiedliche Notenwerte. Duplikate finden Mit Hilfe von N können Sie doppelte Beobachtungen finden. In diesem Beispiel sortieren wir die Beobachtungen durch alle Variablen. Dann verwenden wir alle Variablen in der by-Anweisung und setzen gesetzt n gleich der Gesamtzahl der identifizierenden Beobachtungen. Schließlich listen wir die Beobachtungen auf, für die N größer als 1 ist, wodurch die doppelten Beobachtungen identifiziert werden. Wenn Sie eine Menge von Variablen in der Datenmenge haben, könnte es eine lange Zeit dauern, um sie alle zweimal einzugeben. Wir können die Wildcard verwenden, um anzuzeigen, dass wir alle Variablen verwenden möchten. Weiter in den neuesten Versionen von Stata können wir sortieren und in eine einzige Aussage kombinieren. Unten ist eine vereinfachte Version des Codes, die genau die gleichen Ergebnisse wie oben ergeben wird. Der Inhalt dieser Website sollte nicht als eine Bestätigung einer bestimmten Website, Buch oder Software-Produkt von der University of California ausgelegt werden. NOTICE: Die IDRE Statistische Beratungsgruppe wird die Website migrieren die Website auf die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen im Institut für digitale Forschung und Bildung Hilfe der Stat Consulting Group durch ein Geschenk Stata FAQ Wie vereinheitliche ich Variablen in Stata Eine standardisierte Variable (manchmal auch als z-Score oder als Standard-Score bezeichnet) ist eine Variable, die neu skaliert wurde Haben einen Mittelwert von Null und eine Standardabweichung von einem. Für eine standardisierte Variable gibt jeder Fallwert auf der standardisierten Variablen den Unterschied zum Mittelwert der ursprünglichen Variablen in der Anzahl der Standardabweichungen (der ursprünglichen Variablen) an. Beispielsweise gibt ein Wert von 0,5 an, dass der Wert für diesen Fall eine halbe Standardabweichung über dem Mittelwert ist, während ein Wert von -2 anzeigt, dass ein Fall einen Wert hat, der zwei Standardabweichungen niedriger als der Mittelwert ist. Variablen sind aus verschiedenen Gründen standardisiert, um sicherzustellen, dass alle Variablen gleichmäßig zu einer Skala beitragen, wenn Gegenstände zusammengefügt werden, oder um es einfacher zu machen, Ergebnisse einer Regression oder einer anderen Analyse zu interpretieren. Die Standardisierung einer Variablen ist eine relativ einfache Vorgehensweise. Zuerst wird der Mittelwert von dem Wert für jeden Fall subtrahiert, was zu einem Mittelwert von Null führt. Dann wird der Unterschied zwischen dem Individuum und dem Mittelwert durch die Standardabweichung geteilt, was zu einer Standardabweichung von einem führt. Wenn wir mit einer Variablen x beginnen. Und erzeugen eine Variable x. Der Prozess ist: Wo m ist der Mittelwert von x. Und sd ist die Standardabweichung von x. Um den Prozess der Standardisierung zu veranschaulichen, verwenden wir den High School and Beyond dataset (hsb2). Wir erstellen standardisierte Versionen von drei Variablen, Mathematik. Wissenschaft. Und socst Diese Variablen enthalten Schülerergebnisse zu Studien der Mathematik (Mathematik), Wissenschaft (Wissenschaft), Sozialwissenschaften (socst). Zuerst werden wir den Befehl summarize (abgekürzt als Summe unten) verwenden, um die Mittelwerte und die Standardabweichung für jede Variable zu erhalten. Der Mittelwert der Mathematik ist 52.645, und seine Standardabweichung ist 9.368448. Basierend auf diesen Informationen können wir eine standardisierte Version von Mathematik namens z1math generieren. Der Code unten tut dies mit dem Generator Befehl (abgekürzt Gen), dann verwendet zusammenfassen, um zu bestätigen, dass der Mittelwert von z1math sehr nahe bei Null ist (wegen Rundungsfehler ist der Mittelwert einer standardisierten Variablen selten genau 0) und Die Standardabweichung ist eins. Im Folgenden machen wir das gleiche für Wissenschaft und Gesellschaft. Erstellen von zwei neuen Variablen, z1science und z1socst. Mit ihren jeweiligen Mitteln und Standardabweichungen aus der ersten Tabelle der Zusammenfassungsstatistik. Die unten gezeigte Tabelle der Zusammenfassungsstatistiken zeigt, dass beide Variablen in der Tat standardisiert sind. Die Standardisierung von Variablen ist nicht schwierig, aber um diesen Vorgang zu erleichtern und weniger fehleranfällig zu sein, können Sie den Befehl egen verwenden, um standardisierte Variablen zu erstellen. Die folgenden Befehle vereinheitlichen die Werte von Mathe. Wissenschaft. Und socst Erstellen von drei neuen Variablen, z2math. Z2science Und z2socst. Auch hier können wir uns eine Tabelle der Zusammenfassungsstatistiken anschauen, um zu bestätigen, dass diese Variablen standardisiert sind. Beachten Sie, dass die Mittel nicht genau Null sind, noch passen sie die Mittel aus dem Satz von standardisierten Variablen, die oben mit dem Generator-Befehl erstellt wurden. In beiden Fällen ist dies auf einen sehr leichten Rundungsfehler zurückzuführen. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.
No comments:
Post a Comment