Zum Inhalt springen

Urliste

aus Wikipedia, der freien Enzyklopädie

Die Urliste, auch Beobachtungsreihe genannt, ist im Bereich der Statistik das direkte Ergebnis einer Datenerhebung, also die ursprüngliche Aufzeichnung der Beobachtungs- oder Messwerte. Die Werte in der Urliste sind noch nicht weiter verrechnet worden, weshalb man den einzelnen Wert als Urwert<ref name="Bourier" /> und alle Urwerte zusammen als Urdaten,<ref name="Bourier" /> Primärdaten<ref name="Mittag" /> oder Rohdaten bezeichnet.<ref name="Mittag" /> Zusätzlich zu diesen Merkmalswerten können auch Hinweise darauf aufgelistet werden, welchem Merkmalsträger die Merkmalswerte zugeordnet sind.<ref name="Bourier" /> Sind die Werte in ihrer Reihenfolge zufällig oder entsprechend ihrer zeitlichen Abfolge der Beobachtung aufgelistet, handelt es sich um eine unsortierte Urliste. Richtet sich die Reihung nach irgendeiner Ordnung, dann liegt eine sortierte Urliste (auch primäre Tafel<ref name="Gehring" /><ref name="Schuhmann" />) vor. Eine mögliche Ordnung wäre die alphabetische Ordnung der Merkmalsträger<ref name="Bourier" /> oder die Ordnung nach der Größe der Merkmalsausprägung in einem der erfassten Merkmalsbereiche.

Die Kennzeichnung des Merkmalsträgers kann sowohl bei der Urliste<ref name="Meißner" /> als auch bei der primären Tafel<ref name="Schuhmann" /> entfallen. Es folgen Beispiele mit und ohne diese Kennzeichnung der Merkmalsträger.

Beispiel

Beispiel einer unsortierten Urliste:

Merkmalsträger Kinderzahl
Max Mustermann 1
Frederik Schwein 0
Bea Beispielfrau 2
Piggeldy Schwein 0
1 0 2 0

Beispiel einer primären Tafel:

Merkmalsträger Kinderzahl
Frederik Schwein 0
Piggeldy Schwein 0
Max Mustermann 1
Bea Beispielfrau 2
0 0 1 2

Die Merkmalsträger werden häufig mit einer Kennziffer bezeichnet. Diese Kennziffern der ungeordneten Urliste können in der geordneten Urliste der Reihe nach neu vergeben werden. Es wird vorgeschlagen, diese Änderung der Ziffern kenntlich zu machen, indem man sie in Klammern setzt.<ref name="Bol" />

Unsortierte Urliste:

Merkmalsträger Kinderzahl
1 1
2 0
3 2
4 0

Primäre Tafel:

Merkmalsträger Kinderzahl
(1) 0
(2) 0
(3) 1
(4) 2

Vor- und Nachteile

Die Urliste enthält alle Beobachtungswerte und damit keine Auslassungen, Übertragungsfehler oder verlorene Information (Vorteile). Andererseits können Urlisten in der Praxis tausende oder Millionen von Datensätzen enthalten, die für sich genommen unübersichtlich und nicht auswertbar sind; außerdem können bei einer unkorrigierten Urliste noch offensichtliche Fehler wie Zahlendreher oder unmögliche Daten enthalten sein (Nachteile).

Die Daten einer Urliste müssen in der Praxis also aufbereitet werden, um ihren Zweck zu erfüllen. Das geschieht meist durch das Bilden von Häufigkeitsverteilungen.<ref>Benjamin R. Auer, Horst Rottmann: Statistik und Ökonometrie für Wirtschaftswissenschaftler: Eine anwendungsorientierte Einführung. 2. überarb. u. akt. Auflage. Gabler Verlag, 2012 (6. September 2011), ISBN 3-8349-2971-9, S. 13.</ref>

Viele der statistischen Parameter, die die Eigenschaften so einer Häufigkeitsverteilung abbilden bzw. zusammenfassen sollen, nehmen dabei in Kauf, Informationen zu reduzieren. Das ist gleichzeitig Vorteil wie Nachteil. Wenn das Datenmaterial nicht zu umfangreich ist, kann man auch eine Strichliste führen.

Preussische Volkszählung

Die Bezeichnung „Urliste“ taucht früh im Zusammenhang mit Volkszählungen auf. Dabei wird sie nicht als Schritt in der mathematischen Aufarbeitung statistischer Daten angesprochen. Möchte man folgende Urliste dennoch im Sinne des statischen Begriffs der Urliste einordnen, könnte man sie als Urliste mit hauptsächlich nominal skalierten Merkmalen beschreiben. Lediglich die Zahl an Bewohnern eines Hauses ist absolutskaliert.

Spalten der Urliste für die preussische Volkszählung am 3. Dez. 1864<ref name="Volkszählung" />
Durchlaufende Nr. Nummer des Hauses Vor- und Familienname Stand oder Gewerbe Geburtsjahr Religion Zahl der Hausbewohner Datum der Aufnahme Bemerkungen

Weblinks

Einzelnachweise

<references> <ref name="Bourier"> {{#invoke:Vorlage:Literatur|f}} </ref> <ref name="Gehring"> {{#invoke:Vorlage:Literatur|f}} </ref> <ref name="Schuhmann"> {{#invoke:Vorlage:Literatur|f}} </ref> <ref name="Meißner"> {{#invoke:Vorlage:Literatur|f}} </ref> <ref name="Bol"> {{#invoke:Vorlage:Literatur|f}} </ref> <ref name="Mittag"> {{#invoke:Vorlage:Literatur|f}} </ref> <ref name="Volkszählung"> {{#if: wgQOAAAAQAAJ | {{#if: {{#if: ||1}} {{#if: wgQOAAAAQAAJ ||1}} | <0|&pg={{#if:|RA{{{Band}}}-}}PA11|&pg=11}}{{#if:|&q=}}#v=onepage|{{#if:|&pg=|}}{{#if:|&q=}}}}{{#if:|q=%7B%7B%7BSuchbegriff%7D%7D%7D}}|{{#if:|q=%7B%7B%7BSuchbegriff%7D%7D%7D}}}} {{#if:|{{#invoke:WLink|getEscapedTitle|{{{Linktext}}}}}|eingeschränkte Vorschau}}{{#if:|| in der Google-Buchsuche}}{{#ifeq:|US|-USA}}{{#if: wgQOAAAAQAAJ |{{#invoke: Vorlage:GoogleBook|fine |id=wgQOAAAAQAAJ |errN=Parameter „BuchID“ hat falsche Länge |errC=Parameter „BuchID“ enthält ungültige Zeichen |errH=# in der „BuchID“ |errP=Parameterzuweisungen in der „BuchID“ |class=editoronly |cat={{#ifeq: 0 | 0 | Wikipedia:Vorlagenfehler/Vorlage:Google Buch}} |template= Vorlage:Google Buch}} }} | Es darf nur genau einer der beiden Parameter „Suchbegriff“ oder „BuchID“ ausgefüllt werden. Bitte beachte die in der Vorlage:Google Buch befindliche Dokumentation und prüfe die verwendeten Parameter.{{#ifeq: 0 | 0 | }}}} | Es muss mindestens einer der beiden Parameter „Suchbegriff“ oder „BuchID“ ausgefüllt werden. Bitte beachte die in der Vorlage:Google Buch befindliche Dokumentation und prüfe die verwendeten Parameter.{{#ifeq: 0 | 0 | }}}}{{#invoke:TemplatePar|check |all= |opt= Suchbegriff= BuchID= Seite= Band= SeitenID= Hervorhebung= Linktext= Land= KeinText= |cat= {{#ifeq: 0 | 0 | Wikipedia:Vorlagenfehler/Vorlage:Google Buch}} |template= Vorlage:Google Buch |format= }}{{#if:|{{#if:{{#invoke:WLink|isBracketedLink|{{{Linktext}}}}}|}}}} </ref> </references>