Chapter 2 The Basics

2.1 use and describe

  • Ein Datensatz wird mit use geladen
  • Stata sucht im Home Directory nach dem Datensatz, wenn keine Angabe zum Pfad gemacht wurde
  • Die Option clear löscht alle bis dato geladenen Datensätze
  • Der Befehl describe beschreibt die Daten und zeigt Dir welche Variablen in einem Datensatz enthalten sind
use "https://www.stata-press.com/data/r16/titanic800", clear
describe
(Titanic passenger survival (Extract))


Contains data from https://www.stata-press.com/data/r16/titanic800.dta
  obs:           800                          Titanic passenger survival
                                                (Extract)
 vars:             4                          22 Feb 2019 13:24
                                              (_dta has notes)
-------------------------------------------------------------------------------
              storage   display    value
variable name   type    format     label      variable label
-------------------------------------------------------------------------------
class           byte    %9.0g      class      Class
adult           byte    %9.0g      age        Adult
male            byte    %9.0g      sex        Male
survived        byte    %9.0g      survived   Survived
-------------------------------------------------------------------------------
Sorted by: 

2.2 (sys)use

  • Mit use greifst du auf Daten zu, die lokal gespeichert sind
  • Mit sysuse greifst du auf Daten zu, die in Stata gespeichert sind
  • Dies ist praktisch für Illustrationszwecke, alle Beispiel hier greifen auf solche Daten zurück
sysuse auto, clear
des
(1978 Automobile Data)


Contains data from C:\PROGRA~1\Stata16\ado\base/a/auto.dta
  obs:            74                          1978 Automobile Data
 vars:            12                          13 Apr 2018 17:45
                                              (_dta has notes)
-------------------------------------------------------------------------------
              storage   display    value
variable name   type    format     label      variable label
-------------------------------------------------------------------------------
make            str18   %-18s                 Make and Model
price           int     %8.0gc                Price
mpg             int     %8.0g                 Mileage (mpg)
rep78           int     %8.0g                 Repair Record 1978
headroom        float   %6.1f                 Headroom (in.)
trunk           int     %8.0g                 Trunk space (cu. ft.)
weight          int     %8.0gc                Weight (lbs.)
length          int     %8.0g                 Length (in.)
turn            int     %8.0g                 Turn Circle (ft.)
displacement    int     %8.0g                 Displacement (cu. in.)
gear_ratio      float   %6.2f                 Gear Ratio
foreign         byte    %8.0g      origin     Car type
-------------------------------------------------------------------------------
Sorted by: foreign

2.3 list

  • Mit dem Befehl list kann der Datensatz im Ausgabefenster angezeigt werden. Im nächsten Output Fenster werden die ersten fünf Fälle in Tabellenform angezeigt
  • Ohne Angabe der Variablen wird der ganze Datensatz ausgegeben
  • List ist praktisch um zu überprüfen, ob die Datenaufbereitung geklappt hat
list make - headroom in 1/5, table
 . list make - headroom in 1/5, table

     +------------------------------------------------+
     | make            price   mpg   rep78   headroom |
     |------------------------------------------------|
  1. | AMC Concord     4,099    22       3        2.5 |
  2. | AMC Pacer       4,749    17       3        3.0 |
  3. | AMC Spirit      3,799    22       .        3.0 |
  4. | Buick Century   4,816    20       3        4.5 |
  5. | Buick Electra   7,827    15       4        4.0 |
     +------------------------------------------------+

2.4 order

  • Mit dem Befehl order lässt sich der Datensatz sortieren
  • Einzelne oder mehrere Variablen können jeweils vor oder nach einer anderen Variablen sortiert werden
*Sortiere die Variable price Vor die Variable make
order price, before(make)
list price - headroom in 1/4, table
 . *Sortiere die Variable price Vor die Variable make
. order price, before(make)

. list price - headroom in 1/4, table

     +------------------------------------------------+
     | price   make            mpg   rep78   headroom |
     |------------------------------------------------|
  1. | 4,099   AMC Concord      22       3        2.5 |
  2. | 4,749   AMC Pacer        17       3        3.0 |
  3. | 3,799   AMC Spirit       22       .        3.0 |
  4. | 4,816   Buick Century    20       3        4.5 |
     +------------------------------------------------+
*Oder danach
order price, after(make)
list make - headroom in 1/4, table
 . *Oder danach
. order price, after(make)

. list make - headroom in 1/4, table

     +------------------------------------------------+
     | make            price   mpg   rep78   headroom |
     |------------------------------------------------|
  1. | AMC Concord     4,099    22       3        2.5 |
  2. | AMC Pacer       4,749    17       3        3.0 |
  3. | AMC Spirit      3,799    22       .        3.0 |
  4. | Buick Century   4,816    20       3        4.5 |
     +------------------------------------------------+

2.5 tab

  • Der Befehl tab gibt eine einfache Tabelle aus
  • Folgen zwei Variablennamen im Befehl, erhält man eine Kreuztabelle
  • Mit tab können auch Dummy Variablen einfach erstellt werden
tab foreign
 . tab foreign

   Car type |      Freq.     Percent        Cum.
------------+-----------------------------------
   Domestic |         52       70.27       70.27
    Foreign |         22       29.73      100.00
------------+-----------------------------------
      Total |         74      100.00
  • tab var, gen(new_var_) erstellt n Dummy Variable new_var_(1 bis n) gemäß der Ausprägungen der Variable var
tab rep78, gen(rep78_dummy_)
list rep78_dummy_1 - rep78_dummy_5 in 1/5
 . tab rep78, gen(rep78_dummy_)

     Repair |
Record 1978 |      Freq.     Percent        Cum.
------------+-----------------------------------
          1 |          2        2.90        2.90
          2 |          8       11.59       14.49
          3 |         30       43.48       57.97
          4 |         18       26.09       84.06
          5 |         11       15.94      100.00
------------+-----------------------------------
      Total |         69      100.00

. list rep78_dummy_1 - rep78_dummy_5 in 1/5

     +------------------------------------------------------+
     | rep78_~1   rep78_~2   rep78_~3   rep78_~4   rep78_~5 |
     |------------------------------------------------------|
  1. |        0          0          1          0          0 |
  2. |        0          0          1          0          0 |
  3. |        .          .          .          .          . |
  4. |        0          0          1          0          0 |
  5. |        0          0          0          1          0 |
     +------------------------------------------------------+

2.6 Ados installieren

  • In Stata können Erweiterungen (Ados) installiert werden
  • ssc install installiert das entsprechenden Package
  • findit sucht nach dem entsprechenden Package, beispielweise wenn man nur einen Befehl kennt
ssc install ado_name, replace
findit command

2.7 Pfad angeben/finden

  • cd gibt den Pfad (Speicherort) an, an dem nach Daten gesucht werden oder Abbildungen exportiert werden
cd "C:\path"
use data.dta

2.8 display, keep, save, edit

  • Stata als Taschenrechner nutzen
display 1 + 3
  • Daten eingrenzen und löschen
keep varlist (if) /// löscht die nicht (!) angegebenen Variable(n), wenn die if Bedingung erfüllt ist
drop varlist (if) /// löscht Variable(n) (wenn if Bedingung erfüllt ist)
  • Save speichert einen neuen Datensatz, replace ersetzt bereits vorhandenen Datensatz (sei vorsichtig dabei!)
save "Pfad\meine_bearbeiteter_datensatz.dta", replace
  • Aufrufen des Data Editors durch edit
edit