use and describe
- Ein Datensatz wird mit use geladen
- Stata sucht im Home Directory nach dem Datensatz, wenn keine Angabe zum Pfad gemacht wurde
- Die Option clear löscht alle bis dato geladenen Datensätze
- Der Befehl describe beschreibt die Daten und zeigt Dir welche Variablen in einem Datensatz enthalten sind
use "https://www.stata-press.com/data/r16/titanic800", clear
describe
(Titanic passenger survival (Extract))
Contains data from https://www.stata-press.com/data/r16/titanic800.dta
  obs:           800                          Titanic passenger survival
                                                (Extract)
 vars:             4                          22 Feb 2019 13:24
                                              (_dta has notes)
-------------------------------------------------------------------------------
              storage   display    value
variable name   type    format     label      variable label
-------------------------------------------------------------------------------
class           byte    %9.0g      class      Class
adult           byte    %9.0g      age        Adult
male            byte    %9.0g      sex        Male
survived        byte    %9.0g      survived   Survived
-------------------------------------------------------------------------------
Sorted by: 
 
 (sys)use
- Mit use greifst du auf Daten zu, die lokal gespeichert sind
- Mit sysuse greifst du auf Daten zu, die in Stata gespeichert sind
- Dies ist praktisch für Illustrationszwecke, alle Beispiel hier greifen auf solche Daten zurück
(1978 Automobile Data)
Contains data from C:\PROGRA~1\Stata16\ado\base/a/auto.dta
  obs:            74                          1978 Automobile Data
 vars:            12                          13 Apr 2018 17:45
                                              (_dta has notes)
-------------------------------------------------------------------------------
              storage   display    value
variable name   type    format     label      variable label
-------------------------------------------------------------------------------
make            str18   %-18s                 Make and Model
price           int     %8.0gc                Price
mpg             int     %8.0g                 Mileage (mpg)
rep78           int     %8.0g                 Repair Record 1978
headroom        float   %6.1f                 Headroom (in.)
trunk           int     %8.0g                 Trunk space (cu. ft.)
weight          int     %8.0gc                Weight (lbs.)
length          int     %8.0g                 Length (in.)
turn            int     %8.0g                 Turn Circle (ft.)
displacement    int     %8.0g                 Displacement (cu. in.)
gear_ratio      float   %6.2f                 Gear Ratio
foreign         byte    %8.0g      origin     Car type
-------------------------------------------------------------------------------
Sorted by: foreign
 
 list
- Mit dem Befehl list kann der Datensatz im Ausgabefenster angezeigt werden. Im nächsten Output Fenster werden die ersten fünf Fälle in Tabellenform angezeigt
- Ohne Angabe der Variablen wird der ganze Datensatz ausgegeben
- List ist praktisch um zu überprüfen, ob die Datenaufbereitung geklappt hat
list make - headroom in 1/5, table
 . list make - headroom in 1/5, table
     +------------------------------------------------+
     | make            price   mpg   rep78   headroom |
     |------------------------------------------------|
  1. | AMC Concord     4,099    22       3        2.5 |
  2. | AMC Pacer       4,749    17       3        3.0 |
  3. | AMC Spirit      3,799    22       .        3.0 |
  4. | Buick Century   4,816    20       3        4.5 |
  5. | Buick Electra   7,827    15       4        4.0 |
     +------------------------------------------------+
 
 order
- Mit dem Befehl order lässt sich der Datensatz sortieren
- Einzelne oder mehrere Variablen können jeweils vor oder nach einer anderen Variablen sortiert werden
*Sortiere die Variable price Vor die Variable make
order price, before(make)
list price - headroom in 1/4, table
 . *Sortiere die Variable price Vor die Variable make
. order price, before(make)
. list price - headroom in 1/4, table
     +------------------------------------------------+
     | price   make            mpg   rep78   headroom |
     |------------------------------------------------|
  1. | 4,099   AMC Concord      22       3        2.5 |
  2. | 4,749   AMC Pacer        17       3        3.0 |
  3. | 3,799   AMC Spirit       22       .        3.0 |
  4. | 4,816   Buick Century    20       3        4.5 |
     +------------------------------------------------+
*Oder danach
order price, after(make)
list make - headroom in 1/4, table
 . *Oder danach
. order price, after(make)
. list make - headroom in 1/4, table
     +------------------------------------------------+
     | make            price   mpg   rep78   headroom |
     |------------------------------------------------|
  1. | AMC Concord     4,099    22       3        2.5 |
  2. | AMC Pacer       4,749    17       3        3.0 |
  3. | AMC Spirit      3,799    22       .        3.0 |
  4. | Buick Century   4,816    20       3        4.5 |
     +------------------------------------------------+
 
 tab
- Der Befehl tab gibt eine einfache Tabelle aus
- Folgen zwei Variablennamen im Befehl, erhält man eine Kreuztabelle
- Mit tab können auch Dummy Variablen einfach erstellt werden
 . tab foreign
   Car type |      Freq.     Percent        Cum.
------------+-----------------------------------
   Domestic |         52       70.27       70.27
    Foreign |         22       29.73      100.00
------------+-----------------------------------
      Total |         74      100.00
- tab var, gen(new_var_) erstellt n Dummy Variable new_var_(1 bis n) gemäß der Ausprägungen der Variable var
tab rep78, gen(rep78_dummy_)
list rep78_dummy_1 - rep78_dummy_5 in 1/5
 . tab rep78, gen(rep78_dummy_)
     Repair |
Record 1978 |      Freq.     Percent        Cum.
------------+-----------------------------------
          1 |          2        2.90        2.90
          2 |          8       11.59       14.49
          3 |         30       43.48       57.97
          4 |         18       26.09       84.06
          5 |         11       15.94      100.00
------------+-----------------------------------
      Total |         69      100.00
. list rep78_dummy_1 - rep78_dummy_5 in 1/5
     +------------------------------------------------------+
     | rep78_~1   rep78_~2   rep78_~3   rep78_~4   rep78_~5 |
     |------------------------------------------------------|
  1. |        0          0          1          0          0 |
  2. |        0          0          1          0          0 |
  3. |        .          .          .          .          . |
  4. |        0          0          1          0          0 |
  5. |        0          0          0          1          0 |
     +------------------------------------------------------+