use and describe
- Ein Datensatz wird mit use geladen
- Stata sucht im Home Directory nach dem Datensatz, wenn keine Angabe zum Pfad gemacht wurde
- Die Option clear löscht alle bis dato geladenen Datensätze
- Der Befehl describe beschreibt die Daten und zeigt Dir welche Variablen in einem Datensatz enthalten sind
use "https://www.stata-press.com/data/r16/titanic800", clear
describe
(Titanic passenger survival (Extract))
Contains data from https://www.stata-press.com/data/r16/titanic800.dta
obs: 800 Titanic passenger survival
(Extract)
vars: 4 22 Feb 2019 13:24
(_dta has notes)
-------------------------------------------------------------------------------
storage display value
variable name type format label variable label
-------------------------------------------------------------------------------
class byte %9.0g class Class
adult byte %9.0g age Adult
male byte %9.0g sex Male
survived byte %9.0g survived Survived
-------------------------------------------------------------------------------
Sorted by:
(sys)use
- Mit use greifst du auf Daten zu, die lokal gespeichert sind
- Mit sysuse greifst du auf Daten zu, die in Stata gespeichert sind
- Dies ist praktisch für Illustrationszwecke, alle Beispiel hier greifen auf solche Daten zurück
(1978 Automobile Data)
Contains data from C:\PROGRA~1\Stata16\ado\base/a/auto.dta
obs: 74 1978 Automobile Data
vars: 12 13 Apr 2018 17:45
(_dta has notes)
-------------------------------------------------------------------------------
storage display value
variable name type format label variable label
-------------------------------------------------------------------------------
make str18 %-18s Make and Model
price int %8.0gc Price
mpg int %8.0g Mileage (mpg)
rep78 int %8.0g Repair Record 1978
headroom float %6.1f Headroom (in.)
trunk int %8.0g Trunk space (cu. ft.)
weight int %8.0gc Weight (lbs.)
length int %8.0g Length (in.)
turn int %8.0g Turn Circle (ft.)
displacement int %8.0g Displacement (cu. in.)
gear_ratio float %6.2f Gear Ratio
foreign byte %8.0g origin Car type
-------------------------------------------------------------------------------
Sorted by: foreign
list
- Mit dem Befehl list kann der Datensatz im Ausgabefenster angezeigt werden. Im nächsten Output Fenster werden die ersten fünf Fälle in Tabellenform angezeigt
- Ohne Angabe der Variablen wird der ganze Datensatz ausgegeben
- List ist praktisch um zu überprüfen, ob die Datenaufbereitung geklappt hat
list make - headroom in 1/5, table
. list make - headroom in 1/5, table
+------------------------------------------------+
| make price mpg rep78 headroom |
|------------------------------------------------|
1. | AMC Concord 4,099 22 3 2.5 |
2. | AMC Pacer 4,749 17 3 3.0 |
3. | AMC Spirit 3,799 22 . 3.0 |
4. | Buick Century 4,816 20 3 4.5 |
5. | Buick Electra 7,827 15 4 4.0 |
+------------------------------------------------+
order
- Mit dem Befehl order lässt sich der Datensatz sortieren
- Einzelne oder mehrere Variablen können jeweils vor oder nach einer anderen Variablen sortiert werden
*Sortiere die Variable price Vor die Variable make
order price, before(make)
list price - headroom in 1/4, table
. *Sortiere die Variable price Vor die Variable make
. order price, before(make)
. list price - headroom in 1/4, table
+------------------------------------------------+
| price make mpg rep78 headroom |
|------------------------------------------------|
1. | 4,099 AMC Concord 22 3 2.5 |
2. | 4,749 AMC Pacer 17 3 3.0 |
3. | 3,799 AMC Spirit 22 . 3.0 |
4. | 4,816 Buick Century 20 3 4.5 |
+------------------------------------------------+
*Oder danach
order price, after(make)
list make - headroom in 1/4, table
. *Oder danach
. order price, after(make)
. list make - headroom in 1/4, table
+------------------------------------------------+
| make price mpg rep78 headroom |
|------------------------------------------------|
1. | AMC Concord 4,099 22 3 2.5 |
2. | AMC Pacer 4,749 17 3 3.0 |
3. | AMC Spirit 3,799 22 . 3.0 |
4. | Buick Century 4,816 20 3 4.5 |
+------------------------------------------------+
tab
- Der Befehl tab gibt eine einfache Tabelle aus
- Folgen zwei Variablennamen im Befehl, erhält man eine Kreuztabelle
- Mit tab können auch Dummy Variablen einfach erstellt werden
. tab foreign
Car type | Freq. Percent Cum.
------------+-----------------------------------
Domestic | 52 70.27 70.27
Foreign | 22 29.73 100.00
------------+-----------------------------------
Total | 74 100.00
- tab var, gen(new_var_) erstellt n Dummy Variable new_var_(1 bis n) gemäß der Ausprägungen der Variable var
tab rep78, gen(rep78_dummy_)
list rep78_dummy_1 - rep78_dummy_5 in 1/5
. tab rep78, gen(rep78_dummy_)
Repair |
Record 1978 | Freq. Percent Cum.
------------+-----------------------------------
1 | 2 2.90 2.90
2 | 8 11.59 14.49
3 | 30 43.48 57.97
4 | 18 26.09 84.06
5 | 11 15.94 100.00
------------+-----------------------------------
Total | 69 100.00
. list rep78_dummy_1 - rep78_dummy_5 in 1/5
+------------------------------------------------------+
| rep78_~1 rep78_~2 rep78_~3 rep78_~4 rep78_~5 |
|------------------------------------------------------|
1. | 0 0 1 0 0 |
2. | 0 0 1 0 0 |
3. | . . . . . |
4. | 0 0 1 0 0 |
5. | 0 0 0 1 0 |
+------------------------------------------------------+