Introductory Statistics with R – Peter Dalgaard – 2nd Edition

Item: Introductory Statistics with R – Peter Dalgaard – 2nd Edition
Rating: 7.8
Author: Peter Dalgaard

Descargar PDF

833Descargas

Introductory Statistics with R

Por: Peter Dalgaard

ISBN-13: 9780387790534
ISBN-13: 9780387790541
Edición: 2da Edición
Subtema:
Estadística Descriptiva
|
Estadística Inferencial
Archivo: eBook
Idioma: eBook en Inglés

Descargar PDF

0 0 votos

Valorar

833 Descargas

0 Comentarios

Descripción

R es un programa informático estadístico disponible a través de Internet bajo la Licencia Pública General (GPL). Es decir, se entrega con una licencia que te permite usarlo libremente, distribuirlo o incluso venderlo, siempre que el receptor tenga los mismos derechos y el código fuente esté disponible libremente. Existe para Microsoft Windows XP o posterior, para una variedad de plataformas Unix y Linux, y para Apple Macintosh OS X. R proporciona un entorno en el que puede realizar análisis estadísticos y producir gráficos.

En realidad, es un lenguaje de programación completo, aunque solo se describe marginalmente en este libro. Aquí nos contentamos con aprender los conceptos básicos y ver una serie de ejemplos de libros de cocina. R está diseñado de tal manera que siempre es posible realizar más cálculos sobre los resultados de un procedimiento estadístico. Además, el diseño para la presentación gráfica de datos permite métodos prácticos, por ejemplo, plot(x,y), y la posibilidad de un control detallado de la apariencia de la salida.

El hecho de que R se base en un lenguaje informático formal le otorga una gran flexibilidad. Otros sistemas presentan interfaces más simples en términos de menús y formularios, pero a menudo la aparente facilidad de uso se convierte en un obstáculo a largo plazo. Aunque las estadísticas elementales a menudo se presentan como una colección de procedimientos fijos, el análisis de datos moderadamente complejos requiere la construcción de modelos estadísticos ad hoc, lo que hace que la flexibilidad adicional de R sea muy deseable.

Row debe su nombre al humor típico de Internet. Puede que estés familiarizado con el lenguaje de programación C (cuyo nombre es una historia en sí mismo). Inspirándose en esto, Becker y Chambers optaron a principios de la década de 1980 por denominar S a su nuevo lenguaje de programación estadística. clases Ross Ihaka y Robert Gentleman de la Universidad de Auckland, Nueva Zelanda, optaron por escribir una versión reducida de S con fines didácticos, ¿y qué más natural que elegir la letra inmediatamente anterior? Las iniciales de Ross y Robert también pueden haber influido. En 1995, Martin Maechler persuadió a Ross y Robert para que publicaran el código fuente de R bajo la licencia GPL. Esto coincidió con el auge del software de código abierto impulsado por el sistema Linux. R pronto resultó llenar un vacío para personas como yo que tenían la intención de usar Linux para computación estadística pero no tenían un paquete estadístico disponible en ese momento. Se creó una lista de correo para la comunicación de informes de errores y discusiones sobre el desarrollo de R. En agosto de 1997, fui invitado a unirme a un equipo central internacional ampliado cuyos miembros colaboran a través de Internet y que ha controlado el desarrollo de R desde entonces. . Posteriormente, el equipo central se amplió varias veces y actualmente incluye 19 miembros.

El 29 de febrero de 2000 se lanzó la versión 1.0.0. En el momento de escribir este artículo, la versión actual es la 2.6.2. Este libro se basó originalmente en un conjunto de notas desarrolladas para el curso de Estadística Básica para Investigadores en Salud en la Facultad de Ciencias de la Salud de la Universidad de Copenhague. El curso tuvo como objetivo principal a los estudiantes de Ph.D. licenciatura en medicina. Sin embargo, el material ha sido sustancialmente revisado y espero que sea útil para un público más amplio, aunque persiste cierto sesgo bioestadístico, particularmente en la elección de ejemplos. En años posteriores, el curso de Práctica Estadística en Epidemiología, que se ha llevado a cabo anualmente en Tartu, Estonia, ha sido una fuente importante de inspiración y experiencia para introducir a los jóvenes estadísticos y epidemiólogos a R. Este libro no es un manual para R. El La idea es introducir una serie de conceptos y técnicas básicos que deberían permitir al lector iniciarse en la estadística práctica. En cuanto a los métodos prácticos, el libro cubre un plan de estudios razonable para estudiantes de primer año de estadística teórica, así como para estudiantes de ingeniería. Estos grupos eventualmente necesitarán ir más allá y estudiar modelos más complejos, así como técnicas generales que involucran programación real en el lenguaje R.

Para campos en los que la estadística elemental se enseña principalmente como una herramienta, el libro va un poco más allá de lo que comúnmente se enseña a nivel de pregrado. Los métodos de regresión múltiple o el análisis de experimentos multifactoriales rara vez se enseñan a ese nivel, pero pueden convertirse rápidamente en esenciales para la investigación práctica.

Preface
1 Basics
1.1 First steps
1.1.1 An overgrown calculator
1.1.2 Assignments
1.1.3 Vectorized arithmetic
1.1.4 Standard procedures
1.1.5 Graphics
1.2 R language essentials
1.2.1 Expressions and objects
1.2.2 Functions and arguments
1.2.3 Vectors
1.2.4 Quoting and escape sequences
1.2.5 Missing values
1.2.6 Functions that create vectors
1.2.7 Matrices and arrays
1.2.8 Factors
1.2.9 Lists
1.2.10 Data frames
1.2.11 Indexing
1.2.12 Conditional selection
1.2.13 Indexing of data frames
1.2.14 Grouped data and data frames
1.2.15 Implicit loops
1.2.16 Sorting
1.3 Exercises
2 The R environment
2.1 Session management
2.1.1 The workspace
2.1.2 Textual output
2.1.3 Scripting
2.1.4 Getting help
2.1.5 Packages
2.1.6 Built-in data
2.1.7 attach and detach
2.1.8 subset, transform, and within
2.2 The graphics subsystem
2.2.1 Plot layout
2.2.2 Building a plot from pieces
2.2.3 Using par
2.2.4 Combining plots
2.3 R programming
2.3.1 Flow control
2.3.2 Classes and generic functions
2.4 Data entry
2.4.1 Reading from a text file
2.4.2 Further details on read.table
2.4.3 The data editor
2.4.4 Interfacing to other programs
2.5 Exercises
3 Probability and distributions
3.1 Random sampling
3.2 Probability calculations and combinatorics
3.3 Discrete distributions
3.4 Continuous distributions
3.5 The built-in distributions in R
3.5.1 Densities
3.5.2 Cumulative distribution functions
3.5.3 Quantiles
3.5.4 Random numbers
3.6 Exercises
4 Descriptive statistics and graphics
4.1 Summary statistics for a single group
4.2 Graphical display of distributions
4.2.1 Histograms
4.2.2 Empirical cumulative distribution
4.2.3 QQ plots
4.2.4 Boxplots
4.3 Summary statistics by groups
4.4 Graphics for grouped data
4.4.1 Histograms
4.4.2 Parallel boxplots
4.4.3 Stripcharts
4.5 Tables
4.5.1 Generating tables
4.5.2 Marginal tables and relative frequency
4.6 Graphical display of tables
4.6.1 Barplots
4.6.2 Dotcharts
4.6.3 Piecharts
4.7 Exercises
5 One- and two-sample tests
5.1 One-sample t test
5.2 Wilcoxon signed-rank test
5.3 Two-sample t test
5.4 Comparison of variances
5.5 Two-sample Wilcoxon test
5.6 The paired t test
5.7 The matched-pairs Wilcoxon test
5.8 Exercises
6 Regression and correlation
6.1 Simple linear regression
6.2 Residuals and fitted values
6.3 Prediction and confidence bands
6.4 Correlation
6.4.1 Pearson correlation
6.4.2 Spearmans ?
6.4.3 Kendalls ?
6.5 Exercises
7 Analysis of variance and the KruskalWallis test
7.1 One-way analysis of variance
7.1.1 Pairwise comparisons and multiple testing
7.1.2 Relaxing the variance assumption
7.1.3 Graphical presentation
7.1.4 Bartletts test
7.2 KruskalWallis test
7.3 Two-way analysis of variance
7.3.1 Graphics for repeated measurements
7.4 The Friedman test
7.5 The ANOVA table in regression analysis
7.6 Exercises
8 Tabular data
8.1 Single proportions
8.2 Two independent proportions
8.3 k proportions, test for trend
8.4 r × c tables
8.5 Exercises
9 Power and the computation of sample size
9.1 The principles of power calculations
9.1.1 Power of one-sample and paired t tests
9.1.2 Power of two-sample t test
9.1.3 Approximate methods
9.1.4 Power of comparisons of proportions
9.2 Two-sample problems
9.3 One-sample problems and paired tests
9.4 Comparison of proportions
9.5 Exercises
10 Advanced data handling
10.1 Recoding variables
10.1.1 The cut function
10.1.2 Manipulating factor levels
10.1.3 Working with dates
10.1.4 Recoding multiple variables
10.2 Conditional calculations
10.3 Combining and restructuring data frames
10.3.1 Appending frames
10.3.2 Merging data frames
10.3.3 Reshaping data frames
10.4 Per-group and per-case procedures
10.5 Time splitting
10.6 Exercises
11 Multiple regression
11.1 Plotting multivariate data
11.2 Model specification and output
11.3 Model search
11.4 Exercises
12 Linear models
12.1 Polynomial regression
12.2 Regression through the origin
12.3 Design matrices and dummy variables
12.4 Linearity over groups
12.5 Interactions
12.6 Two-way ANOVA with replication
12.7 Analysis of covariance
12.7.1 Graphical description
12.7.2 Comparison of regression lines
12.8 Diagnostics
12.9 Exercises
13 Logistic regression
13.1 Generalized linear models
13.2 Logistic regression on tabular data
13.2.1 The analysis of deviance table
13.2.2 Connection to test for trend
13.3 Likelihood profiling
13.4 Presentation as odds-ratio estimates
13.5 Logistic regression using raw data
13.6 Prediction
13.7 Model checking
13.8 Exercises
14 Survival analysis
14.1 Essential concepts
14.2 Survival objects
14.3 KaplanMeier estimates
14.4 The log-rank test
14.5 The Cox proportional hazards model
14.6 Exercises
15 Rates and Poisson regression
15.1 Basic ideas
15.1.1 The Poisson distribution
15.1.2 Survival analysis with constant hazard
15.2 Fitting Poisson models
15.3 Computing rates
15.4 Models with piecewise constant intensities
15.5 Exercises
16 Nonlinear curve fitting
16.1 Basic usage
16.2 Finding starting values
16.3 Self-starting models
16.4 Profiling
16.5 Finer control of the fitting algorithm
16.6 Exercises
A Obtaining and installing R and the ISwR package
B Data sets in the ISwR package
C Compendium
D Answers to exercises
Bibliography
Index
Citar Libro
- Título: Introductory Statistics with R
- Autor/es:
  Peter Dalgaard
- ISBN-13: 9780387790534
- ISBN-13: 9780387790541
- Edición: 2da Edición
- Año de edición: 2008
- Tema: Estadística y Probabilidad
- Subtema: Estadística Descriptiva | Estadística Inferencial
- Tipo de Archivo: eBook
- Idioma: eBook en Inglés