Puesto que todas las ciencias y sus aplicaciones, desde la física y la química a la ecología y la geología, pasando por las diferentes ingenierías, hacen un uso más o menos intensivo de la matemática y la estadística, se adjunta para ayuda de los estudiantes un recopilatorio de enlaces que resultan muy útiles tener a mano para hacer un repaso rápido de sus fundamentos.
Nota: Aunque se ha puesto empeño en seleccionar los enlaces más útiles, no es improbable que se haya escapado de la revisión (o aparezcan posteriormente) otros recursos de interés y que algunos de los aquí listados dejen de estar disponibles sin previo aviso.
Matemática
http://www.iesayala.com/selectividadmatematicas/ficheros/teoria.html
http://personales.unican.es/gonzaleof/
http://www.hiru.com/matematicas/funciones-y-sistemas-de-referencia
http://www.alcaste.com/departamentos/matematicas/bachillerato/bachillerato.htm
http://colegiocristorey.com/nenuca/Matematicas/M_ciencias/neninaM_ciencias.html
http://www.ma.uva.es/~antonio/Industriales/Mat1-M1-GsII_12-13.html#Material
http://www.ma.uva.es/~antonio/Industriales/Mat1-Elc_09-10.html#Apuntes
http://ocw.um.es/cc.-sociales/matematicas-cero/material-de-clase?set_language=es
http://www.clasesdeapoyo.com/apuntes/2%C2%BA%20%20Bachillerato/Matem%C3%A1ticas (contiene publicidad)
http://www.vitutor.com/ (contiene publicidad)
http://www.vadenumeros.es/segundo/indice-segundo-de-ciencias.htm (contiene publicidad)
http://www.matap.uma.es/~svera/temas/calculo.pdf
http://mimosa.pntic.mec.es/jgomez53/matema/docums/perez-calculo1.pdf
http://www.academiatamargo.com/html/formularios.html
* Software:
http://www.unioviedo.es/bayon/calculo/maxima-Granada.pdf
http://euler.us.es/~renato/clases/maxima/manualesPDF/maxima-manual-UGR.pdf
http://softwarelibre.uca.es/cursos/maxima/cadiz.pdf
http://www.scilab.org/contrib/download.php%3FfileID%3D210%26attachFileName%3DIntro_Spanish.pdf
http://personal.us.es/echevarria/documentos/ApuntesScilab.pdf
http://ciencias.udea.edu.co/programas/pregrado/CNM-425/andes/docs/octave.pdf
http://materias.fi.uba.ar/6625/TPs/Tutoriales/Tutorial%20Rapido%20de%20Octave.pdf
http://www.sagemath.org/es/Manual_SAGE_principiantes.pdf
http://doreanabundante.blogspot.com.es/2012/04/normal-0-false-false-false-en-us-x-none_2100.html
Estadística
http://estadisticaorquestainstrumento.wordpress.com
http://www.hrc.es/bioest/M_docente.html
http://hojamat.es/estadistica/iniestad.htm
http://ocw.um.es/ingenierias/estadistica/material-de-clase-1
http://cursos.ciencias.uchile.cl/ecologia/estadisticaaplicada/LIBROESTADISTICA.doc (PDF, ODT)
http://www.escet.urjc.es/biodiversos/espa/personal/marcos/cpp/Estadis.pdf
http://www3.uah.es/pedrovillar/Docencia/Ecologia%20Grado%20Biologia/Archivos/Articulos%20para%20practicas%20de%20campo/Salida%20de%20campo/CUADERNILLO_PRACTICAS_ECOLOGIA.pdf
http://www.uco.es/servicios/informatica/windows/filemgr/download/ecolog/Metodos%20analisis%20datos.pdf
http://www.upcomillas.es/personal/peter/principal.htm
http://ocw.um.es/ciencias/estadistica-en-el-grado-de-ciencia-y-tecnologia-de/material-de-clase-1
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/EDescrip/EstDescript.html
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/AMult/AMult.html
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/DM.html
http://cms.dm.uba.ar/academico/materias/1ercuat2011/estadisticaQ/apuntes
http://www.uca.es/dpto/C146/pag_personal/f_alvarez/
http://tarwi.lamolina.edu.pe/~arrubio/Parte%202.pdf
http://www.demre.cl/text/doc_tecnicos/p2009/estadistica_descriptiva.pdf
http://www.cienciasinseso.com/no-todo-es-normal/
http://www.statsref.com/HTML/index.html (en inglés)
Causalidad: Andrés Alonso Fernández (2011)
Fallos frecuentes: http://www.ma.utexas.edu/users/mks/statmistakes/TOC.html (en inglés)
Estadística bayesiana: Existe un conforntado debate entre paradigmas frecuentista vs. bayesiano: Brian Dennis (1996 - alternativa), Bradley Efron (1998), Diego Alonso & Elisabeth Tubau (2002), Aaron Ellison (2004), Brian Dennis (2004), James Clark (2005), James Clark & Alan Gelfand (2006), Fabien Campillo et al. (2007), Andrew Gelman (2008), John Kruschke (2010), Andrew Gelman (2011), Andrew Gelman & Cosma Rohilla Shalizi (2011), M Brandon Westover et al. (2011), Jeremy Fox (2011, 2012), Xavier Guiteras Vila (2012).
Creación y selección de modelos (acerca de la diferencia de modelos lineares generalizados, modelos mixtos generalizados, modelos aditivos generalizados,... ver fig. 9.2 en pág. 397/405 de Ben Bolker (2007)): Antoine Guisan & Niklaus Zimmermann (2000), Carlos Murillo Fort & Beatriz González López-Valcárcel (2000), Kenneth Burnham & David Anderson (2000, 2001, 2002a, 2002b), Antoine Guisan et al. (2002), Jerald Johnson & Kristian Omland (2004), Joseph Kadane & Nicole Lazar (2004), Kenneth Burnham & David Anderson (2004), Shane Richards (2005), David Anderson and Kenneth Burnham (2006), Simon Wood (2006), Thompson Hobbs & Ray Hilborn (2006), William Link & Richard Barker (2006), Alain Zuur et al. (2007), Andrew Gelman & Jennifer Hill (2007), Ben Bolker (2007), Eric-Jan Wagenmakers (2007 y corrección), Kenneth Burnham & David Anderson (2007), Sandra Posada & Ricardo Rosero Noguera (2007), Benjamin Bolker et al. (2008), Chenlei Leng et al. (2008), Erin Carruthers et al. (2008), www.modelselection.org (2008), Alain Zuur et al. (2009), Robert O'Hara (2009), Trevor Hastie et al. (2009), Alain Zuur et al. (2010), Jerome Friedman et al. (2010), Minjung Kyung et al. (2010), Shane Richards et al. (2010), C. E. Grueber et al. (2011), Gerda Claeskens (2011), Jogesh Babu (2011), Robert Tibshirani (2011), Ben Bolker (2012), Dave Roberts (2012), John Dziak et al. (2012), Julián Acuña Cullazos et al. (2012), Hyunsook Lee et al. (2012), Michael Clark (2012), Rahul Mazumder & Trevor Hastie (2012), Sebastián Castro (2012), Jim Robison-Cox (2013), John Weatherwax & David Epstein (2013), Kevin McGarigal (2013), http://scikit-learn.org/stable/modules/linear_model.html .
* Revisión crítica: Mientras que la matemática podría definirse (de forma informal) como ciencia determinista, la estadística en contraposición es una ciencia probabilística, pues no trabaja con resultados ciertos sino con probabilidades, incertidumbres, impredecibilidades,... Debido a ello, no existe una forma única e indiscutible de tratar cada caso, sino que siempre existen múltiples opciones de estudiar cada suceso. Algunas consideraciones importantes acerca de los defectos y problemas de diferentes técnicas estadísticas todavía de amplio uso (basadas en asumir que los datos se ajustan a determinadas funciones de distribución de probabilidad y sobre ello emplear el método de contraste de hipótesis nula) y propuestas de alternativas:
- Críticas generales: Principalmente Philip Stephens et al. (2006) y Esa Läärä (2009). Otras lecturas adicionales que pueden resultar de interés son: Jacob Cohen (1994), Jeff Gill (1999), H. J. Keselman et al. (2001), Gerry Quinn & Mick Keough (2002 - capítulos 3 y 6), María José Blanca Mena (2004), Alejandro Martínez Abraín & Daniel Oro (2005), Fiona Fidler (2005), Bastow Wilson (2007), Alejandro Martínez Abraín, David Conesa & Daniel Oro (2008), Stuart H. Hurlbert & Celia M. Lombardi (2009), Robert O’Hara & Johan Kotze (2010), Kazuya Naoki (2012), http://www.stats.org.uk/statistical-inference
- Críticas acerca de las funciones de distribución de probabilidad más usadas y sus pruebas estadísticas asociadas: Theodore Micceni (1989), A. Sánchez Bruno et al. (2000), Guillermo Vallejo & Ramón Escudero (2000), Isabel Cañadas Osinski et al. (2000), Jason Osborne & Elaine Waters (2002), Pablo Livacic Rojas et al. (2006), Wolfgang Wiedermann & Rainer Alexandrowicz (2007), Guillermo Vallejo et al. (2010), Josefa María Montilla (2010), Paula Fernández et al. (2010), Yoonjeong Kang & Jeffery R. Harring (2012), PetrKeil (2013).
- Estadística robusta: Alternativas a las técnicas estadísticas más popularizadas (basadas en la "distribución normal") para obtener herramientas de análisis menos delicadas en requerimientos y más robustas ante violaciones de asunciones (distribución normal, homocedasticidad, etc. - también afectan a las técnicas basadas en rangos o "no paramétricas"), falta de robustez que padecen gravemente los métodos estadísticos más divulgados como la media aritmética (la mediana es una medida de tendencia central más robusta y mejor) y la desviación típica o estándar (la desviación absoluta mediana es un estimador de desviación más robusto pero es aún mejor el rango o intervalo intercuartílico relativo[1]): Lisa Lix & H. J. Keselman (1998), Rand Wilcox (1998), Rand Wilcox (2002), Rand Wilcox & H. J. Keselman (2003), H. J. Keselman et al. (2004), Rand Wilcox (2005), SEQC (2006), Paula Fernández et al. (2007), David Erceg-Hurn & Vikki Mirosevich (2008), David Olive (2008), H. J. Keselman et al. (2008), Rand Wilcox (2009), Esther Herberich et al. (2010), Rand Wilcox (2010), Rand Wilcox & H. J. Keselman (2011).
- Métodos de remuestreo (pruebas de permutación o de aleatorización, validación cruzada, jackknife, bootstrap, submuestreo, Monte Carlo,...) y cuestiones relacionadas de métodos de regresión y exploración de datos (minería de datos,...): Bradley Efron (1982), Dimitris Politis & Joseph Romano (1992 - alternativa), Jogesh Babu (1992), Philip Crowley (1992 - alternativa), John Aldrich (1995 - alternativa), Snigdhansu Chatterjee (1998), Bradley Efron (1999), Dimitris Politis et al. (libro: 1999, 1999a - alternativa, 1999b - alternativa - alternativa - alternativa, 1999c), Gianluca Bontempi (2002-2003), Bradley Efron et al. (2003), Hui Zou et al. (2004), Peter Austin & Jack Tu (2004), Peter Bickel & Anat Sakov (2005), Vinayanand Kandala (2006-2007), Kaustav Aditya (2006-2007), Alain Zuur et al. (2007), Ben Bolker (2007), Dimitris Politis (2007), Lorenzo Camponovo et al. (2007), Peter Flom & David Cassell (2007), Suat Sahinler & Dervis Topuz (2007), Cristophe Dutang et al. (2008), Jogesh Babu (2008), Léopold Simar (2008), Peter Bickel and Anat Sakov (2008), Peter Filzmoser (2008), Dimitris Politis (2010), Herv´ Abdi & Lynne J. Williams (2010), Jean-Bernard Chatelain (2010), Lorenzo Camponovo et al. (2010), M. Templ et al. (2010), Teh Sin Yin et al. (2010), Dimitris Politis (2011), Jogesh Babu (2011), Michael Chernick & Robert LaBudde (2011), Thomas Carsey (2011), Chong-ho Yu (2012), Dave Roberts (2012), Derek Young (2012), Dimitris Politis (2012), Hyunsook Lee et al. (2012), Xiaofeng Shao & Dimitris Politis (2012), Larry Wasserman (2013), Stefan Sperlich (2013 - alternativa), Dimitris Politis (2015).
La gran ventaja de la estadística de remuestreo (como jackknife, bootstrap, submuestreo, Monte Carlo,...) es que no requiere asumir que los datos (muestras y poblaciones) se ajustan a una determinada función de distribución de probabilidad "de referencia" inventada de forma téorica.
- Por una estadística más cercana y menos enrevesada: Estadística basada en "tamaño de efecto": Christopher Ferguson (2009), Roger Kirk (2005, 2006), Stephen Olejnik & James Algina (2000 y 2003), Ioseba Iraurgi (2009), Paul Ellis (2009), Faans Steyn (2009), John Ferron et al. (2004), Robert McGrath & Gregory Meyer (2006), y James Breaugh (2003). Para trabajar con ella, solo son necesarios conocimientos básicos de estadística (qué es y cómo se calcula los parámetros básicos de tendencia central, de desviación y de correlación, y formas de representación gráfica de los datos para poder realizar un análisis exploratorio gráfico), y proporciona la base para comprender los fundamentos de la estadística robusta y adentrarse en la estadística de submuestreo (y los relacionados "submuestreo robusto" y "estadística libre de modelo", ver referencias indicadas en el anterior punto sobre métodos de remuestreo).
[1] Así, es fácil realizar una descripción estadística robusta de una muestra o población como "Mediana ( Intervalo Q1 – Q3 ; Intervalo Mínimo – Máximo ; N )" o mejor expresando los cuartiles como proporción respecto de la mediana (permitiendo una rápida interpretación de la magnitud de la varianza, pero no sirve si el valor de la mediana es cero) "Mediana ( Intervalo QR1 – QR3 % ; Intervalo Mínimo – Máximo ; N )" donde
QR1 = (-1) * | ( | Q1 | - | Mediana | ) / Mediana | = (-1) * ABS ( ( ABS(Q1) - ABS(Mediana) ) / Mediana )*100(%)
QR3 = | ( | Q3 | - | Mediana | ) / Mediana | = ABS ( ( ABS(Q3) - ABS(Mediana) ) / Mediana )*100(%)
siendo Q1 el cuartil 1 o percentil 25% ( Q1 = P0,25 ), Q3 el cuartil 3 o percentil 75% ( Q3 = P0,75 ) y la mediana el cuartil 2 o percentil 50% ( Mediana = Q2 = P0,50 ). A partir de la expresión de los cuartiles como proporción respecto a la mediana, es posible calcular fácilmente los valores de Q1 y Q3:
Q1 = Mediana - | Mediana * QR1 / 100 | = Mediana - ABS( Mediana * QR1 / 100 )
Q3 = Mediana + | Mediana * QR3 / 100 | = Mediana + ABS( Mediana * QR3 / 100 )
Así, para una muestra M1={ 2, 5, 96, 98, 99 } puede usarse como descriptor estadístico robusto: 96 (Q=[-94,79; 2,08]%; R=[2; 99]; N=5)
y para una muestra M2={ 166, 143, 154, 168, 435, 159, 185, 155, 167, 152, 152, 168, 177, 171, 183, 426, 163, 170, 152, 155 } puede usarse como descriptor estadístico robusto: 166,5 (Q=[-7,06; 3,6]%; R=[143; 435]; N=20)
Por su parte, debido a que la mediana es cero y por tanto no es posible calcular QR1 y QR3, para la muestra M3={ -10, -5, 0, 3, 10 } su descriptor estadístico robusto es: 0 (Q=[-5; 3]; R=[-10; 10]; N=5)
Fácilmente puede introducirse estos datos en una hoja de cálculo y contrastar su robustez frente a los parámetros habituales no robustos como la media aritmética y la desviación normal, típica o estándar. Puede usarse la siguiente fórmula en la hoja de cálculo (copiar la línea y pegar sin formato) para valores de números enteros:
=SI(MEDIANA($A$2:$A$999)=0;CONCATENAR(MEDIANA($A$2:$A$999);" (Q=[";REDONDEAR((CUARTIL($A$2:$A$999;1));2);"; ";REDONDEAR((CUARTIL($A$2:$A$999;3));2);"]; R=[";MÍN($A$2:$A$999);"; ";MÁX($A$2:$A$999);"]; N=";CONTAR($A$2:$A$999);")");CONCATENAR(MEDIANA($A$2:$A$999);" (Q=[";REDONDEAR((-1)*ABS((ABS(CUARTIL($A$2:$A$999;1))-ABS(MEDIANA($A$2:$A$999)))/MEDIANA($A$2:$A$999))*100;2);"; ";REDONDEAR(ABS((ABS(CUARTIL($A$2:$A$999;3))-ABS(MEDIANA($A$2:$A$999)))/MEDIANA($A$2:$A$999))*100;2);"]%; R=[";MÍN($A$2:$A$999);"; ";MÁX($A$2:$A$999);"]; N=";CONTAR($A$2:$A$999);")"))
Y para números decimales:
=SI(MEDIANA($A$2:$A$999)=0;CONCATENAR(REDONDEAR(MEDIANA($A$2:$A$999);2);" (Q=[";REDONDEAR((CUARTIL($A$2:$A$999;1));2);"; ";REDONDEAR((CUARTIL($A$2:$A$999;3));2);"]; R=[";REDONDEAR(MÍN($A$2:$A$999);2);"; ";REDONDEAR(MÁX($A$2:$A$999);2);"]; N=";CONTAR($A$2:$A$999);")");CONCATENAR(REDONDEAR(MEDIANA($A$2:$A$999);2);" (Q=[";REDONDEAR((-1)*ABS((ABS(CUARTIL($A$2:$A$999;1))-ABS(MEDIANA($A$2:$A$999)))/MEDIANA($A$2:$A$999))*100;2);"; ";REDONDEAR(ABS((ABS(CUARTIL($A$2:$A$999;3))-ABS(MEDIANA($A$2:$A$999)))/MEDIANA($A$2:$A$999))*100;2);"]%; R=[";REDONDEAR(MÍN($A$2:$A$999);2);"; ";REDONDEAR(MÁX($A$2:$A$999);2);"]; N=";CONTAR($A$2:$A$999);")"))
(Si se usa una hoja de cálculo diferente de LibreOffice Calc, puede ser necesario cambiar "MÍN" por "MIN" y "MÁX" por "MAX". No obstante, para cualquier análisis estadístico mínimamente más avanzado se recomienda usar GNU R como software estadístico.)
La robustez de la mediana permite la sustitución aleatoria de N - 1 datos sin sufrir cambios: tiene un punto de ruptura (en inglés "breakdown point") del 50% (que es el más alto posible) y soporta muy bien datos extremos o valores atípicos (en inglés "outliers").
Su representación gráfica son los "diagramas de caja" o "diagramas de caja y bigotes".
* Software:
http://www.uv.es/ayala/docencia/nmr/nmr13.pdf
http://ocw.unican.es/ensenanzas-tecnicas/estadistica/practicas-1
http://www.uv.es/conesa/CursoR/cursoR.html
http://www.gardenersown.co.uk/education/lectures/r/
http://little-book-of-r-for-multivariate-analysis.readthedocs.org/en/latest/src/multivariateanalysis.html
http://ms.mcmaster.ca/~bolker/emdbook/book.pdf
http://www.statoo.com/en/publications/bootstrap_scgn_v131.pdf
http://www.ievbras.ru/ecostat/Kiril/R/Biblio/R_eng/Chernick2011.pdf
http://www.admb-project.org/documentation
http://doingbayesiandataanalysis.blogspot.com.es/2012/01/now-in-jags-now-in-jags.html