Intrucciones generales:

  • La fecha de entrega es el 2 de diciembre
  • El examen debe ser entregada en formato .Rmd y .html (2.5 pts cada uno)
  • Utilice secciones de código (“chunks”) separados para cada ejercicio y subtítulos para cada sección (2.5 pts)
  • El código debe estar meticulosamente documentado con comentarios encima o junto a las lineas de código (usando #)
  • El código debe seguir las reglas de estilo señaladas en la presentación “Importar y dar formato a datos” (2.5 pts)

La función querxc() en el paquete warbleR permite buscar y descargar registros de señales acústicas de aves (e.g. cantos de aves) en la base de datos en linea Xeno-Canto. Estos registros tienen gran cantidad de metadatos, incluyendo el género, especie, subespecie, fecha, hora, y coordenadas geográficas entre otras. Estos datos los vamos a usar para ver la variación en los patrones estacionales de actividad de las especies del género Turdus (al que pertenece el yigüirro Turdus grayi). Turdus es un grupo de distribución cosmopolita que se caracteriza por ser vocalmente muy activo, y por tanto esta ampliamente representado en Xeno-Canto.

Primero debemos instalar y cargar el paquete warbleR:

install.packages("warbleR")

library(warbleR)

 

Con querxc() podemos hacer búsquedas de familias, géneros o especies (también búsquedas por sitios, grabadores, países, etc, pero estas son mas complejas). En nuestro caso vamos a bajar los metadatos para las grabaciones del género Turdus de la siguiente forma (necesita conexión a internet!):

turdus <- querxc("Turdus", download = FALSE)

 

Podemos ver los nombres de las columnas para darnos una idea de lo que contienen los metadatos:

##  [1] "Recording_ID"      "Genus"             "Specific_epithet" 
##  [4] "Subspecies"        "English_name"      "Recordist"        
##  [7] "Country"           "Locality"          "Latitude"         
## [10] "Longitude"         "Vocalization_type" "Audio_file"       
## [13] "License"           "Url"               "Quality"          
## [16] "Time"              "Date"              "Altitude"         
## [19] "Spectrogram_small" "Spectrogram_med"   "Spectrogram_large"
## [22] "Spectrogram_full"  "Length"            "Uploaded"         
## [25] "Other_species"     "Remarks"           "Bird_seen"        
## [28] "Playback_used"     "Other_species1"    "Other_species2"   
## [31] "Other_species3"    "Other_species4"    "Other_species5"   
## [34] "Other_species6"    "Other_species7"    "Other_species8"   
## [37] "Other_species9"    "Other_species10"   "Other_species11"  
## [40] "Other_species12"   "Other_species13"   "Other_species14"  
## [43] "Other_species15"   "Other_species16"

 

Por supuesto también podemos usar head() para ver las primeras filas:

head(turdus[ , 1:18])
Recording_ID Genus Specific_epithet Subspecies English_name Recordist Country Locality Latitude Longitude Vocalization_type Audio_file License Url Quality Time Date Altitude
504016 Turdus litsitsirupa Groundscraper Thrush Aladdin Ethiopia North Shewa, Amhara 9.8198 39.7341 call, flight call, life stage uncertain, sex uncertain //www.xeno-canto.org/504016/download //creativecommons.org/licenses/by-nc-sa/4.0/ //www.xeno-canto.org/504016 no score 16:30 2019-10-24 3300
403680 Turdus litsitsirupa Groundscraper Thrush Mary Simmonds Ethiopia Agoro Lodge, Adigrat, Tigray 14.2489 39.4813 call //www.xeno-canto.org/403680/download //creativecommons.org/licenses/by-nc-sa/4.0/ //www.xeno-canto.org/403680 A 07:30 2018-01-21 2400
347146 Turdus litsitsirupa Groundscraper Thrush Peter Boesman Namibia Omaruru area west -21.447504 15.887621 song and call //www.xeno-canto.org/347146/download //creativecommons.org/licenses/by-nc-nd/4.0/ //www.xeno-canto.org/347146 A 8:30 2016-11-11
300630 Turdus litsitsirupa simensis Groundscraper Thrush Peter Boesman Ethiopia Debre Birhan area 9.670645 39.533701 call //www.xeno-canto.org/300630/download //creativecommons.org/licenses/by-nc-nd/4.0/ //www.xeno-canto.org/300630 A 15:00 2015-12-02 ?
300628 Turdus litsitsirupa simensis Groundscraper Thrush Peter Boesman Ethiopia Debre Libanos area 9.711656 38.857939 song //www.xeno-canto.org/300628/download //creativecommons.org/licenses/by-nc-nd/4.0/ //www.xeno-canto.org/300628 A 10:00 2015-12-01
153875 Turdus litsitsirupa Groundscraper Thrush Rolf A. de By Namibia Monte Christo, Joe’s place -22.342 16.9734 song //www.xeno-canto.org/153875/download //creativecommons.org/licenses/by-nc-sa/3.0/ //www.xeno-canto.org/153875 A 06:11 2013-11-02 1400

Ejercicio 1


Con la función grep() podemos generar vectores con los indices (la posición en el vector) que nos indican si un texto (i.e. palabra) esta presente en cada uno de los elementos de un vector no-numérico. Por ejemplo este código nos dice si “ab” esta en cada elemento del vector v1:

v1  <- c("acd", "abc", "accb", "abb", "aab", "bc")

grep("ab", v1)
## [1] 2 4 5

 

  1. Utilice esta función para eliminar los registros que no tengan la palabra “song” del juego de datos turdus (5 pts)

  2. ¿Cómo puede hacer que la función no tome en cuenta si las letras están en mayúscula o minúscula (osea que tome “Song”, “song” y “SONG” como lo mismo)? (pista: Fíjese en la descripción de los argumentos en la documentación de la función, 5 pts).

  3. Elimine nuevamente los registros del juego de datos pero esta vez ignorando mayúsculas/minúsculas (5 pts).


Podemos darnos una idea de la distribución geográfica de los datos con un histograma de la longitud. Primero debemos convertir la columna Longitude a numérica:

# convertir logitude a numerico
turdus$Longitude <- as.numeric(as.character(turdus$Longitude))

# hacer histograma 
hist(turdus$Longitude, main = NULL, col = terrain.colors(20, alpha = 0.5)[2], xlab = "Longitud", ylab = "Frecuencia")

#poner linea roja entre viejo y nuevo mundo
abline(v = -25, col = "red", lty = 3, lwd = 2)

 

En ese gráfico podemos ver como se separan las grabaciones del Viejo y Nuevo Mundo. Podemos suponer que menos de -25 de Longitud es el Nuevo Mundo. Podemos confirmarlo viendo los paises que quedan por debajo de ese umbral:

unique(turdus$Country[turdus$Longitude < - 25])
##  [1] "Brazil"             "Colombia"           "Venezuela"         
##  [4] NA                   "Argentina"          "Guyana"            
##  [7] "Bolivia"            "Ecuador"            "Peru"              
## [10] "Portugal"           "Canada"             "New Zealand"       
## [13] "Chile"              "Costa Rica"         "Honduras"          
## [16] "Mexico"             "Guatemala"          "El Salvador"       
## [19] "Uruguay"            "Paraguay"           "United Kingdom"    
## [22] "French Guiana"      "Suriname"           "Panama"            
## [25] "Nicaragua"          "Belize"             "United States"     
## [28] "Trinidad & Tobago"  "St Lucia"           "Dominican Republic"
## [31] "Jamaica"            "Bahamas"            "Puerto Rico"       
## [34] "Cuba"               "France"             "Dominica"

 

El Reino Unido sale por la colonia que tiene en las Malvinas:

turdus$Locality[turdus$Country == "United Kingdom" & turdus$Longitude < -25]
## [1] NA                                             
## [2] NA                                             
## [3] NA                                             
## [4] "The Rookery, Saunder Island, Falkland Islands"

 

Lo importante aqui es que podemos usar la longitud para determinar si las especies son del Nuevo o Viejo Mundo.

De igual forma podemos usar la columna de “Latitude” para ver la distribución latitudinal de las especies.

Ejercicio 2

  1. Cree una función que determine el rango de distribución latitudinal de cada especie. La función debe devolver un juego de datos (data frame) con 4 columnas: el nombre de la especie, el limite de rango Sur y el limite de rango Norte y el punto medio de la distribución (20 pts).

  2. Modifique la función para que incluya una columna que indique si las especies son del Viejo o Nuevo Mundo (10 pts).

Pistas:

  • la función debe tener un loop adentro (for(), tapply() o lapply())
  • la función debe generar internamente un sub-juego de datos para cada especie.
  1. Añada un argumento que permita controlar si la función devuelve solo especies del Viejo Mundo, del Nuevo Mundo o ambos.

Estos datos pueden generar informacion biologica interesante sobre los patrones de variacion temporal y geografica en el comportamiento vocal de estas aves. El siguiente ejercicio intenta probar algunas hipotesis utilizando estos datos:

Ejercicio 3

Las aves producen un repertoirio de sonidos, el cual incluye sonidos para defensa de territorio y busqueda de pareja (cantos) y sonidos para otras interacciones sociales (llamados). Es de esperar que los primeros se restringan a la epoca de apareamiento mientras que los segundos se produzcan a lo largo del año.

  1. Modificando el codigo en el ejercicio anterior, calcule el rango temporal (inicio y fin durante el año) de 1) cantos (“song”) y 2) llamados (i.e. no cantos, todas las otras categorias) para cada especie (20 pts).

  2. Corra una t-pareada para comparar los rangos temporales (i.e. temporadas) para cantos y llamados (5 pts).

  3. ¿Pruebe de forma estadística cómo afecta la latitud la duración de la temporada de apareamiento? (pistas: use la temporada de producción de cantos como una medida de la temporada de apareamiento y modelos lm()). Haga un gráfico que represente la relación entre las 2 variables (10 pts).

  4. ¿Pruebe de forma estadística cómo afecta la latitud la duración de la temporada de producción de llamados? Haga un gráfico que represente la relación entre las 2 variables (10 pts).