Intrucciones generales:
La función querxc() en el paquete warbleR permite buscar y descargar registros de señales acústicas de aves (e.g. cantos de aves) en la base de datos en linea Xeno-Canto. Estos registros tienen gran cantidad de metadatos, incluyendo el género, especie, subespecie, fecha, hora, y coordenadas geográficas entre otras. Estos datos los vamos a usar para ver la variación en los patrones estacionales de actividad de las especies del género Turdus (al que pertenece el yigüirro Turdus grayi). Turdus es un grupo de distribución cosmopolita que se caracteriza por ser vocalmente muy activo, y por tanto esta ampliamente representado en Xeno-Canto.
Primero debemos instalar y cargar el paquete warbleR:
install.packages("warbleR")
library(warbleR)
Con querxc() podemos hacer búsquedas de familias, géneros o especies (también búsquedas por sitios, grabadores, países, etc, pero estas son mas complejas). En nuestro caso vamos a bajar los metadatos para las grabaciones del género Turdus de la siguiente forma (necesita conexión a internet!):
turdus <- querxc("Turdus", download = FALSE)
Podemos ver los nombres de las columnas para darnos una idea de lo que contienen los metadatos:
## [1] "Recording_ID" "Genus" "Specific_epithet"
## [4] "Subspecies" "English_name" "Recordist"
## [7] "Country" "Locality" "Latitude"
## [10] "Longitude" "Vocalization_type" "Audio_file"
## [13] "License" "Url" "Quality"
## [16] "Time" "Date" "Altitude"
## [19] "Spectrogram_small" "Spectrogram_med" "Spectrogram_large"
## [22] "Spectrogram_full" "Length" "Uploaded"
## [25] "Other_species" "Remarks" "Bird_seen"
## [28] "Playback_used" "Other_species1" "Other_species2"
## [31] "Other_species3" "Other_species4" "Other_species5"
## [34] "Other_species6" "Other_species7" "Other_species8"
## [37] "Other_species9" "Other_species10" "Other_species11"
## [40] "Other_species12" "Other_species13" "Other_species14"
## [43] "Other_species15" "Other_species16"
Por supuesto también podemos usar head() para ver las primeras filas:
head(turdus[ , 1:18])
Recording_ID | Genus | Specific_epithet | Subspecies | English_name | Recordist | Country | Locality | Latitude | Longitude | Vocalization_type | Audio_file | License | Url | Quality | Time | Date | Altitude |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
504016 | Turdus | litsitsirupa | Groundscraper Thrush | Aladdin | Ethiopia | North Shewa, Amhara | 9.8198 | 39.7341 | call, flight call, life stage uncertain, sex uncertain | //www.xeno-canto.org/504016/download | //creativecommons.org/licenses/by-nc-sa/4.0/ | //www.xeno-canto.org/504016 | no score | 16:30 | 2019-10-24 | 3300 | |
403680 | Turdus | litsitsirupa | Groundscraper Thrush | Mary Simmonds | Ethiopia | Agoro Lodge, Adigrat, Tigray | 14.2489 | 39.4813 | call | //www.xeno-canto.org/403680/download | //creativecommons.org/licenses/by-nc-sa/4.0/ | //www.xeno-canto.org/403680 | A | 07:30 | 2018-01-21 | 2400 | |
347146 | Turdus | litsitsirupa | Groundscraper Thrush | Peter Boesman | Namibia | Omaruru area west | -21.447504 | 15.887621 | song and call | //www.xeno-canto.org/347146/download | //creativecommons.org/licenses/by-nc-nd/4.0/ | //www.xeno-canto.org/347146 | A | 8:30 | 2016-11-11 | ||
300630 | Turdus | litsitsirupa | simensis | Groundscraper Thrush | Peter Boesman | Ethiopia | Debre Birhan area | 9.670645 | 39.533701 | call | //www.xeno-canto.org/300630/download | //creativecommons.org/licenses/by-nc-nd/4.0/ | //www.xeno-canto.org/300630 | A | 15:00 | 2015-12-02 | ? |
300628 | Turdus | litsitsirupa | simensis | Groundscraper Thrush | Peter Boesman | Ethiopia | Debre Libanos area | 9.711656 | 38.857939 | song | //www.xeno-canto.org/300628/download | //creativecommons.org/licenses/by-nc-nd/4.0/ | //www.xeno-canto.org/300628 | A | 10:00 | 2015-12-01 | |
153875 | Turdus | litsitsirupa | Groundscraper Thrush | Rolf A. de By | Namibia | Monte Christo, Joe’s place | -22.342 | 16.9734 | song | //www.xeno-canto.org/153875/download | //creativecommons.org/licenses/by-nc-sa/3.0/ | //www.xeno-canto.org/153875 | A | 06:11 | 2013-11-02 | 1400 |
Con la función grep() podemos generar vectores con los indices (la posición en el vector) que nos indican si un texto (i.e. palabra) esta presente en cada uno de los elementos de un vector no-numérico. Por ejemplo este código nos dice si “ab” esta en cada elemento del vector v1:
v1 <- c("acd", "abc", "accb", "abb", "aab", "bc")
grep("ab", v1)
## [1] 2 4 5
Utilice esta función para eliminar los registros que no tengan la palabra “song” del juego de datos turdus (5 pts)
¿Cómo puede hacer que la función no tome en cuenta si las letras están en mayúscula o minúscula (osea que tome “Song”, “song” y “SONG” como lo mismo)? (pista: Fíjese en la descripción de los argumentos en la documentación de la función, 5 pts).
Elimine nuevamente los registros del juego de datos pero esta vez ignorando mayúsculas/minúsculas (5 pts).
Podemos darnos una idea de la distribución geográfica de los datos con un histograma de la longitud. Primero debemos convertir la columna Longitude a numérica:
# convertir logitude a numerico
turdus$Longitude <- as.numeric(as.character(turdus$Longitude))
# hacer histograma
hist(turdus$Longitude, main = NULL, col = terrain.colors(20, alpha = 0.5)[2], xlab = "Longitud", ylab = "Frecuencia")
#poner linea roja entre viejo y nuevo mundo
abline(v = -25, col = "red", lty = 3, lwd = 2)
En ese gráfico podemos ver como se separan las grabaciones del Viejo y Nuevo Mundo. Podemos suponer que menos de -25 de Longitud es el Nuevo Mundo. Podemos confirmarlo viendo los paises que quedan por debajo de ese umbral:
unique(turdus$Country[turdus$Longitude < - 25])
## [1] "Brazil" "Colombia" "Venezuela"
## [4] NA "Argentina" "Guyana"
## [7] "Bolivia" "Ecuador" "Peru"
## [10] "Portugal" "Canada" "New Zealand"
## [13] "Chile" "Costa Rica" "Honduras"
## [16] "Mexico" "Guatemala" "El Salvador"
## [19] "Uruguay" "Paraguay" "United Kingdom"
## [22] "French Guiana" "Suriname" "Panama"
## [25] "Nicaragua" "Belize" "United States"
## [28] "Trinidad & Tobago" "St Lucia" "Dominican Republic"
## [31] "Jamaica" "Bahamas" "Puerto Rico"
## [34] "Cuba" "France" "Dominica"
El Reino Unido sale por la colonia que tiene en las Malvinas:
turdus$Locality[turdus$Country == "United Kingdom" & turdus$Longitude < -25]
## [1] NA
## [2] NA
## [3] NA
## [4] "The Rookery, Saunder Island, Falkland Islands"
Lo importante aqui es que podemos usar la longitud para determinar si las especies son del Nuevo o Viejo Mundo.
De igual forma podemos usar la columna de “Latitude” para ver la distribución latitudinal de las especies.
Cree una función que determine el rango de distribución latitudinal de cada especie. La función debe devolver un juego de datos (data frame) con 4 columnas: el nombre de la especie, el limite de rango Sur y el limite de rango Norte y el punto medio de la distribución (20 pts).
Modifique la función para que incluya una columna que indique si las especies son del Viejo o Nuevo Mundo (10 pts).
Pistas:
Estos datos pueden generar informacion biologica interesante sobre los patrones de variacion temporal y geografica en el comportamiento vocal de estas aves. El siguiente ejercicio intenta probar algunas hipotesis utilizando estos datos:
Las aves producen un repertoirio de sonidos, el cual incluye sonidos para defensa de territorio y busqueda de pareja (cantos) y sonidos para otras interacciones sociales (llamados). Es de esperar que los primeros se restringan a la epoca de apareamiento mientras que los segundos se produzcan a lo largo del año.
Modificando el codigo en el ejercicio anterior, calcule el rango temporal (inicio y fin durante el año) de 1) cantos (“song”) y 2) llamados (i.e. no cantos, todas las otras categorias) para cada especie (20 pts).
Corra una t-pareada para comparar los rangos temporales (i.e. temporadas) para cantos y llamados (5 pts).
¿Pruebe de forma estadística cómo afecta la latitud la duración de la temporada de apareamiento? (pistas: use la temporada de producción de cantos como una medida de la temporada de apareamiento y modelos lm()). Haga un gráfico que represente la relación entre las 2 variables (10 pts).
¿Pruebe de forma estadística cómo afecta la latitud la duración de la temporada de producción de llamados? Haga un gráfico que represente la relación entre las 2 variables (10 pts).