The hardware and bandwidth for this mirror is donated by dogado GmbH, the Webhosting and Full Service-Cloud Provider. Check out our Wordpress Tutorial.
If you wish to report a bug, or if you are interested in having us mirror your free-software or open-source project, please feel free to contact us at mirror[@]dogado.de.

Paquete datamedios (Versión 1.1.0)

datamedios es un paquete de R diseñado para facilitar la extracción automatizada de noticias desde medios de comunicación chilenos, por el momento haciendo web scraping de BíoBío.cl. Este paquete permite realizar búsquedas de noticias y filtrarlas por rangos de fechas, entregando los resultados en un formato estructurado y listo para su análisis. Además, incluye funcionalidades para almacenar los datos extraídos en una base de datos de manera opcional.


🔧 Instalación

Para instalarlo desde CRAN:

Instala datamedios desde la librería de CRAN:

install.packages("datamedios")
library(datamedios)

Alternativamente, para instalar el paquete desde GitHub, sigue los siguientes pasos:

  1. Asegúrate de tener instalado el paquete devtools. Si no lo tienes, instálalo ejecutando:

    install.packages("devtools")
  2. Instala datamedios desde el repositorio de GitHub:

    devtools::install_github("exetrujillo/datamedios")

🔄 Uso

Función principal: extraer_noticias_fecha

Esta función permite filtrar noticias por un rango de fechas específico, además de aplicar una frase de búsqueda. Por defecto carga los datos automáticamente a la base de datos de api-datamedios.

Parámetros:

Valor devuelto:

Un data.frame con las siguientes columnas:

Ejemplo de uso:

# Buscar noticias entre el 1 de enero y el 31 de diciembre de 2023
noticias <- extraer_noticias_fecha("estallido social", "2019-10-18", "2020-10-18")

Función secundaria: extraer_noticias_max_res

Esta función permite obtener noticias desde BíoBío.cl utilizando una frase de búsqueda. Además, puedes limitar el número de resultados a extraer. Por defecto carga los datos automáticamente a la base de datos de api-datamedios.

Parámetros:

Valor devuelto:

Un data.frame similar al de extraer_noticias_fecha, pero filtrado por max_results.

Ejemplo de uso:

# Buscar noticias relacionadas con "inteligencia artificial"
noticias <- extraer_noticias_max_res("inteligencia artificial", max_results = 100)

🔖 Documentación

Adicionalmente, el paquete incluye funciones de limpieza, manejo y visualización de las noticias extraídas. Para visitar la documentación de todos los códigos haga click aquí.

📊 Dependencias

Este paquete utiliza las siguientes dependencias de R para su correcto funcionamiento:


🗂️ Licencia

datamedios está bajo la Licencia MIT. Consulta el archivo LICENSE para más detalles.


👤 Autoría

Este paquete fue desarrollado por:


These binaries (installable software) and packages are in development.
They may not be fully stable and should be used with caution. We make no claims about them.
Health stats visible at Monitor.