AIRES DE CAMBIO
BIG DATA
¿Qué entendemos por las 5 V del BigData?
Hoy en día, la información en Internet fluye a través de diferentes canales de comunicación; es tanta la diversidad que si no se controla todos esos datos y se analizan de forma adecuada, no se podrá utilizar con beneficio.
La información recogida procede de grandes volúmenes, y mucha de ella no transmite lo mismo que otra.
Es aquí donde se necesita el Big Data, para manejar ese volumen de información, cuya función es extraer, gestionar y analizar datos para utilizarlos de forma eficaz en el desarrollo de un negocio y que ayuden a una adecuada toma de decisiones.
5 V del BigData
VOLUMEN
Gracias a los avances tecnológicos y, sobre todo al Big Data, hoy en día la información se puede recopilar, almacenar y clasificar de una manera ordenada y automática.
Nuestro trabajo ha sido investigar páginas y sacar cierta información de toda la que podemos encontrar en Internet.
Hemos utilizado varias fuentes públicas de Open Datas, como por ejemplo los indicadores de ODS de Asturias y de España, el instituto nacional de estadística, European Environment Agency, también procedentes de Global Carbon Atlas.
Además, también creamos una encuesta, teniendo en cuenta que a partir de 300 respuestas se puede considerar una forma de BigData, en la que recibimos 410 respuestas en un plazo de 3 días.
Para asimilar tales cantidades de datos, utilizamos diversas herramientas de trabajo. Entre ellas, se encuentran Excel y programas de ilustración como Adobe Illustrator.
Consideramos que si que es una cantidad representativa, por ejemplo; para analizar la situación de la calidad del aire de todo el país, España cuenta con 703 estaciones de medición repartidas por todo el territorio nacional. De esta manera, se puede realizar un análisis anual y regional de los datos que se recogen. Esto hace que, en su contexto, se puedan extraer ideas que nos lleven a soluciones adecuadas.
VELOCIDAD
La información que vemos en internet se genera de una manera muy veloz, de modo que mucha de ella queda obsoleta. Lo que las empresas quieren conseguir es almacenar y organizar toda esa información de manera rápida y eficaz.
Hemos recopilado bastantes datos de diversas páginas y los hemos organizado de manera que hemos podido dividirla según el tema tratado.
Dividimos los datos en dos categorías. Por un lado, están los datos que hemos estudiado para ver cómo está la situación actual.
Son de 2020 o 2021 (lo más reciente posible), o en su defecto, previos a la cuarentena. Además, hemos utilizado datos recogidos este mismo mes gracias a nuestra encuesta, dónde la gente pudo responder libremente cuestiones sobre el tema.
Dentro de 25 años, estos datos seguirán teniendo un valor intelectual ya que podrán ser usados como comparativas, la única forma de que estos puedan perder valor, es que en ese momento surjan nuevas tecnología que puedan obtener datos de manera más fiable.
VARIEDAD
Toda la información que vemos proviene de diferentes fuentes y canales, por lo que las empresas también se encargan de reconocer la información y clasificarla según fotos, vídeos, audios, etc.
La información que hemos utilizado ha sido recogida de una gran variedad de webs y sitios para poder contrastarla y tener datos de diferentes lugares.
No todos los datos que utilizamos son de la misma fuente. Decidimos utilizar diversas páginas y medios para obtener la información con dos objetivos en mente.
Por un lado, poder comparar perspectivas mundiales, nacionales y regionales y por otro, asegurarnos de que nuestros datos son fiables y de que proporcionamos un estudio ajustado a la realidad.
Hemos utilizado datos estructurados procedentes de redes y webs sociales, principalmente porque al actualizarse diariamente nos permiten obtener información reciente, datos generados por los seres humanos gracias a las encuestas y también M2M, contando con multitud de estaciones de medición de la calidad del aire por todo el mundo.
En varios casos fue necesario modificar los formatos para hacerlos más accesibles y visuales. De esta forma, logramos presentar gráficas de fácil comprensión y análisis.
VERACIDAD
Puede que debido a la gran cantidad de datos que se publican, haya algunos que no sean ciertos. Por eso un paso muy importante es filtrar la información con la tecnología Big Data lo que puede ser o no veraz.
Hemos verificado que la información proviene de páginas fiables y ha sido también importante contrastarla y compararla para asegurarnos de que lo que ponemos es verídico.
Para asegurar que conseguimos una página web con información fiable dedicamos mucho tiempo a la fase de investigación.
Nos centramos en publicaciones de instituciones oficiales y de páginas web reconocidas. Además, a la hora de comparar y analizar los datos recogidos nos enfocamos en asegurarnos de que tratábamos la información con una imparcialidad total. Comparando diferentes fuentes de información, conseguimos resultados precisos y seguros para nuestra noticia.
De esta manera, podemos afirmar que nuestros datos son adecuados para explicar nuestro objetivo, que es conseguir visibilizar una constante en la vida de la gente: la deficiente calidad del aire.
VISUALIZACIÓN
Cuando hablamos de visualización nos referimos al modo en el que los datos son presentados. Una vez que los datos son procesados (los datos están en tablas y hojas de cálculo), necesitamos representarlos visualmente de manera que sean legibles y accesibles, para encontrar patrones y claves ocultas en el tema a investigar.
Hemos aprovechado la infinita fuente de oportunidades que es Internet para poder recabar y comparar información eficientemente. Hemos utilizado herramientas como Google Sheets y Excel, páginas web como Trello y técnicas como la de mapas mentales o la del folio rotatorio.
Decidimos utilizar estas herramientas de visualización porque desde el principio hemos buscado hacer el mejor trabajo posible para poder ofrecer a la gente una manera sencilla de conocer más sobre el tema. Para ello consideramos adecuado escoger medios que nos permitieran trabajar y transmitir nuestras ideas fácilmente.
Por supuesto, representar los datos es un paso clave de todo proceso de investigación.
Al visualizarlos de esta manera podemos asumir y comparar cantidades enormes de información, lo que nos ayuda a extraer ideas y sacar conclusiones con exactitud.
CONÓCENOS
Somos un grupo llamado AIRBENDERS del Colegio Salesianos Santo Ángel de Avilés, estamos inmersos en un proyecto sobre el cambio climático. Queremos concienciar a la gente sobre cómo nuestras acciones pueden repercutir en el futuro, y es que sí, nuestras acciones tienen un impacto, por eso tenemos como meta remover conciencias.
Nosotros somos… ¡WORLD SHAKERS! Y tú también puedes serlo.
EQUIPO DE TRABAJO
Iker (TheComicReliefOne): Peach is here… Ehh espera… ¿De qué estamos hablando? 😭