O tema dos datos pode resultar algo árido e, por si sos, non ofrecen moito en termos de aplicación interdisciplinar significativa, xa sexa para planificar finanzas ou incluso para descifrar o que nos están a contar na era da desinformación.
Pero para chegar a iso, hai que comezar polo básico. Entón, que son os datos?
Os datos poden considerarse como observacións ou medicións. Son o que se procesa e analiza para obter información sobre un problema concreto e axudar a desenvolver estratexias para resolvelo.
Poden dividirse en dous grandes tipos; cualitativos e cuantitativos.
Datos cualitativos
Os datos cualitativos son non numéricos, como a cor do cabelo, a especie ou mesmo o sentimento do mercado; describen en lugar de contar.
Poden parecer subxectivos, especialmente nos casos en que as descricións non foron estandarizadas. É posible que dous investigadores describan a mesma cousa de xeito diferente, o que dificulta a comparación ou a análise de forma consistente. A estandarización dos datos cualitativos é un intento de converter as descricións en categorías que poidan utilizarse de xeito fiable.
Os datos cualitativos poden dividirse en datos nominais, que non teñen unha orde natural, como a cor dos ollos, e datos ordinais, que si teñen unha orde significativa pero non unha distancia numérica consistente entre categorías, como se ve nas valoracións de satisfacción do tipo malo, regular ou bo.
Datos cuantitativos
Os datos cuantitativos teñen un valor numérico que pode contarse ou medirse.
Pode ser tan sinxelo como o peso en kg ou a frecuencia de observacións nun conteo local de bolboretas.
Os datos cuantitativos poden describirse ademais como continuos ou discretos.
Os datos continuos poden tomar calquera valor dentro dun rango para medir variables como a temperatura ou os tempos por volta en Fórmula 1. Poden rexistrarse con varios decimais, creando un rango de valores posibles efectivamente infinito.
Os datos discretos, pola súa banda, refírense a un conxunto finito de valores que non poden subdividirse en partes, como o número de turistas que visitan unha cidade. Son números enteiros, xa que non é posible ter a metade dun turista.
Paga a pena sinalar que a distinción entre discreto e continuo non sempre ten que ver coa medición en si, senón co contexto. Un peso de ximnasio rexístrase en incrementos fixos, o que o fai discreto na práctica, pero en realidade alguén que pode levantar 100 kg podería de feito ser quen de levantar 101,75 kg. A capacidade física subxacente da persoa é continua.
Aplicación dos datos
Os datos son un tema universal. No marketing utilízanse para determinar e medir KPI, nos estudos éticos determinan o sesgo nos sistemas e na aprendizaxe automática poden axudar a desenvolver algoritmos para comprender mellor a distribución de especies.
O campo no que se aplican e o problema que necesita resolverse determinarán a profundidade de comprensión necesaria para sacarlles o máximo partido, o que podería implicar explorar a álxebra, a estatística e a probabilidade.
Pero para describir, comparar e extraer conclusións dos datos requírense as mesmas bases; saber que son os datos, como se miden e clasifican, e como resumilos de xeitos que sexan realmente útiles.
Calidade dos Datos
Poder tomar boas decisións baseadas en datos require que estes sexan fiables. Os datos poden ser incompletos, inconsistentes, desactualizados ou inadecuados para responder a pregunta que se está a formular.
Quizais máis importante aínda, o feito de que os datos fosen rexistrados non significa que sexan precisos. E a precisión non é o mesmo que a relevancia.
Alfabetización en Datos
Máis aló dos problemas de calidade dos datos, poden xurdir máis problemas na súa interpretación e comunicación.
O xuízo humano é falible. Obras de Kahneman, Taleb, e Bergstrom e West ofrecen unha visión útil dos tipos de erros que comete a xente, especialmente cando se lle presentan números e estatísticas. Quizais máis aínda cando se utilizan para construír unha narrativa.
Somos capaces de cometer erros sorprendentemente simples que non teñen nada que ver coa intelixencia, xa sexa como resultado dunha gráfica enganosa, un sesgo inherente ou un simple fallo de xuízo. As tendencias de Munger ofrecen un marco útil para entender por que.
Entender os datos pode servir para mellorar os fluxos da túa campaña de marketing, modelar se é probable que unha poboación de especies se recupere ou decline en base a datos históricos de reconto, ou simplemente reducir o risco de ser enganado nunha era na que os datos se citan habitualmente para apoiar un argumento.