Muestra, dato y matriz de datos

Anuncio
Muestra, dato y matriz de datos
Muestra, dato y matriz de datos
1. Presentar sintéticamente las principales cuestiones a considerar en la elección de
las muestras en un proceso de investigación. Vincular con metodología cualitativa
y metodología cuantitativa.
“La imposibilidad unas veces, y otras el engorro de investigar a todos los casos
(personas, hechos, situaciones…) relacionados con el objeto de investigación, obliga a
seleccionar un número reducido de ellos, una muestra representativa” (Olabuénaga,
Aristegui y Melgosa, 1998: 49). La muestra es “…el material concreto de trabajo”… (Samaja,
La ventaja principal de utilizar una muestra estriba en el ahorro de
tiempo, dinero y personal para realizar la investigación. Debe cumplir con tres
condiciones básicas: a) Representatividad: “La muestra debe ser un universo en
‘miniatura’” (Olabuénaga, Aristegui y Melgosa, 1998: 51); b) Confianza: “…debe garantizar la
fiabilidad de los datos respecto del universo” (Ibíden: 51); c) Tamaño: la Teoría del
Muestreo indica en cada caso cuántos elementos se precisan.
La tendencia de análisis cuantitativo a generalizar y universalizar obliga a estudiar
todos los casos y dado la imposibilidad de efectuarlo se seleccionan unos cuantos casos
de muestra que representan al colectivo. En cambio los análisis cualitativos estudian
normalmente un individuo, una situación, por lo que el tamaño de la muestra obedece a
una selección por parte del investigador. El muestreo probabilístico – en que podemos
saber a priori, mediante leyes estadísticas, la probabilidad que tiene cada uno de los
miembros del universo de salir seleccionado- está ligado a la investigación cuantitativa,
y el no probabilístico – en que los sujetos no son elegidos por azar sino de forma
intencional o controlada- a la investigación cualitativa.
El investigador puede fijar de antemano: a) su margen de error: “cuanto menor sea el
margen de error, mayor será el tamaño de la muestra exigido” (Olabuénaga, Aristegui y
Melgosa, 1998: 53); b) el nivel de confianza: “El tamaño de un [sic] muestra será tanto
Juan, 2004: 267)
mayor cuanto más alto sea el nivel de confianza con el que el investigador desee
trabajar” (Ibíden: 53); c) la varianza del universo: cuanto más variada o heterogénea sea
la población mayor será también, el tamaño de la muestra.
2. Presentar en una carilla la estructura cuatripartita del dato científico y el
sistema de matrices de datos y su dialéctica.
Estructura cuatripartita del dato
La traducción de la experiencia espontánea a una descripción científica produce ese
material básico de la experiencia científica llamada “dato”. Un dato es una construcción
Muestra, dato y matriz de datos
compleja que posee una estructura interna que es su contenido formal invariable (es
decir, está presente en todo dato). La estructura del dato científico de Galtung es
completada por Samaja con un cuarto lugar, por lo que pasa a ser cuatripartita, siendo
los cuatro componentes los que siguen:
1. unidad de análisis (UA)
2. variables (V)
3. valores (R)
4. indicadores (I).
Una unidad de análisis (o individuo de estudio) puede ser concebida como un
“miembro” (de un sistema, es decir, como formando parte de un universal) o como un
“colectivo” (como conteniendo “particularidades”). Así, podemos considerar a nuestro
sistema como: a. un universo que tiene partes o como b.la parte de un universo.
Una variable es un asunto de interés, relevante para la descripción de las unidades de
análisis. Toda variable es un criterio de clasificación que se emplea para clasificar las
UA. Las variables son artificios clasificadores o descriptores que emplea el científico,
mediante los cuales resume y organiza una vasta gama de experiencias. Todas las
variables resumen información y son analizables en dimensiones.
Los valores son los estados posibles que pueden presentar las variables, pueden o no
tener valores numéricos.
Todo dato científico vincula un concepto con un “estado de cosas” del mundo externo,
mediante la ejecución de un procedimiento aplicado a una o más dimensiones
consideradas “observables”. Esta definición incluye como ingredientes esenciales del
indicador dos elementos: a. la dimensión (“considerada como observable”), y b. el
procedimiento para ejecutar la observación.
Los procedimientos abarcan una muy amplia gama de técnicas de medición: desde la
observación de un “conjunto de indicios” que lleva desde lo manifiesto a lo latente,
hasta la construcción de escalas, tests multiitémicos, o diversos tipos de índices
(sumatorios, acumulativos, comparativos, etc.).
Indicador es algún tipo de procedimiento que se aplique a alguna dimensión de la
variable, para establecer qué valor de ella le corresponde a una unidad de análisis
determinada. “Dimensión de una variable” es un aspecto parcial de la variable (o
predicado), que es relativamente independiente de otros aspectos.
Muestra, dato y matriz de datos
Agregamos estos conceptos a un esquema que permita ver el carácter jerárquico de
algunas de las relaciones que se dan entre los cuatro elementos de la estructura.
_R______V________UA_
D
I = _________
P
En este diagrama, debajo del símbolo del valor R, figura el símbolo del indicador (I),
que está en relación de igualdad con la dimensión y el procedimiento, cuyos símbolos (D)
y (P) están inmediatamente por debajo de la variable (V). Esta ubicación en el diagrama
busca sugerir la relación de subordinación que existe entre las dimensiones y la variable
de la cual son aspectos.
El dato científico tiene dos atributos definitorios:
a. la validez (pone en juego la selección de las dimensiones); y
b. la confiabilidad (la construcción del procedimiento).
3. Sistema de matrices de datos
La matriz de datos es un nombre posible para designar a los invariantes estructurales
de los datos científicos de cualquier ciencia empírica, y puede ser sincrónica (el tiempo
aparece como un dato variable) o diacrónica (el tiempo en transcurso). Además pueden
combinarse ambos tipos de matrices.
Cualquiera sea la investigación de que se trate, como mínimo se determinan tres
matrices de datos:
1. una matriz central que llamaríamos “Nivel de anclaje” (N) para aludir a que la
investigación dada ha decidido “anclar en ese nivel.
2. una matriz constituida por los componentes (o partes) de las unidades de análisis
del nivel de anclaje (“Matriz de nivel (N) subunitario” N-1).
3. finalmente una matriz constituida por los contextos de las unidades del N
(“Matriz supraunitaria N+1”).
Es posible que una matríz de datos tenga relaciones con alguna otra matriz de datos
sin estar ni subordinada (N-1) ni supraordinada (N+1) a ella, por lo tanto hablaremos
de “matrices del mismo nivel de integración” o de “matrices coordinadas”.
La DIALÉCTICA se refiere a que el conocimiento científico se desarrolla como una
dinámica o movimiento de “ir y venir” entre la experiencia y la teoría. La explicación o
comprensión científica es la operación que resulta de ese movimiento. Se trata de un
movimiento de mediación. La matriz de datos se mueve en la constante intermediación
Muestra, dato y matriz de datos
por la cual se tornan observables ciertos conceptos teóricos, al mismo tiempo que se
transforman en conceptos teóricos ciertos estados de cosas observables.
Entre los dos extremos en que se mueve el acto científico:
“deductivismo/inductivismo” o “Teoría/empiria”, se encuentra la formación social y la
experiencia del propio investigador; de donde él extrae sus “analogías familiares”. Esto
indica una superación de las dos corrientes. Es el sujeto científico quien aporta los
modelos y los traduce tanto a pautas de observación cuanto a enunciados teóricos.
Estos modelos son como “mapas topológicos“ aportados por el investigador. De no
mediar ese modelo, la realidad sería invisible.
En todo momento hay una matriz central (o focal), cuyo llenado presupone la
resolución previa de ciertas matrices periféricas o auxiliares. En el momento en que las
matrices periféricas son focalizadas para su resolución (es decir, dejan de ser
periféricas para ser temporariamente focales), los elementos de la anterior matriz
central aparecen ahora en otros lugares de la estructura de los datos. Este movimiento
entre los distintos planos u ópticas que se superpone de múltiples maneras, también
constituye la DIALÉCTICA y representa el proceso de construcción del objeto
concreto
de
la
investigación.
La
dialéctica
interna
se
refiere
a
sistema/subsistema/suprasistema.
4. ¿Cuál es la utilidad que se puede atribuir a conocer la estructura del dato y las
matrices?
(Media carilla) Traer a clase impreso este material elaborado, con
una copia para entregar a la docente. Se espera reconsideraciones, críticas,
revisiones, del escrito del Práctico N° 2, especialmente para el punto 1.
Al presentar así las relaciones que conforman un objeto de investigación, Juan
Samaja nos muestra una realidad concebida como una totalidad conformada por sujetos
y relaciones que se modifican recíprocamente; esto es bastante diferente que pensar
en un conjunto cuyas partes se presentan estáticas y como incluidas en un conjunto
mayor.
La matriz de datos da cuenta de los múltiples niveles de integración de la realidad
humana, y por lo tanto, de la complejidad que implica recortar nuestro objeto. La matriz
será el insumo para comenzar a resumir nuestra información. Analizar un determinado
cuerpo de datos es intentar alguna manera de compactarlos para poder sacar
conclusiones de ellos, es decir que analizar datos es, en palabras de Juan Samaja,
sintetizarlos.
Muestra, dato y matriz de datos
La realidad es concebida como una totalidad integrada de sujetos y relaciones que se
modifican unos a otros dinámicamente. “La realidad (cualquier sector de la realidad) es
siempre infinitamente compleja, y no se puede pasar directamente desde la percepción
común y del comportamiento práctico espontáneo, a la descripción científica y a la
‘visión teórica’” (Samaja, Juan, 2004: 159).
El proceso de investigación consiste en construir el sistema de matrices de datos,
llenar esas matrices de datos (sean cuantitativas o cualitativas) y procesar, analizar e
interpretar dichas matrices.
… “el principal presupuesto de toda investigación científica es éste: que el objeto de
estudio sea inteligible” (Samaja, Juan, 2004: 147), es decir que el objeto sea investigable.
Siguiendo a este autor por un lado, debe ser posible describir el objeto de estudio, es
decir, identificar sus elementos componentes y caracterizarlos; y por otro lado debe
ser posible reelaborarlo conforme a algún patrón de asimilación a las evidencias de
nuestra Razón. “Emerge la comprensión cuando se logra mostrar y fundamentar que lo
dicho en una descripción puede hacerse corresponder (…) al esquema lógico matemático
que hemos logrado construir con las leyes descubiertas” (Samaja, Juan, 2004: 147).
… “la información que se obtenga (sea bajo la forma de registros fotográficos, de
grabaciones, de narraciones de episodios humanos o de proposiciones que describen
estados de cosas –de cualquier nivel de complejidad que se trate- deberá poder ser
traducida a la estructura del lenguaje descriptivo; dicho de otra manera: ha de ser
posible señalar las operaciones[I] mediante las que se podrán identificar (o construir)
los sujetos de los cuales se informa [UA]; las variables implícitas en el informe [V] y las
situaciones particulares (los valores particulares) que se informan [R]” (Samaja, Juan,
2004: 183).
Resumiendo, en palabras de Samaja, la matriz de datos es un cartografiado de la
realidad, una especie de fotografía que debe poder ser traducida a la estructura de un
lenguaje descriptivo.
5. ¿Cuáles son las posibles direcciones del análisis de datos? Presentar
sintéticamente cada una y vincularlas con los esquemas exploratorios,
descriptivos y explicativos.
Según Samaja, hay tres direcciones posibles por las que se puede realizar el proceso
constructivo del diseño: a) la dirección que primero busca establecer las unidades de
análisis, para luego escoger las variables relevantes y los respectivos valores; b) la
Muestra, dato y matriz de datos
dirección que identifica las variables centrales del estudio, con sus valores, y luego se
pregunta por las unidades; c) la que a partir de los valores recorre el proceso
constitutivo de las variables y las unidades.
Las investigaciones exploratorias están destinadas a producir nuevas ideas. Al escoger
deliberadamente los sujetos de estudio, la muestra es no probabilística. “… se puede
decir que el tratamiento y análisis de datos en una investigación de carácter
exploratorio está predominantemente centrada en el valor [R], puesto que desde el
valor (…) se intentará averiguar qué variables o criterios de clasificación resultarán más
convenientes para categorizar al objeto de estudio” (Samaja, Juan, 2004: 294).
Las investigaciones descriptivas, centradas en la variable [V], buscan establecer las
características generales de una población a partir de lo que se encuentra en una
muestra, que ha sido elegida al azar, siguiendo las leyes estadísticas. “Esto es así
porque el comportamiento de los valores de las variables de sucesivas muestras
tomadas al azar se distribuyen según tendencias definidas, alrededor de los verdaderos
valores del Universo (que los estadígrafos llaman ‘parámetros’)” (Samaja, Juan, 2004: 274).
Las investigaciones experimentales o cuasi-experimentales, donde el análisis de
datos pertenece a un esquema explicativo/comprensivo, pretenden verificar hipótesis
causales, mediante el control de las principales variables del fenómeno. Se trata de
poner bajo control la mayor cantidad de variables, escogiendo cuotas de unidades de
análisis en donde haya cantidades semejantes que difieren solamente en la variable
independiente. Está centrado predominantemente en las unidades de análisis [UA].
Análisis de datos en
esquemas1:
Centrado en la
Variable
Centrado en la
unidad de Análisis
Centrado en el Valor
Exploratorios
Examinar
las
distribuciones
de
frecuencias que se
presentan en cada una
de
las
primeras
clasificaciones (analizar
proporciones, medidas
de
posición
y
variabilidad)
Revisar los distintos
sujetos
posibles
e
intentar
conceptualizarlos. ¿Qué
posibilidades
de
abordaje ofrecen?
Examinar hechos o
estado de cosas y
averiguar formas de
clasificarlos
Descriptivos
Caracterizar
las
distribuciones aplicando
medidas
descriptivas
posibles;
ejecutar
gráficos de tendencias.
Descubrir asociaciones
que den lugar a
hipótesis causales.
Construcción
de
modelos mecánicos y
procesuales
que
permitan
plasmar
globalmente
las
descripciones
univariadas (variables
ordenadas y preparadas
por técnicas estadísticas
básicas)2 y bivariadas
(descubrir y describir
las relaciones entre dos
variables: covariacion,
asociación
y
3
causalidad)
Elaboración de escalas
más finas de medición .
escalas
e
índices
respectivos y de valores
normalizados
Explicativos
Ejecutar análisis más
complejos (análisis de
varianza, factorial) para
verificación de hipótesis
causales
Aplicación de técnicas Discutir valides de los
de análisis funcional, indicadores
comparativo, histórico –
estructural. Exposición
del modelo real de
interpretación.
1
Juan Samaja. Epistemología y Metodología. Elementos para una teoría de la investigación científica. Parte IV “el
análisis del proceso de investigación”.
2
Jose Yuni y Claudio Urbano, Técnicas para investigar. Análisis de datos y redacción científica. Editorial Brujas.
Córdoba, 2006. Pág. 43
3
Jose Yuni y Claudio Urbano, Técnicas para investigar. Análisis de datos y redacción científica. Editorial Brujas.
Córdoba, 2006. Pág. 61
Muestra, Datos y Matriz de Datos
6. Mostrar las diferencias del análisis de datos según se trate de
metodología cualitativa o diseño cuantitativo.
diseños con
En la investigación cualitativa el análisis de datos es una de las actividades principales
“… ya que se realiza a lo largo de todo el proceso” (Yuni, Urbano, 2006: 77). El mismo suele
ser problemático porque no existen procedimientos estandarizados que puedan
aplicarse a cualquiera de los datos, los cuales son de naturaleza disímil y están en
constante dinamismo. La finalidad del análisis cualitativo es obtener una comprensión
integral y compleja de las situaciones sociales. “Como todo material producido en la
interacción social, éste es vehiculizado por algún tipo de lenguaje y por lo tanto puede
ser abordado a través de un proceso semiótico” (Ibíden: 79). El investigador habrá de
encontrar las tramas de sentido que sostienen los textos generados durante su trabajo.
Existen distintas posturas sobre la codificación de los datos obtenidos: si debe hacerse
mediante números o mediante etiquetas (palabras o conceptos).
La investigación cuantitativa se basa en la estadística, de tal modo que la información
obtenida se convierte en número. Los principales autores que representan esta posición
señalan que ya en el proyecto de investigación se debe prever el modo en que se tratará
los datos y el tamaño de la muestra. El punto inicial “...es el análisis univariado, sobre el
cual se avanza hacia el análisis de relaciones o bivariado para concluir (…) en el análisis
multivariado” (Ibíden: 42). El análisis univariado consiste en el examen de la información
de cada una de las variables (se aconseja tomar primero las independientes, luego las
intervinientes y finalmente las dependientes). Es una forma de chequear la calidad de la
información y contribuye en la función correctiva de datos erróneos. Cuando las
variables ofrecen gran variabilidad que dificulta el análisis, el investigador puede
recurrir a la compactación de los valores. El análisis bivariado trata de descubrir y
describir la relación entre dos variables. Con frecuencia se recurre a cuadros y tablas
para ayudar a la comprensión del lector. Se debe evaluar su pertinencia y no descuidar
los requisitos para su presentación.
Descargar