Propondré esta ocasión un ejercicio o pequeño ejemplo de cómo discriminar valores de un listado a efectos de cálculos estadísticos, empleando Excel.
El ejercicio surge de la petición de un usuario:
El problema viene por la necesidad de trabajar con valores de una población que no distorsionen el estudio.
Supongamos un listado de valores:
A partir de ese listado generaremos una nueva columna auxiliar, utilizando la función JERARQUIA, que nos permitirá ordenar de menor a mayor nuestro listado de valores. Se trata de conocer cuáles son los valores máximos y mínimos:
El siguiente paso, por razones didacticas, sería construir una nueva columna auxiliar 'Listado final', con una fórmula que recoja sólo los valores definidos por el usuario.
Vemos como en el rango de celdas E1:F4 he definido los intervalos de valores a utilizar, en el ejemplo el 30%, es decir, queremos eliminar el 30% de los valores más altos y más bajos. Esto se consigue determinando los extremos del intervalo, nuestros valores válidos deberán estar entre
[F4]=E3*F1 y [E4]=E3*(1-F1) (i.e., entre 2 y 8). En la columna C, de 'Listado final', incluimos la función:
=SI(Y(B2<=$E$4;B2>=$F$4);A2;"")
obteniendo el listado de valores discriminados de los más altos y bajos.
Sobre este 'Listado final' podremos realizar cualquier cálculo estadístico necesario (media, varianzas, elementos o registros, etc).
El ejercicio surge de la petición de un usuario:
...como quitar los datos extremos (ej. el 30 % de los valores más altos y el 30 % de los más bajos) de cada grupo a comparar... |
El problema viene por la necesidad de trabajar con valores de una población que no distorsionen el estudio.
Supongamos un listado de valores:
A partir de ese listado generaremos una nueva columna auxiliar, utilizando la función JERARQUIA, que nos permitirá ordenar de menor a mayor nuestro listado de valores. Se trata de conocer cuáles son los valores máximos y mínimos:
El siguiente paso, por razones didacticas, sería construir una nueva columna auxiliar 'Listado final', con una fórmula que recoja sólo los valores definidos por el usuario.
Vemos como en el rango de celdas E1:F4 he definido los intervalos de valores a utilizar, en el ejemplo el 30%, es decir, queremos eliminar el 30% de los valores más altos y más bajos. Esto se consigue determinando los extremos del intervalo, nuestros valores válidos deberán estar entre
[F4]=E3*F1 y [E4]=E3*(1-F1) (i.e., entre 2 y 8). En la columna C, de 'Listado final', incluimos la función:
=SI(Y(B2<=$E$4;B2>=$F$4);A2;"")
obteniendo el listado de valores discriminados de los más altos y bajos.
Sobre este 'Listado final' podremos realizar cualquier cálculo estadístico necesario (media, varianzas, elementos o registros, etc).
No hay comentarios:
Publicar un comentario
Nota: solo los miembros de este blog pueden publicar comentarios.