Percentil superior por grupo

2

todos. ¿Alguien puede ayudarme con lo siguiente? Cualquier sugerencia o asistencia es apreciada!

Tengo un subconjunto del conjunto de datos con +500,000 filas que se ve así

|— Group —|— Name —|— Value1 —|— Value2 —|

Dentro de cada grupo, intento identificar los nombres en los percentiles 5 y 10 superiores del Valor 1 , de modo que pueda proceder a calcular la suma del valor 2 para cada uno de los percentiles identificados.

Hasta ahora he podido crear una tabla dinámica que se ve así.

           |----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------|     Totals for GroupA
|----------|-Name A1--|     Values.......
|----------|-Name A2--|     Values.......
    ...
|----------|-Name An--|     Values.......
|--GroupB--|----------|     Totals for GroupB
    ...                     Values.......
|--GroupZ--|----------|     Totals for GroupZ

Podría identificar los percentiles manualmente, pero imagino que hay una manera más fácil. He realizado varias búsquedas sobre cómo proceder, pero solo encuentro procedimientos para encontrar percentiles entre todo el conjunto de datos.

HolaGonzalo
fuente
1
Parece que está presentando una fila de encabezado para algunos datos y un esquema para un producto de trabajo intermedio que cree que podría ser útil pero que no le está dando lo que desea. Intente publicar algunos datos reales junto con los encabezados y las plantillas, y una representación de los resultados que desea para esos datos de entrada. No tiene que ser datos reales, en vivo ; de hecho, es mejor si no lo es. Los grupos pueden ser "gato", "perro", "zorro", "rojo", "azul", "verde", etc .; los nombres pueden ser "Tom", "Dick", "Harry", "John", Paul ", George" y "Ringo"; los valores pueden ser 1, 2, 4, 8, 10, 20, 40, 80.… (Cont.)
G-Man
(Cont.) ... Por favor no responda en comentarios; edite su pregunta para que sea más clara y completa.
G-Man
No creo que haya una manera fácil de hacerlo. Probablemente necesite columnas auxiliares donde calcule la suma por categoría ( SUMIF) y percentil ( LARGE, SUMIFS).
Máté Juhász

Respuestas:

1

La forma en que se configura su tabla dinámica, aplicando un filtro de top 10 para Namesencontrar la parte superior Namesdentro de cada uno Group. Si desea encontrar la parte superior Namesgeneral, debe colocar el Namescampo antes del Groupcampo.

Aquí hay una maqueta que hice:

Original

Cuando filtro para Top 2 Names:

Los 2 nombres principales

Cuando pongo Namescomo el campo superior y luego filtro para el Top 2:

2 nombres corregidos


Como se sugiere en los comentarios, también podría agregar columnas auxiliares a sus datos originales que calculen el impacto de cada fila y luego determinar si está en el Top 10 y devolver VERDADERO / FALSO. Luego, podría aplicar un filtro a la tabla dinámica para mostrar solo aquellos con VERDADERO en ese campo.

Tostadas de ingeniero
fuente