Estoy entrevistando a personas para un puesto de desarrollador / investigador de algoritmos en un contexto de estadísticas / aprendizaje automático / minería de datos.
Estoy buscando preguntas para determinar, específicamente, la familiaridad, comprensión y fluidez de un candidato con la teoría subyacente, por ejemplo, propiedades básicas de expectativa y variación, algunas distribuciones comunes, etc.
Mi pregunta actual es: "Hay una cantidad desconocida que nos gustaría estimar. Para este fin tenemos estimadores que, dados , son todos imparciales e independientes, y cada uno tiene una varianza conocida , diferente para cada uno. Encuentre el estimador óptimo que es imparcial y tiene una varianza mínima ".σ 2 i Y =
Esperaría que cualquier candidato serio lo manejara con facilidad (dado un tiempo para resolver los cálculos), y sin embargo, me sorprende la cantidad de candidatos que supuestamente provienen de campos relevantes no logran ni el más mínimo progreso. Por lo tanto, lo considero una buena pregunta discriminatoria. El único problema con esta pregunta es que es solo una.
¿Qué otras preguntas se pueden usar para esto? Alternativamente, ¿dónde puedo encontrar una colección de tales preguntas?
fuente
Respuestas:
¿Qué quieres que haga tu desarrollador de estadísticas?
El ejército de los Estados Unidos dice "entrenarás para luchar, porque lucharás como si estuvieras entrenado". Pruébalos en lo que quieres que hagan todo el día. Realmente, desea que "creen valor" o "ganen dinero" para la empresa.
Jefe 101
Piensa "muéstrame el dinero".
Nota: Si su pregunta de manipulación simbólica no se conecta limpiamente con el "dinero", entonces podría estar haciendo la pregunta incorrecta.
Hay 3 cosas que todo empleado debe hacer para ser empleado:
Si no obtienes estos sólidos, ninguna otra respuesta te servirá de nada.
Si puede reemplazarlos con una buena pieza de software o un adolescente bien entrenado, entonces eventualmente tendrá que hacerlo y le costará.
Datos 101
Lo que deberían poder hacer:
(regresión / ajuste incluyendo modelos lineales, glm, base radial,
ecuaciones de diferencia), es cierto que "x "(prueba de hipótesis), cuántas muestras necesito (muestreo de aceptación), cómo obtengo la mayor cantidad de
datos de pocos experimentos / baratos / eficientes (diseño estadístico del
experimento) - descargo de responsabilidad, soy ingeniero, no estadístico. Puede preguntarles la pregunta "¿cuáles son las diferentes tareas fundamentales y cómo evalúa que el estadístico puede hacerlas de manera eficiente y correcta?
Deben poder leer desde csv, xlsx (excel), SQL e
imágenes. (HDF5, Rdata) Si tiene un formato personalizado, deberían
poder leerlo y trabajar con las herramientas de manera rápida y
eficiente. Deben conocer la fuerza / debilidad del formato. CSV es de uso rápido, ha existido desde siempre, prototipo rápido, pero hinchado, ineficiente y lento de ejecutar.
personas dicen "hay mentiras, malditas mentiras y estadísticas", pero no en mi
empresa. La misma buena entrada da la misma buena salida. El resultado no es un número, siempre es una decisión comercial que informa una
acción técnica y da como resultado un resultado comercial. Diferentes pruebas pueden establecer el dial en 5.5 o 6.5, pero la capacidad siempre es superior a 1.33.
decisiones y / o los desarrolladores de minions, y / o ellos mismos en un año, puedan
entender con la menor cantidad de errores. Una cosa hermosa es poder explicarlo para que tu abuela lo entienda. Este ( enlace ) es mi respuesta, pero me gusta.
Zingers analíticos:
Creo que las preguntas imposibles son geniales. Son imposibles por una razón. Ser bueno saber si algo es imposible por la puerta es algo bueno. Saber por qué, tener algunas formas de involucrarlo o poder hacer una pregunta diferente puede ser mejor.
Otras preguntas de CV. ( enlace ) En reddit. ( enlace ) otros ( enlace )
Por cierto: esta fue una buena pregunta. Puede que tenga que actualizar esta respuesta con el tiempo.
fuente