Calcular Significancia de Test A/B

Determina si los resultados de tu test A/B son estadisticamente significativos usando una prueba Z de dos proporciones.

La Calculadora de Significancia de Test A/B determina si la diferencia en las tasas de conversion entre dos variantes es estadisticamente significativa. Usando una prueba Z de dos proporciones con proporcion combinada, calcula valores p, niveles de confianza, incremento relativo y estimaciones de potencia estadistica. Ya sea que estes optimizando landing pages, campanas de email o caracteristicas de productos, esta herramienta te brinda un analisis estadistico riguroso directamente en tu navegador sin procesamiento en servidor y sin registro requerido.

Analyzing Variants...
Tus datos no salen de tu navegador
¿Te ha sido útil está herramienta?
Tutorial

Como usar

1
1

Ingresa los Datos del Control

Introduce el numero de visitantes y conversiones para tu grupo de control (Variante A). Este es tipicamente tu pagina o diseno original.

2
2

Ingresa los Datos de la Variacion

Introduce el numero de visitantes y conversiones para tu grupo de variacion (Variante B). Este es el competidor que deseas comparar contra el control.

3
3

Revisa los Resultados

La herramienta calcula instantaneamente las tasas de conversion, el incremento relativo, el valor p y el nivel de confianza. Verifica si tu resultado es estadisticamente significativo al 90%, 95% o 99% de confianza.

Guide

Guia Completa de Significancia Estadistica en Tests A/B

Que es un Test A/B?

Un test A/B (tambien llamado test de division) es un metodo para comparar dos versiones de una pagina web, email u otro activo digital para determinar cual funciona mejor. Los visitantes se asignan aleatoriamente al control (A) o a la variacion (B), y su comportamiento se mide contra una metrica predefinida como la tasa de conversion. El objetivo es tomar decisiones basadas en datos en lugar de depender de la intuicion.

Entendiendo la Significancia Estadistica

La significancia estadistica te ayuda a determinar si una diferencia observada entre dos grupos es probablemente real o simplemente el resultado de variacion aleatoria. En tests A/B, el umbral estandar es un nivel de confianza del 95% (valor p < 0.05). Esto significa que solo hay un 5% de probabilidad de que la diferencia observada haya ocurrido por casualidad.

La Prueba Z de Dos Proporciones

Esta calculadora usa la prueba Z de dos proporciones, un metodo ampliamente aceptado para comparar dos proporciones independientes. La prueba calcula una proporcion combinada de ambos grupos, deriva el error estandar, computa un puntaje Z que representa el numero de desviaciones estandar entre las dos tasas, y lo convierte en un valor p.

Errores Comunes en Tests A/B

El error mas comun es espiar los resultados antes de alcanzar el tamano de muestra requerido, lo que infla las tasas de falsos positivos. Otros errores incluyen ejecutar tests por periodos demasiado cortos, probar demasiadas variantes sin corregir por comparaciones multiples, e ignorar la diferencia entre significancia estadistica y significancia practica.

Examples

Ejemplos Resueltos

Ejemplo: Test de Color de Boton en Landing Page

Dado: Variante A tiene 10,000 visitantes con 500 conversiones. Variante B tiene 10,000 visitantes con 550 conversiones.

1

Paso 1: Tasa A = 500/10000 = 5.00%. Tasa B = 550/10000 = 5.50%.

2

Paso 2: Proporcion combinada = (500+550)/(10000+10000) = 0.0525.

3

Paso 3: SE = sqrt(0.0525 * 0.9475 * (1/10000 + 1/10000)) = 0.00316.

4

Paso 4: Z = (0.055 - 0.05) / 0.00316 = 1.583.

5

Paso 5: valor p = 2 * (1 - normalCDF(1.583)) = 0.1135.

Resultado: valor p = 0.1135. No significativo al 95% de confianza.

Ejemplo: Test de Asunto de Email

Dado: Asunto A enviado a 5,000 destinatarios con 750 aperturas. Asunto B enviado a 5,000 destinatarios con 900 aperturas.

1

Paso 1: Tasa A = 750/5000 = 15.00%. Tasa B = 900/5000 = 18.00%.

2

Paso 2: Proporcion combinada = (750+900)/(5000+5000) = 0.165.

3

Paso 3: SE = sqrt(0.165 * 0.835 * (1/5000 + 1/5000)) = 0.00743.

4

Paso 4: Z = (0.18 - 0.15) / 0.00743 = 4.038.

5

Paso 5: valor p = 2 * (1 - normalCDF(4.038)) = 0.0001.

Resultado: valor p < 0.001. Altamente significativo al 99% de confianza.

Casos de uso

Casos de uso

Test de Titulo de Landing Page

Compara dos titulos diferentes en una landing page para determinar cual genera mas registros con confianza estadistica.

Optimizacion de Asunto de Email

Prueba diferentes asuntos de email midiendo las tasas de apertura en dos segmentos y verifica la significancia antes de implementar el ganador.

Diseno de Pagina de Precios

Evalua si un nuevo diseno de pagina de precios mejora las tasas de conversion de compra comparado con el diseno original.

Test de Color de Boton CTA

Determina si cambiar el color de un boton de llamada a la accion resulta en una mejora estadisticamente significativa en las tasas de clic.

toolSections.formula

Formulas de Prueba Z para Tests A/B

Proporcion Combinada

p^=xA+xBnA+nB\hat{p} = \frac{x_A + x_B}{n_A + n_B}
VariableSignificado
\hat{p}Tasa de conversion combinada
x_A, x_BConversiones en cada variante
n_A, n_BVisitantes en cada variante

Error Estandar

SE=p^(1p^)(1nA+1nB)SE = \sqrt{\hat{p}(1-\hat{p})\left(\frac{1}{n_A}+\frac{1}{n_B}\right)}
VariableSignificado
SEError estandar de la diferencia
\hat{p}Proporcion combinada

Puntaje Z

Z=p^Bp^ASEZ = \frac{\hat{p}_B - \hat{p}_A}{SE}
VariableSignificado
ZEstadistico de prueba
\hat{p}_A, \hat{p}_BTasas de conversion de cada variante

Valor P (dos colas)

p=2×(1Φ(Z))p = 2 \times (1 - \Phi(|Z|))
VariableSignificado
pValor p de dos colas
\PhiCDF normal estandar

Preguntas Frecuentes

?Que es la significancia estadistica en tests A/B?

La significancia estadistica indica la probabilidad de que la diferencia observada entre dos variantes no se deba al azar. Un resultado se considera tipicamente significativo al 95% de confianza (valor p < 0.05), lo que significa que hay menos del 5% de probabilidad de que la diferencia haya ocurrido por casualidad.

?Que formula usa esta calculadora?

Esta calculadora usa la prueba Z de dos proporciones. Calcula una proporcion combinada de ambos grupos, computa el error estandar, deriva un puntaje Z y lo convierte en un valor p de dos colas usando la funcion de distribucion acumulativa normal.

?Cuantos visitantes necesito para un test A/B valido?

El tamano de muestra requerido depende de la tasa de conversion base y el efecto minimo detectable que deseas observar. Como regla general, necesitas al menos varios cientos de conversiones por variante para obtener resultados confiables.

?Que es el valor p?

El valor p representa la probabilidad de observar la diferencia medida (o una mas extrema) si realmente no hubiera diferencia entre las variantes. Un valor p mas bajo significa evidencia mas fuerte contra la hipotesis nula de que no hay diferencia.

?Que significa el nivel de confianza?

El nivel de confianza es igual a 1 menos el valor p, expresado como porcentaje. Un nivel de confianza del 95% significa que hay un 5% de probabilidad de que la diferencia observada se deba a variacion aleatoria.

?Que es la potencia estadistica?

La potencia estadistica es la probabilidad de que la prueba detecte correctamente una diferencia real cuando existe. Una mayor potencia reduce el riesgo de un falso negativo. Apunta a al menos un 80% de potencia para tests A/B confiables.

?Puedo probar mas de dos variantes?

Esta calculadora esta disenada para tests A/B de dos variantes. Para pruebas con tres o mas variantes (tests A/B/n), necesitarias metodos estadisticos diferentes como ANOVA o correcciones por comparaciones multiples.

?Mis datos son privados al usar esta herramienta?

Absolutamente. Todos los calculos se ejecutan completamente en tu navegador. Ningun dato se envia a ningun servidor ni se almacena en ningun lugar. Los datos de tu test permanecen completamente privados.

?Esta calculadora de tests A/B es gratuita?

Si. Esta herramienta es completamente gratuita sin limites de uso y no requiere registro ni instalacion.

?Cuando debo detener un test A/B?

Detiene un test solo despues de alcanzar un tamano de muestra o duracion predeterminada. Verificar los resultados repetidamente y detenerse cuando se encuentra significancia (espiar) infla las tasas de falsos positivos.

Ayúdanos a mejorar

¿Qué te parece está herramienta?

Cada herramienta de Kitmul se construye a partir de peticiones reales de usuarios. Tu valoración y tus sugerencias nos ayudan a arreglar bugs, añadir funciones que faltan y construir las herramientas que realmente necesitas.

Valora está herramienta

Pulsa una estrella para contarnos lo útil que te ha resultado.

Sugiere una mejora o reporta un bug

¿Te falta alguna función? ¿Has encontrado un falló? ¿Tienes una idea? Cuéntanoslo y lo revisaremos.

Herramientas relacionadas

Lectura Recomendada

Libros Recomendados sobre Tests A/B y Marketing Basado en Datos

Cómo asociado de Amazon, ganamos con las compras que califican.

Potencia tus Capacidades

Herramientas Profesionales para Analisis de Datos

Cómo asociado de Amazon, ganamos con las compras que califican.

Boletín

Recibe Consejos de Productividad y Nuevas Herramientas Primero

Únete a creadores y desarrolladores que valoran la privacidad. En cada edición: nuevas herramientas, trucos de productividad y novedades — sin spam.

Acceso prioritario a nuevas herramientas
Cancela en cualquier momento, sin preguntas