Pojawiły się wysypki z tweetami i blogami, które ostatnio mówiły o problemach ze stosowaniem średnich w marketingu PPC. Na przykład ta, w której Julie Bacchini twierdzi, że "średnie są mierną miarą":
Chociaż prawdą jest, że czasami średnie mogą być bardzo mylące, problem z powyższym zbiorem danych to ogromna różnica populacji i standardowe odchylenie w próbie.
$config[code] not foundW tym poście chcę porozmawiać na temat matematyki, która jest tutaj zaangażowana, i przedstawić argumenty przemawiające za wartościami średnich, a także odpowiedzieć na niektóre z krytyki raportowania średnich, które ostatnio widziałem w społeczności PPC.
Wariancja, odchylenie standardowe i współczynnik wariancji
Zmienność próbki to miara rozproszenia - o ile wartości w zbiorze danych mogą się różnić od średniej wartości Twojego zbioru danych. Oblicza się ją, biorąc średnią z kwadratów różnic dla każdego punktu danych od średniej. Wyrównanie różnic zapewnia, że ujemne i dodatnie odchylenia nie znoszą się nawzajem.
Tak więc dla klienta 1, obliczyć różnicę między 0,5 procent a średnią zmianę 3,6 procent, a następnie kwadrat tej liczby. Zrób to dla każdego klienta, a następnie weź średnią wariancji: to jest wariancja próbki.
Odchylenie standardowe próbki jest po prostu pierwiastkiem kwadratowym wariancji.
Mówiąc najprościej, wartości w tym zestawie danych zazwyczaj spadają o 5,029 procent w stosunku do ogólnej średniej wynoszącej 3,6 procent (to jest liczby są bardzo rozproszone), co oznacza, że nie można wiele zawrzeć z tej dystrybucji.
Uproszczony sposób oszacowania, czy odchylenia standardowe są "zbyt wysokie" (zakładając, że szukasz normalnego rozkładu), to obliczenie współczynnika wariancji (względnego odchylenia standardowego), który jest po prostu odchyleniem standardowym podzielonym przez średnią.
Co to oznacza i dlaczego powinno nas to obchodzić? Chodzi o wartość raportowania średnich. Kiedy WordStream wykonuje badanie z wykorzystaniem danych klienta, nie tylko obliczamy średnie z małych zestawów danych i wyciągamy duże wnioski - zależy nam na dystrybucji danych. Jeśli liczby są wszędzie, wyrzucamy je i próbujemy posegmentować próbkę w inny sposób (według branży, wydatków itp.), Aby znaleźć bardziej znaczący wzorzec, z którego możemy śmiało wyciągać wnioski.
Nawet znaczące średnie według definicji obejmują wartości powyżej i poniżej średniej
Inną linią krytyki ze strony antyniezależnego obozu jest przekonanie, że średnia nie mówi dla całej populacji. Jest to oczywiście zgodne z definicją.
Tak, średnie zawierają punkty danych, które mieszczą się powyżej i poniżej średniej. Ale to nie jest dobry argument za całkowitym wyrzuceniem średnich.
Zakładając normalną dystrybucję, można by oczekiwać, że około 68 procent punktów danych spadnie o +/- 1 standardowe odchylenie od średniej, 95 procent w odchyleniach standardowych +/- 2 i 99,7 procent w odchyleniach standardowych +/- 3, jak pokazano tutaj.
Jak widać, wartości odstające z pewnością istnieją, ale jeśli masz wąską standardową dystrybucję w swoim zestawie danych, nie są one tak powszechne, jak mogłoby się wydawać. Jeśli więc będziesz uważać na matematykę, uśrednione mogą być bardzo przydatnymi informacjami dla większości reklamodawców.
W marketingu PPC matematyka wygrywa
Nie wyrzucajmy średniej z kąpielą. W końcu prawie wszystkie dane o skuteczności w AdWords (CTR, CPC, średnia pozycja, współczynniki konwersji itp.) Są podawane jako wartości średnie.
Zamiast ignorować średnie, wykorzystajmy siłę matematyki, aby dowiedzieć się, czy średnia, na którą patrzysz, ma znaczenie, czy nie.
Publikowane za zgodą. Oryginał tutaj.
Średnia fotografia w Shutterstock
Więcej w: Treść kanału wydawcy