Jedno od alata za rješavanje ekonomskih problema je analiza klastera. Uz njegovu pomoć, klasteri i drugi objekti niza podataka razvrstavaju se u grupe. Ova se tehnika može primijeniti u Excelu. Da vidimo kako se to radi u praksi.
Korištenje klaster analize
Uz pomoć klaster analize, moguće je provesti uzorkovanje po atributu koji se proučava. Njegov je glavni zadatak podijeliti višedimenzionalni niz u homogene skupine. Kao kriterij grupiranja koristi se koeficijent korelacije para ili euklidska udaljenost između objekata danim parametrom. Vrijednosti koje su najbliže jedna drugoj grupirane su.
Iako se ova vrsta analiza najčešće koristi u ekonomiji, ona se može koristiti i u biologiji (za razvrstavanje životinja), psihologiji, medicini i na mnogim drugim područjima ljudske aktivnosti. Analiza klastera može se primijeniti korištenjem standardnog programa Excel alata za ove svrhe.
Primjer upotrebe
Imamo pet objekata koji odlikuju dva proučena parametra - x i y.
- Na ove vrijednosti primjenjujemo euklidsku formulu udaljenosti koja se izračunava prema predlošku:
= KORAK ((x2-x1) ^ 2 + (y2-y1) ^ 2)
- Ta se vrijednost izračunava između svakog od pet objekata. Rezultati izračuna nalaze se u matrici udaljenosti.
- Gledamo između kojih vrijednosti je udaljenost najmanje. U našem primjeru to su predmeti 1 i 2. Udaljenost između njih je 4.123106, što je manje nego između bilo kojeg drugog elementa ove populacije.
- Kombinirajte ove podatke u grupu i formirajte novu matricu u kojoj su vrijednosti 1,2 djeluju kao poseban element. Kada sastavljamo matricu, za kombinirani element ostavljamo najmanje vrijednosti iz prethodne tablice. Opet gledamo, između kojih elemenata je udaljenost minimalna. Ovaj put je 4 i 5kao i objekt 5 i grupu objekata 1,2. Udaljenost je 6.708204.
- Navedene elemente dodamo u opći klaster. Formiramo novu matricu po istom principu kao i prethodni put. Odnosno, tražimo najmanje vrijednosti. Tako vidimo da se naš skup podataka može podijeliti u dva klastera. Prvi klaster sadrži elemente koji su najbliži jedni drugima - 1,2,4,5. U drugom klasteru u našem slučaju predstavljen je samo jedan element - 3. Relativno je daleko od ostalih objekata. Udaljenost između klastera je 9,84.
Ovim se dovršava procedura podjele stanovništva u grupe.
Kao što vidite, iako se generalno analiza klastera može činiti kompliciranim postupkom, u stvari, razumjeti nijanse ove metode nije tako teško. Glavna stvar je razumjeti osnovni obrazac grupiranja.