Da li se k-srednja mogu koristiti za kategorizaciju tekstualnih podataka?

Sadržaj:

Da li se k-srednja mogu koristiti za kategorizaciju tekstualnih podataka?
Da li se k-srednja mogu koristiti za kategorizaciju tekstualnih podataka?

Video: Da li se k-srednja mogu koristiti za kategorizaciju tekstualnih podataka?

Video: Da li se k-srednja mogu koristiti za kategorizaciju tekstualnih podataka?
Video: Дженнифер Пэн, дочь из ада, документальный фильм о наст... 2024, Novembar
Anonim

K-means je klasični algoritam za grupisanje podataka u rudarenju teksta, ali se rijetko koristi za odabir karakteristika. … Koristimo metodu k-means da uhvatimo nekoliko centara klastera za svaku klasu, a zatim izaberemo riječi visoke frekvencije u centrima kao tekstualne karakteristike za kategorizaciju.

Da li k-means radi sa kategoričkim podacima?

Algoritam k-Means nije primjenjiv na kategoričke podatke, pošto su kategoričke varijable diskretne i nemaju nikakvo prirodno porijeklo. Dakle, izračunavanje euklidske udaljenosti za prostor kao što je prostor nije smisleno.

Mogu li se k-sredstva koristiti za grupisanje teksta?

K-means grupiranje je tip metode nenadgledanog učenja, koja se koristi kada nemamo označene podatke kao što je u našem slučaju, imamo neoznačene podatke (znači, bez definisanih kategorija ili grupa). Cilj ovog algoritma je pronaći grupe u podacima, dok br. grupa je predstavljena varijablom K.

Možemo li koristiti k-srednja za klasifikaciju?

KMeans je algoritam za grupisanje koji deli opažanja u k klastera. Pošto možemo diktirati količinu klastera, lako se može koristiti u klasifikaciji gdje podatke dijelimo na klastere koji mogu biti jednaki ili veći od broja klasa.

Koji je algoritam grupisanja najbolji za tekstualne podatke?

za grupisanje tekstualnih vektora možete koristiti hijerarhijske algoritme za grupisanje kao što je HDBSCAN koji takođe uzima u obzir gustinu. u HDBSCAN-u ne morate dodijeliti broj klastera kao u k-means i robusniji je uglavnom u bučnim podacima.

Preporučuje se: