Hangulatelemzés Excelben! Van egy ingyenes kiegészítő a Microsoft Labs-tól, amely lehetővé teszi az érzelmek elemzését az Excelben. Mi van, ha több száz felmérésből kell átgondolnia, hogy megtudja, mit gondolnak az emberek a vállalatáról? Az Excel hozzárendelhet egy valószínűséget, amely megmutatja az egyes megjegyzések mennyire pozitív vagy negatív.
Videót nézni
- Könnyű számszerűsíteni a felmérés adatait, ha feleletválasztós
- Pivot táblázat segítségével megtudhatja, hogy az egyes válaszok hány százalékkal rendelkeznek
- De mi van a szabad formájú szöveges válaszokkal? Ezeket nehéz feldolgozni, ha több száz vagy több ezer ilyen van.
- A hangulatelemzés egy gépalapú módszer annak megjóslására, hogy a válasz pozitív vagy negatív.
- A Microsoft olyan eszközt kínál, amely hangulatelemzést végez az Excelben - Azure Machine Learning.
- A hagyományos hangulatelemzés megköveteli, hogy egy ember elemezze és kategorizálja az állítások 5% -át.
- A hagyományos hangulatelemzés nem rugalmas - az egyes iparágak számára átépíti a szótárt.
- Az Excel az MPQA szubjektivitási lexikont használja (erről olvassa el a http: // bit. Ly / 1SRNevt címet)
- Ez az általános szótár 5097 negatív és 2533 pozitív szót tartalmaz
- Minden szóhoz erős vagy gyenge polaritás tartozik
- Ez kiválóan használható rövid mondatok, például tweetek vagy Facebook-bejegyzések esetén
- A kettős negatívumok megbolondíthatják
- A telepítéshez lépjen a Beszúrás, az Excel Store webhelyre, és keresse meg az Azure Machine Learning elemet
- Adjon meg egy bemeneti tartományt és két üres oszlopot a kimeneti tartományhoz.
- A bemeneti tartomány fejlécének meg kell egyeznie a következő sémával: tweet_text
- Társcikk: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/
Videó átirat
Az Excel megismerése a Podcast 2062-es epizódjából: Hangulatelemzés az Excelben
Ó, hé, ez egy hálaadás estéje volt, és a sütőtök pite körül ültünk, és Jes, barátunk, elkezdett arról beszélni, hogy hangulatelemzést végezzen a Twitter-adatokon. És azt mondtam: "Hé, tudod, hogy az Excelnek módja van hangulatelemzésre." És rájöttem, hogy nem volt jó videóm erről, vagy erről készült videó, ezért ez a videó arról szól, hogy hangulatelemzést végezzünk Excel-ben.
Most az első kérdés az, hogy mi a fene az érzelemelemzés? És ha felmérést készít az ügyfelekről, és feleletválasztós lehetőséggel rendelkezik, ahol 1 és 5 között választhatnak, akkor ezt nagyon-nagyon egyszerűen lehet elemezni. Csak létrehozhat egy kis pivot táblát: Helyezze be a pivot táblát, a Létező munkalap itt, kattintson az OK gombra. Tudni akarjuk az ott feltett kérdést vagy a kérdésre adott választ, majd azt, hogy hány válasz volt mindegyikre, és ez adja meg az abszolút számot. Akár ide is bejöhet, és megváltoztathatja ezt a Mezőbeállításokról az Értékek megjelenítése az Oszlop teljes% -ában értékre.
Rendben, így minden válasznál láthatja, hogy az emberek hány százaléka kap választ. Rendben, de az érzelemelemzés arra az esetre szól, amikor nagyon hosszú válaszod van, amikor azt mondod: "Hé, rendben, jól tudod, mondd el, miért adtad meg nekünk ezt a választ?" És tudják, mondatokat vagy bekezdéseket használnak. Nos, ha ezek százai vagy ezerjei vannak, akkor nagyon nehéz valakinek átélnie és elolvasnia mindet, és rájönni, hogy mi történik, rendben?
Tehát kétféle hangulatelemzés létezik. A múltban általában emberi felügyelet alatt álló tanulási algoritmust használt. Tehát, ha 5000 válaszod van, akkor tudd át, tudod, ezekből 200-at, és válaszd a pozitív és a negatív szavakat és kifejezéseket. Lényegében a pozitív és negatív szavak szótárát építed; de tudod, ez nagyon korlátozó volt. Ha ezt olyan helyre tette, ahol autójavítást végeztek, és akkor más vásárlója volt, akkor tudja, ki végezte a szőnyegtisztítást, ez a két szótár teljesen más. A gépi tanulást vagy az ember által felügyelt tanulást kell elvégeznie újra és újra és újra. Tehát az Excel használja az MPQA szubjektivitási lexikon nevű dolgot, és ezt a Google-ra fordíthatja. Meg vannak róla az információk - 5097 negatív szó, 2533 pozitív szó. És aztán,kiválóan működik rövid mondatok, vagy tweetek vagy Facebook-bejegyzések esetén. De egy dolgot észrevettem, hogy ha valaki kettős negatívummal ír, akkor nem mondhatom, hogy nem utálom ezt a funkciót, nos, ott a gépi tanulás kudarcot vall. És a fene se sikerül. Nem tudom megmondani, hogy boldogok-e vagy sem.
Rendben, szóval itt tesszük. Az Excel 2013 vagy az Excel 2016 alkalmazásban lépjen a Beszúrás fülre, menjen az áruházba, amikor a keresőmező megjelenik az Azure Machine keresésére, és ott kapja meg az Azure Machine Learning szolgáltatást. Kattintson a Hozzáadás gombra. Rendben, és két különböző eszköz van itt: a Titanic Survivor Predictor, ami szórakoztató; és a Text Sentiment analysis Excel bővítmény. Használjuk azt. Rendben, íme néhány dolog, ami felkavar. Címe: Vegyen egy bekezdést a válaszának magyarázatára. Meg kell egyeznie a sémával, és a séma azt mondja, hogy a címsornak tweet_text kell mondania. Tehát itt fent: tweet_text, természetesen a kis- és nagybetűkkel kapcsolatos ügyek, rendben. Ezután zárja be a sémát, majd a Jóslás, Bemenet: A1-től 100-ig, Adataim fejléceket tartalmaznak, Kimenet: DataB1, Tartalmazza a fejléceket. 2 oszlopot adnak nekünk.Ellenőrizze, hogy van-e ott 2 üres oszlop; különben felül fogja írni az adatokat. 2 választási lehetősége van: Egyszerre néhány sor vagy Tételenként. Ez csak száz, tehát valójában mindegy. A Predict és a BAM lehetőséget választom! Csak olyan gyorsan.
Rendben, most kapunk 2 oszlopot: kapunk egy hangulatot és egy pontszámot, rendben. Tehát ábrázoljuk itt a pontszámokat százalékban, egy csomó tizedesjegygel. Rendben, tehát 47,496, ez 0 és 100% között mozog. A közel 100 rendkívül pozitív, a 0 közelében rendkívül negatív, rendben? Tehát itt van egy, ahol kisebb probléma van, megőrjít. Nem találja a megoldást, így láthatja, hogy miért minősítik ezt rendkívül negatívnak. Nézzünk meg egyet, ami rendkívül pozitív. Rendben, szóval tudod, ezért van itt néhány boldog szavunk: kérem és köszönöm, felkiáltójelek és így tovább. Ez hozzájárulhat a magas pontszámhoz. Rendben, szóval tökéletes? Nem, de gyorsan és gyorsan megtudhatja, hány ember örül vagy rendkívül negatívan válaszolja ezeket a válaszokat.
És természetesen itt is megtehetjük ezt egy pivot táblával: Insert, Pivot Table, lépjen ide egy Létező munkalapra, kattintson az OK gombra, és érdekel minket a Sentiment, és akkor talán az átlagos pontszám azok mindegyike. Tehát ezt megváltoztatjuk a Mezőbeállítások alatt Átlag értékre, kattintson az OK gombra. És így, vagy akár egy gróf. Azt hiszem, szeretnénk tudni a grófot, hány embert. Tehát más területet veszünk fel, és így tudjuk, hány ember volt negatív. Ó, hány ember volt semleges, hány ember pozitív és mennyi volt az átlagos pontszám.
Rendben, tehát ha felmérési adatai vannak és feleletválasztós, akkor könnyen használható egy forgatótábla annak kiderítésére, hogy az egyes válaszok hány százalékkal rendelkeznek. De a szabad formájú szöveges válaszokhoz nehéz feldolgozni. Ha több száz vagy több ezer ilyen van, akkor a hangulatelemzés gépi módszer arra, hogy megjósolja, hogy a válasz pozitív vagy negatív. A Microsoft ehhez ingyenes eszközt kínál. Működik az Azure Machine Learning nevű Excel 2013-ban vagy Excel 2016-ban. Általában kézzel kell kézzel átadni és kategorizálni az állítások 5% -át. Ez nem rugalmas, újra kell kategorizálni minden új adatsort, de az Excel ezt az MPQA szubjektivitási lexikont használja. Ez egy általános szótár. Rövid mondatokra, Tweetekre, Facebook-bejegyzésekre fog menni. A kettős negatívok el tudnak téveszteni. Tehát csak menjen az Excel Store-ba,keresse meg az Azure Machine Learning elemet. Adjon meg egy bemenetet és egy két oszlopot a kimeneti tartományhoz. Ebben az esetben ne felejtse el megváltoztatni a címsort, hogy az megfeleljen a Séma, tweet_text értéknek.
Rendben, szóval tessék. Legközelebb, amikor nagy mennyiségű adatot kell elemeznie, nézze meg az Azure Machine Learning, az Excel 2013 ingyenes kiegészítőjét. Köszönjük, hogy betért, legközelebb találkozunk egy újabb netcast-lal.
Fájl letöltése
Töltse le a minta fájlt innen: Podcast2062.xlsm