Gyermekágy körülbelül statisztikai hibák és a pontosság és az algoritmusok
Oszd meg a post „bölcsőt körülbelül statisztikai hibák és a pontosságot a algoritmusokat.”
A legfontosabb dolog a statisztika - hogy tudja, hogyan tévedsz. Ezért, sok különböző módon lehet kiszámítani a hibát az algoritmus, hogy megértsék, hogy pontosan úgy gondolta, amit gondolt, és mi vagy valójában. Ebben a bejegyzésben írtam a paradoxon Simpson, Type I és II típusú hiba, a pontosság és a hatalom algoritmusok.
Mivel minden dolog lehet elmondani, így és így kell mondani az embereknek, hogy megértsék, mi meg fogja vizsgálni egy érdekes példát (vagy akár azért, mert a példák betegségek és diagnózisok kaptam is).
Cél az USA-ban, ez olyan, mint a mi szalagot. Adatokon alapuló elemzés (a nagy volumenű), azt javasoljuk termékek, kedvezmények küldését hagyományos postai úton (az USA-ban, emlékszem!). És van még egy apa meglepődött, hogy a lányom jön a cél egy katalógus, és kedvezményekkel termékek a terhes ... Ő általában jött őket sikoly ... és azt kérték, hogy indítsa el a vizsgálatot elvégezni. Általában változó preferenciáit a vásárlást, akkor volt a legtöbb lány már megtanulta, hogy itt az ideje, hogy részt vegyen a babakocsi.
Ebben az esetben mi kódjai megegyeznek a valós helyzetet és előrejelzések. Ezt nevezik a valódi pozitív lehetőséget.
Ha egy lány vásárolt a személyi igazolvány (vagy hitelkártya, attól függően, hogy hogyan kapcsolódik Target'e információ) dolgot terhes barátnője, és ő volna küldeni után a könyvtárba, akkor az algoritmus hiba lenne az első fajta (hamis pozitív oldat).
Ha a könyvtár a várandós nő nem küldött elemzésével vásárlás, akkor lenne egy másodrendű hiba (hamis negatív opció). A klasszikus magyarázat a téma, mindig azt mondják, hogy a téves negatív eredmény - valószínűleg tekinthető egy beteg ember egészséges, ha építeni hipotéziseket.
Nos, ez is egy lehetőség, ha ő nem terhes, és ő nem küld a katalógus - az algoritmus helyesen kezelni és nem történt semmi. Igaz negatív lehetőség.
A szint jelentőségét és erejét a teszt (vagy algoritmus)

A hiba valószínűségét az első fajta az úgynevezett szignifikanciaszint. Általános szabály, hogy ezen a szinten vannak megvezetve, választott algoritmusok hipotézisek ellenőrzése a statisztikát. Ez annak a valószínűsége, hogy elutasítja a feltételezést, hogy valóban igaz (a képen a bal oldalon - a helyes értékek)
A hiba valószínűségét a második fajta - annak a valószínűsége, hogy elfogadja azt a hipotézist, ha ez valójában nem igaz. De önmagában a valószínűsége, hogy a második fajta hiba senkinek nincs szükség, és a kívánt értéket 1 - ez a valószínűség. Ez - erejét a tesztet. Ez azt mutatja, hogy mennyire jól az algoritmus választja el a közeli a hipotézis, amikor osztályok nagyon hasonlóak.
Példánkban az algoritmus fejlesztésén érzékenység vezet fokozott kockázatával típusú hiba (téves riasztás, Vakriasztási) és az érzékenység csökkenése - növeli a II-es típusú hiba (hamis negatív, kihagyva azokat az embereket, akik kedvezményt a termékek lehetnek kamat).
ROC-görbe, görbe hibák
Az érték a hiba az első fajta vagy a második fajta nem ad tájékoztatást, hogy milyen jó egy algoritmus egészére. van egy nagy metrikus megérteni, hogy milyen jó egy algoritmus, illetve kritérium, - ROC-görbe. Ez megjeleníti azonnal és aránya a helyesen felismert osztályok és ossza tévesen utasította hipotéziseket. Ebben az esetben a felső szám itt - AUC - görbe alatti területet. Mi több, a jobb, ahol 0,5 megfelel egy egyszerű becslés, és 1-100% helyes előrejelzéseket.
Oszd meg a post „bölcsőt körülbelül statisztikai hibák és a pontosságot a algoritmusokat.”