Ortiqcha miqdorlarni hisoblang

Muallif: Charles Brown
Yaratilish Sanasi: 8 Fevral 2021
Yangilanish Sanasi: 1 Iyul 2024
Anonim
Umumiy kimyo
Video: Umumiy kimyo

Tarkib

A tashqarida yoki tashqarida statistika - bu namunadagi boshqa ma'lumotlar punktlaridan sezilarli darajada farq qiladigan ma'lumotlar nuqtasi. Ko'pincha, haddan tashqari ko'rsatkichlar statistik xodimlarga o'lchovdagi nomuvofiqlik yoki xatolarga ishora qiladi, shundan so'ng ular ma'lumotlar to'plamidan ustunlikni olib tashlashlari mumkin. Agar ular haqiqatan ham ma'lumotlar to'plamidan yuqori ko'rsatkichlarni olib tashlashni tanlasalar, bu tadqiqot natijasida olingan xulosalarda sezilarli o'zgarishlar bo'lishi mumkin. Shuning uchun statistik ma'lumotlarni to'g'ri talqin qilishni istasangiz, hisob-kitoblarni hisoblash va aniqlash kerak.

Qadam bosish

  1. Mumkin bo'lgan tashqi ko'rsatkichlarni qanday aniqlashni bilib oling. Anomal qiymatlarni ma'lum bir ma'lumot to'plamidan olib tashlash to'g'risida qaror qabul qilishdan oldin, albatta, avval ma'lumotlar to'plamidagi mumkin bo'lgan chegaralarni aniqlashimiz kerak. Umuman olganda, ustunliklar bu to'plamdagi boshqa qiymatlarni hosil qiladigan tendentsiyadan sezilarli darajada chetga chiqadigan ma'lumotlar nuqtalari - boshqacha qilib aytganda, ular otib tashlang boshqa qadriyatlar. Odatda buni jadvallarda va (ayniqsa) grafikalarda aniqlash oson. Agar ma'lumotlar to'plami vizual ravishda chizilgan bo'lsa, natijalar boshqa qiymatlardan "uzoq" bo'ladi. Masalan, agar ma'lumotlar to'plamidagi aksariyat nuqtalar to'g'ri chiziqni tashkil qilsa, haddan tashqari ko'rsatkichlar ushbu chiziqqa mos kelmaydi.
    • Xonadagi 12 xil ob'ektning haroratini ko'rsatadigan ma'lumotlar to'plamini ko'rib chiqamiz. Agar 11 ta narsaning harorati ko'pi bilan 21 ° C atrofida bir necha darajaga o'zgarib tursa, bitta ob'ekt, ya'ni pechning harorati 150 ° C ga teng bo'lsa, siz bir qarashda pechning bundan ustunroq ekanligini ko'rishingiz mumkin.
  2. Barcha ma'lumotlar punktlarini pastdan balandgacha saralash. Ortiqcha natijalarni hisoblashda birinchi qadam ma'lumotlar to'plamining o'rtacha qiymatini (yoki o'rtacha qiymatini) topishdir. To'plamdagi qiymatlar eng pastdan yuqoriga qarab tartibda bo'lsa, bu vazifa ancha osonlashadi. Shunday qilib davom ettirishdan oldin ma'lumotlar bazangizdagi qiymatlarni shunday tartiblang.
    • Yuqoridagi misol bilan davom etamiz. Xonadagi turli xil narsalarning Farangeyt darajasidagi haroratini ko'rsatadigan ma'lumotlar to'plamimiz: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Agar biz to'plamdagi qiymatlarni eng pastdan yuqoriga qarab saralasak, bu bizning yangi to'plamimiz bo'ladi: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. Ma'lumotlar to'plamining o'rtacha qiymatini hisoblang. Ma'lumotlar to'plamining medianisi - bu ma'lumotlarning yarmi uning ustida joylashgan va ma'lumotlarning yarmi uning ostida joylashgan ma'lumotlar nuqtasi, bu aslida ma'lumotlar to'plamining "markazi" dir. Agar ma'lumotlar to'plami toq sonli nuqtalarni o'z ichiga oladigan bo'lsa, mediani topish oson - medianing yuqoridagi nuqtalari quyida ko'rsatilgan nuqtalar. Agar bir nechta nuqta bo'lsa, chunki bitta markaz mavjud emas, mediani topish uchun ikkita markaziy nuqtaning o'rtacha qiymatini olish kerak. Ortiqcha qiymatlarni hisoblashda, median odatda Q2 o'zgaruvchisi bilan ataladi - chunki u Q1 va Q3 orasida, birinchi va uchinchi kvartillarda joylashgan. Ushbu o'zgaruvchilarni keyinroq aniqlaymiz.
    • Ma'lumotlar to'plamlari bilan juft sonli raqamlar bilan adashtirmang - ikkita o'rtacha nuqtaning o'rtacha qiymati, odatda ma'lumotlar to'plamining o'zida bo'lmagan raqam - bu yaxshi. Ammo, agar ikkita o'rtacha nuqta bir xil bo'lsa, o'rtacha qiymat, albatta, bu raqam bo'ladi - bu ham xop.
    • Bizning misolimizda 12 ochko bor. O'rta ikki atama mos ravishda 6 va 7 - 70 va 71-bandlarni tashkil etadi, shuning uchun bizning ma'lumotlar to'plamimizning o'rtacha qiymati ushbu ikki nuqtaning o'rtacha qiymatidir: ((70 + 71) / 2) =70,5.
  4. Birinchi kvartilni hisoblang. Q1 o'zgaruvchisi bilan belgilaydigan ushbu nuqta, kuzatuvlarning 25 foizi (yoki chorak qismi) joylashgan ma'lumotlar nuqtasidir. Boshqacha qilib aytganda, bu sizning ma'lumotlar to'plamingizdagi barcha nuqtalarning markazidir quyida o'rtacha. Agar medianing ostida juft sonli qiymat bo'lsa, Q1 ni topish uchun yana ikkita o'rtacha qiymatning o'rtacha qiymatini olish kerak, chunki siz o'zingizni mediani aniqlash uchun qilgan bo'lishingiz mumkin.
    • Bizning misolimizda oltita nuqta medianadan yuqorida va oltita pastda joylashgan. Shunday qilib, birinchi kvartilni topish uchun pastki oltita ikkita o'rtacha nuqtani o'rtacha olishimiz kerak. Pastki oltitaning 3 va 4 nuqtalari ikkalasi ham 70, shuning uchun ularning o'rtacha qiymati ((70 + 70) / 2) =70. Shunday qilib, Q1 uchun bizning qiymatimiz 70 ga teng.
  5. Uchinchi kvartilni hisoblang. Q3 o'zgaruvchisi bilan belgilaydigan ushbu nuqta yuqorida ma'lumotlarning 25 foizi joylashgan ma'lumotlar nuqtasidir. Q3 ni topish deyarli Q1 ni topishga o'xshaydi, faqat biz bu holda fikrlarni ko'rib chiqamiz yuqorida o'rtacha.
    • Yuqoridagi misolni davom ettirsak, medianing yuqorisidagi oltita nuqtaning ikkita o'rta nuqtasi 71 va 72 ga teng ekanligini ko'ramiz. Ushbu ikki nuqtaning o'rtacha qiymati ((71 + 72) / 2) =71,5. Shunday qilib, Q3 uchun bizning qiymatimiz 71,5 ga teng.
  6. Intervartillar oralig'ini toping. Endi biz Q1 va Q3 ni aniqladik, bu ikki o'zgaruvchi orasidagi masofani hisoblashimiz kerak. Q1 va Q3 orasidagi masofani Q1ni Q3ni Q3dan olib tashlash orqali topishingiz mumkin. Ma'lumotlar to'plamidagi og'ishmaydigan nuqtalar chegaralarini aniqlash uchun interkartilalar oralig'i uchun olingan qiymat juda muhimdir.
    • Bizning misolimizda Q1 va Q3 qiymatlari mos ravishda 70 va 71,5 ga teng. Interkartillar oralig'ini topish uchun biz Q3 - Q1 ni hisoblaymiz: 71.5 - 70 =1,5.
    • Bu Q1, Q3 yoki ikkala raqam salbiy bo'lsa ham ishlaydi. Masalan, agar Q1 uchun bizning qiymatimiz -70 bo'lsa, kvartallar oralig'i 71,5 - (-70) = 141,5 ni tashkil etadi, bu to'g'ri.
  7. Ma'lumotlar to'plamining "Ichki chegaralarini" toping. Siz haddan tashqari miqdorlarni ularning bir qator son chegaralariga to'g'ri kelishini aniqlash orqali tanib olishingiz mumkin; "ichki chegaralar" va "tashqi chegaralar" deb nomlangan. Ma'lumotlar to'plamining ichki chegaralaridan tashqariga tushgan nuqta bitta deb tasniflanadi engilroq, va tashqi chegaralardan tashqaridagi nuqta bitta deb tasniflanadi haddan tashqari ustun. Ma'lumotlar to'plamining ichki chegaralarini topish uchun avval kvartallar oralig'ini 1,5 ga ko'paytiring. Natijani Q3 ga qo'shing va uni Q1dan chiqaring. Ikki natija ma'lumotlar to'plamining ichki chegaralari.
    • Bizning misolimizda interkartillar oralig'i (71,5 - 70) yoki 1,5 ga teng. Buni 1,5 ga ko'paytirib, 2,25 ga teng bo'ladi. Ushbu sonni Q3 ga qo'shamiz va ichki chegaralarni topish uchun uni Q1dan chiqaramiz:
      • 71,5 + 2,25=73,75
      • 70 - 2,25=67,75
      • Shunday qilib ichki chegaralar 67.75 va 73.75.
    • Bizning ma'lumotlar to'plamimizda faqat pechning harorati - 300 daraja Farangeyt - bu doiradan tashqarida. Shunday qilib, bu yumshoq bo'lishi mumkin. Biroq, biz bu harorat haddan tashqari yuqori ekanligini aniqlamadik, shuning uchun hozircha xulosaga shoshilmaylik.
  8. Ma'lumotlar to'plamining "tashqi chegaralarini" toping. Siz buni ichki chegaralar bilan bir xilda bajarasiz, faqat bitta farq bilan siz interkartalararo masofani 1,5 o'rniga 3 ga ko'paytirasiz. Keyin natijani Q3 ga qo'shasiz va tashqi chegara qiymatlarini topish uchun Q1 dan chiqarasiz.
    • Bizning misolimizda biz kvartallararo masofani 3 ga ko'paytiramiz (1,5 * 3) yoki 4,5 ni olamiz. Endi tashqi chegaralarni ichki chegaralar singari topishimiz mumkin:
      • 71,5 + 4,5=76
      • 70 - 4,5=65,5
      • Shunday qilib tashqi chegaralar 65.5 va 76.
    • Tashqi chegaralardan tashqarida joylashgan ma'lumotlar nuqtalari haddan tashqari chegaralar deb hisoblanadi. Bizning misolimizda pechning harorati, Farangeyt 300 daraja, tashqi chegaralardan ancha yuqori. Shunday qilib, pechning harorati albatta haddan tashqari ustunlik.
  9. Cheklovlarni "tashlash" kerakligini aniqlash uchun sifatli baholashdan foydalaning. Yuqoridagi usul yordamida siz aniq nuqtalarning engil, haddan tashqari haddan tashqari yoki umuman yo'qligini aniqlashingiz mumkin. Ammo xato qilmang - fikrni ustun deb bilish uni bitta qilib qo'yadi nomzod ma'lumotlar bazasidan o'chirilishi kerak va darhol o'chirilgan nuqta emas kerak aylanmoq. The sabab nima uchun chegirma to'plamdagi boshqa punktlardan farq qiladi, chegara olib tashlanishi kerakligini aniqlashda hal qiluvchi ahamiyatga ega. Umuman olganda, ba'zi bir xatolar sababli o'lchovlar, yozuvlar yoki eksperimental dizayndagi xatolar natijasida kelib chiqadigan cheklovlar olib tashlanadi. Aksincha, xatolar tufayli kelib chiqmaydigan va yangi, kutilmagan ma'lumotlar yoki tendentsiyalarni ochib beradigan tashqi narxlar paydo bo'ladi emas o'chirildi.
    • Ko'rib chiqilishi kerak bo'lgan yana bir mezon - bu haddan tashqari ko'rsatkichlar ma'lumotlar to'plamining o'rtacha qiymatiga egri yoki chalg'ituvchi ta'sir ko'rsatadimi. Bu sizning ma'lumotlar to'plamingizning o'rtacha natijalaridan xulosa chiqarishni rejalashtirmoqchi bo'lsangiz, bu ayniqsa muhimdir.
    • Keling, bizning misolimizni baholaylik. Beri eng yuqori Tabiatning kutilmagan kuchi tufayli pechning 300 ° F haroratga yetishi ehtimoldan yiroq emas, bizning misolimizda pechning tasodifan yoqilganligi va g'ayritabiiy yuqori harorat ko'rsatkichini keltirib chiqarganligi to'g'risida deyarli 100% aniqlik bilan xulosa qilishimiz mumkin. Bundan tashqari, agar biz ortiqcha raqamni olib tashlamasak, bizning ma'lumotlar to'plamimiz o'rtacha (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 ° ga teng F, o'rtacha holda tashqariga chiqadi (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70.55 ° F.
      • Chiqib ketish odamlarning xatosi bilan yuzaga kelganligi sababli va xonaning o'rtacha harorati 32 ° C ga yaqin edi, deyish noto'g'ri bo'lgani uchun biz o'zimizdan ustunlikni tanlashimiz kerak. olib tashlash.
  10. Chegaralarni saqlab qolish (ba'zan) ahamiyatini tushunib oling. Ma'lumotlar bazasidan ba'zi bir chetga chiqishlarni xatolar natijasida yoki noto'g'ri natijalar bilan chalg'itishi sababli olib tashlash kerak bo'lsa, boshqa cheklovlarni saqlab qolish kerak. Masalan, agar chegirma to'g'ri olingan bo'lsa (va shuning uchun xato natijasi bo'lmasa) va / yoki agar o'lchov qilinadigan hodisa to'g'risida yangi tushunchani taklif qilsa, uni darhol olib tashlamaslik kerak. Chet elliklar bilan ishlash haqida gap ketganda, ilmiy tajribalar ayniqsa sezgir holatlardir - xatolikni chiqarib tashlash yangi tendentsiya yoki kashfiyot haqida muhim ma'lumotlarni tashlab yuborishni anglatishi mumkin.
    • Masalan, baliq fermasida baliqlarni kattalashtirish uchun yangi dori ishlab chiqarayotganimizni tasavvur qiling. Keling, eski ma'lumotlar to'plamimizdan ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}) foydalanamiz, har bir nuqta baliq massasini (grammda) ifodalaydi. ) tug'ilishdan boshlab boshqa eksperimental dori bilan davolashdan keyin. Boshqacha qilib aytganda, birinchi dori bir baliqqa 71 gramm massa berdi, ikkinchisi boshqa baliqqa 70 gramm massasini berdi va hokazo. Bunday vaziyatda, 300 hali ham juda katta, ammo biz hozir uni olib tashlamasligimiz kerak. Chunki, agar ortiqcha narsa xato natijasi emas deb hisoblasak, bu bizning tajribamizda katta muvaffaqiyatni anglatadi. 300 gramm baliq ishlab chiqaradigan dori boshqa har qanday dori-darmonga qaraganda yaxshiroq ishladi, shuning uchun ham shunday eng o'rniga, bizning to'plamimizdagi muhim ma'lumotlar nuqtasi kamida muhim ma'lumotlar nuqtasi.

Maslahatlar

  • Agar siz natijalarni topsangiz, ularni ma'lumotlar to'plamidan olib tashlashdan oldin ularni tushuntirishga harakat qiling; ular o'lchov xatolarini yoki taqsimotdagi og'ishlarni ko'rsatishi mumkin.

Zaruriyatlar

  • Kalkulyator