Chiqindilarni qanday hisoblash mumkin

Muallif: Janice Evans
Yaratilish Sanasi: 23 Iyul 2021
Yangilanish Sanasi: 1 Iyul 2024
Anonim
Bolalar Uchun Raqamlar va Asosiy Matematikani Qanday Chizish Mumkin
Video: Bolalar Uchun Raqamlar va Asosiy Matematikani Qanday Chizish Mumkin

Tarkib

Statistikada tashqi ma'lumotlar yig'ilgan ma'lumotlar bazasidagi boshqa qiymatlardan keskin farq qiladigan qiymatlardir. Tashqi ma'lumot tarqatish yoki o'lchov xatolaridagi anomaliyalarni ko'rsatishi mumkin, shuning uchun tashqi ma'lumotlar ko'pincha ma'lumotlar bazasidan chiqariladi. Ma'lumotlar bazasidan chetga chiqishlarni olib tashlab, siz kutilmagan yoki aniqroq xulosalarga kelishingiz mumkin. Demak, statistikani to'g'ri tushunishni ta'minlash uchun chetga chiqishlarni hisoblash va baholash imkoniyatiga ega bo'lish zarur.

Qadamlar

  1. 1 Potentsial kamchiliklarni tan olishni o'rganing. Ma'lumotlar majmuasidan chetga chiqishlarni chiqarib tashlashdan oldin potentsial tashqi ko'rsatkichlarni aniqlash kerak. Outliers - bu ma'lumotlar to'plamidagi ko'pchilik qiymatlardan juda farq qiladigan qiymatlar; boshqacha qilib aytganda, tashqaridan chiqishlar ko'pchilik qadriyatlar tendentsiyasidan tashqarida. Buni qiymatlar jadvalida yoki (ayniqsa) grafikalarda topish oson. Agar ma'lumotlar to'plamidagi qiymatlar chizilgan bo'lsa, tashqi ko'rsatkichlar boshqa qiymatlardan ancha uzoqda bo'ladi. Agar, masalan, qiymatlarning aksariyati to'g'ri chiziqqa to'g'ri keladigan bo'lsa, unda tashqi chiziqlar shunday to'g'ri chiziqning har ikki tomonida yotadi.
    • Masalan, xonadagi 12 xil ob'ektning haroratini aks ettiruvchi ma'lumotlar to'plamini ko'rib chiqing. Agar 11 ta ob'ekt taxminan 70 daraja bo'lsa -da, lekin o'n ikkinchi ob'ekt (ehtimol o'choq) 300 daraja bo'lsa, u holda qiymatlarni tezda ko'rib chiqish o'choqning portlashi mumkinligini ko'rsatishi mumkin.
  2. 2 Ma'lumotlarni o'sish tartibida tartiblang. Ko'rsatkichlarni aniqlashda birinchi qadam - ma'lumotlar to'plamining medianasini hisoblash. Ma'lumotlar to'plamidagi qiymatlar o'sish tartibida joylashtirilsa (kichikdan kattagacha), bu vazifa ancha soddalashtiriladi.
    • Yuqoridagi misolni davom ettirib, bir nechta ob'ektlarning haroratini ifodalovchi quyidagi ma'lumotlar to'plamini ko'rib chiqing: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Bu to'plamga quyidagicha buyurtma berish kerak: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Ma'lumotlar to'plamining medianini hisoblang. Ma'lumotlar to'plamining medianasi - ma'lumotlar to'plamining o'rtasida joylashgan qiymat. Agar ma'lumotlar to'plami toq sonli qiymatlarni o'z ichiga olsa, mediana - bu ma'lumotlar majmuasida bir xil miqdordagi qiymatlardan oldin va keyin bo'lgan qiymat. Ammo agar ma'lumotlar bazasida juft sonlar bo'lsa, unda siz ikkita vositaning arifmetik o'rtacha qiymatini topishingiz kerak. E'tibor bering, tashqariga chiquvchilarni hisoblashda medianani odatda Q2 deb atashadi, chunki u Q1 va Q3 o'rtasida, biz quyi va yuqori kvartillar orasida joylashgan bo'lib, biz ularni keyinroq aniqlaymiz.
    • Ma'lumotlar soni teng bo'lgan ma'lumotlar to'plamlari bilan ishlashdan qo'rqmang- ikkita vositaning arifmetik o'rtacha qiymati ma'lumotlar to'plamida bo'lmagan raqam bo'ladi; bu odatiy. Ammo agar ikkita o'rtacha qiymat bir xil bo'lsa, o'rtacha arifmetik bu raqamga teng; bu ham ishlar tartibida.
    • Yuqoridagi misolda o'rta 2 qiymatlari 70 va 71, shuning uchun medianasi ((70 + 71) / 2) = 70,5.
  4. 4 Pastki kvartilni hisoblang. Q1 deb ataladigan bu qiymat 25% dan oshmaydi. Boshqacha qilib aytganda, bu o'rtacha qiymatgacha bo'lgan qiymatlarning yarmi. Agar medianadan oldin ma'lumotlar majmuasida teng sonli qiymatlar mavjud bo'lsa, siz 1 -chorakni hisoblash uchun ikkita vositaning arifmetik o'rtacha qiymatini topishingiz kerak (bu medianani hisoblashga o'xshaydi).
    • Bizning misolimizda 6 qiymat medianadan keyin va 6 qiymat- undan oldin joylashgan. Bu shuni anglatadiki, quyi kvartilni hisoblash uchun biz medianadan oldin joylashgan oltita qiymatning ikkita vositasining arifmetik o'rtacha qiymatini topishimiz kerak. Bu erda o'rtacha qiymatlar 70 va 70. Shunday qilib, Q1 = ((70 + 70) / 2) = 70.
  5. 5 Yuqori kvartilni hisoblang. Q3 deb nomlangan bu qiymat, ma'lumotlar to'plamining 25% qiymatidan yuqori. Q3ni hisoblash jarayoni Q1ni hisoblash jarayoniga o'xshaydi, lekin bu erda medianadan keyingi qiymatlar hisobga olinadi.
    • Yuqoridagi misolda, medianadan keyin oltitaning ikkita o'rtacha ko'rsatkichi 71 va 72. Demak, Q3 = ((71 + 72) / 2) = 71.5.
  6. 6 To'rtlik oralig'ini hisoblang. Q1 va Q3 ni hisoblab, bu qiymatlar orasidagi masofani topish kerak. Buning uchun Q3 dan Q1ni olib tashlang. Qatorlararo diapazonning qiymati tashqaridan bo'lmagan qiymatlar chegaralarini aniqlashda juda muhim ahamiyatga ega.
    • Bizning misolimizda Q1 = 70 va Q3 = 71.5. To'rtlik oralig'i 71,5 - 70 = 1,5.
    • E'tibor bering, bu Q1 va Q3 salbiy qiymatlariga ham tegishli. Masalan, Q1 = -70 bo'lsa, u holda kvartalararo diapazon 71,5 -(-70) = 141,5 ga teng.
  7. 7 Ma'lumotlar to'plamidagi qiymatlarning "ichki chegaralarini" toping. Tashqi chegaralar qiymatlarni tahlil qilish orqali aniqlanadi- ular "ichki chegaralar" va "tashqi chegaralar" deb ataladi. "Ichki chegaralar" dan tashqaridagi qiymat "kichik chegara" deb tasniflanadi, "tashqi chegaralar" dan tashqaridagi qiymat esa "muhim tashqi" deb tasniflanadi. Ichki chegaralarni topish uchun kvartallar oralig'ini 1,5 ga ko'paytirish kerak; natijani Q3 ga qo'shish va Q1dan olib tashlash kerak. Topilgan ikkita raqam - ma'lumotlar to'plamining ichki chegaralari.
    • Bizning misolimizda, kvartalararo diapazon (71,5 - 70) = 1,5. Keyinchalik: 1.5 * 1.5 = 2.25. Ichki chegaralarni topish uchun bu raqamni Q3 ga qo'shish va Q1dan olib tashlash kerak:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Shunday qilib, ichki chegaralar 67,75 va 73,75 ni tashkil qiladi.
    • Bizning misolimizda faqat o'choq harorati - 300 daraja - bu chegaralar tashqarisida yotadi va ularni ahamiyatsiz emissiya deb hisoblash mumkin. Ammo xulosaga shoshilmang - biz bu harorat sezilarli darajada tashqarida ekanligini aniqlashimiz kerak.
  8. 8 Ma'lumotlar to'plamining "tashqi chegaralarini" toping. Bu ichki chegaralarda bo'lgani kabi amalga oshiriladi, faqat kvartallar oralig'i 1,5 o'rniga 3 ga ko'paytiriladi. Natijani Q3 ga qo'shish va Q1dan olib tashlash kerak. Topilgan ikkita raqam - ma'lumotlar to'plamining tashqi chegaralari.
    • Bizning misolimizda kvartallar oralig'ini 3: 1,5 * 3 = 4,5 ga ko'paytiring. Tashqi chegaralarni hisoblang:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Shunday qilib, tashqi chegaralar 65,5 va 76.
    • Tashqi chegaradan tashqariga chiqadigan har qanday qiymatlar muhim emissiya hisoblanadi. Bizning misolimizda, pechning harorati 300 daraja muhim portlash hisoblanadi.
  9. 9 Ma'lumotlar bazasidan chetga chiquvchilarni chiqarib tashlash kerakligini aniqlash uchun sifatli baholashdan foydalaning. Yuqorida tavsiflangan usul sizga ba'zi qiymatlarning chetga chiqishini (kichik yoki ahamiyatli) aniqlash imkonini beradi. Xato qilmang, lekin chetga chiquvchi deb tasniflangan qiymat faqat istisno uchun "nomzod" dir, ya'ni uni istisno qilish shart emas. Tashqarini chiqarib tashlash to'g'risidagi qarorga ta'sir qiluvchi asosiy omil tashqi sababdir. Qoida tariqasida, xatolar (o'lchovlar, yozuvlar va h.k.) tufayli yuzaga keladigan ortiqcha ko'rsatkichlar chiqarib tashlanadi. Boshqa tomondan, xatolar bilan emas, balki yangi ma'lumotlar yoki tendentsiyalar bilan bog'liq bo'lgan tashqi ma'lumotlar odatda ma'lumotlar to'plamida qoldiriladi.
    • Ma'lumotlar to'plamining medianasiga (ular buzib ko'rsatadimi yoki yo'qmi) ta'sirini baholash ham bir xil darajada muhimdir. Bu, ayniqsa, ma'lumotlar to'plamining medianasidan xulosa chiqarganda juda muhimdir.
    • Bizning misolimizda, pechning 300 gradusgacha qizishi ehtimoldan yiroq emas (agar biz tabiiy anomaliyalarni hisobga olmasak). Shunday qilib, xulosa qilish mumkinki (yuqori darajadagi ishonch bilan) bunday harorat o'lchov xatosi bo'lib, uni ma'lumotlar bazasidan chiqarib tashlash kerak. Bundan tashqari, agar siz tashqaridan farq qilmasangiz, ma'lumotlar to'plamining medianasi (69 + 69 + 70 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 daraja bo'ladi. Ammo, agar siz tashqaridan chiqarib tashlasangiz, o'rtacha (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 daraja bo'ladi.
      • Chiqib ketish odatda inson xatolarining natijasidir, shuning uchun tashqi ma'lumotlarni ma'lumotlar to'plamidan chiqarib tashlash kerak.
  10. 10 Ma'lumotlar bazasida qoldirilgan (ba'zan) tashqi ko'rsatkichlarning ahamiyatini tushuning. Xatoliklar va texnik nosozliklar tufayli, ba'zi tashqi ko'rsatkichlar ma'lumotlar bazasidan chiqarilishi kerak; ma'lumotlar majmuasida boshqa nosozliklar qoldirilishi kerak. Agar, masalan, chet ellik xato natijasi bo'lmasa va / yoki tekshirilayotgan hodisani yangi tushunishini ta'minlasa, uni ma'lumotlar to'plamida qoldirish kerak. Ilmiy eksperimentlar, ayniqsa, chetga chiqishga sezgir bo'ladi - xato bilan xatolikni yo'q qilib, siz yangi tendentsiya yoki kashfiyotni o'tkazib yuborishingiz mumkin.
    • Masalan, baliqchilikda baliq hajmini oshirish uchun yangi dori ishlab chiqyapmiz. Biz eski ma'lumotlar to'plamidan foydalanamiz ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69), lekin bu safar har bir qiymat baliqning og'irligini ko'rsatadi (grammda) qabul qilinganidan keyin eksperimental dori. Boshqacha qilib aytganda, birinchi dori baliq vaznining 71 g gacha, ikkinchi dori - 70 g gacha va hokazo. Bunday vaziyatda 300 - bu muhim farq, lekin biz buni istisno qilmasligimiz kerak; agar biz o'lchov xatolari bo'lmagan deb taxmin qilsak, unda bunday eksperiment eksperimentda katta muvaffaqiyat bo'ladi. Baliqning og'irligini 300 grammgacha oshirgan preparat boshqa dorilarga qaraganda ancha yaxshi ishlaydi; Shunday qilib, 300 ma'lumotlar to'plamidagi eng muhim qiymatdir.

Maslahatlar

  • Nosozliklar topilganda, ularni ma'lumotlar bazasidan chiqarib tashlamasdan oldin ularning mavjudligini tushuntirishga harakat qiling. Ular o'lchov xatolarini yoki tarqatish anomaliyalarini ko'rsatishi mumkin.

Sizga nima kerak

  • Kalkulyator