- Median
مقدمه مفهومی
میانه به عنوان یک معیار مقاوم در آمار شناخته می شود که برخلاف میانگین، تحت تأثیر مقادیر پرت و افراطی قرار نمی گیرد. این مفهوم در قرن نوزدهم توسط گالتون معرفی شد و امروزه در تمام شاخه های علمی کاربرد دارد.
کاربرد در علوم داده
در تحلیل های اقتصادی، گزارش های اجتماعی و پژوهش های پزشکی، میانه معیار قابل اعتمادتری برای توصیف مرکز داده ها محسوب می شود، به ویژه وقتی توزیع داده ها نامتقارن باشد.
مثال های کاربردی
در گزارش های درآمدی، میانه درآمد معیار بهتری از میانگین است، چون تحت تأثیر درآمدهای بسیار بالا قرار نمی گیرد. در پزشکی، میانه زمان بقای بیماران معیار واقع بینانه تری ارائه می دهد.
محاسبه
برای محاسبه میانه: 1) داده ها را مرتب کنید 2) اگر تعداد داده ها فرد باشد، مقدار وسط را انتخاب کنید 3) اگر زوج باشد، میانگین دو مقدار وسط را بگیرید.
تفاوت با میانگین
میانه در مقابل داده های پرت مقاوم است، درحالی که میانگین به شدت تحت تأثیر آن ها قرار می گیرد. در توزیع های متقارن، میانه و میانگین برابرند.
پیاده سازی
در Python: numpy.median() یا statistics.median()، در R: median()، در SQL: PERCENTILE_CONT(0.5)، در اکسل: MEDIAN().
چالش ها
در توزیع های چندوجهی یا زمانی که داده ها خوشه بندی شده اند، میانه ممکن است نماینده خوبی نباشد. همچنین برای داده های کیفی قابل استفاده نیست.
کاربردهای پیشرفته
در یادگیری ماشین برای تشخیص پرت، در اقتصادسنجی برای تحلیل های رگرسیونی مقاوم، و در کنترل کیفیت برای تعیین محدوده های طبیعی.
تاریخچه
این مفهوم توسط فرانسیس گالتون در قرن 19 معرفی شد و در قرن 20 با توسعه آمار مقاوم، اهمیت بیشتری یافت.
نتیجه گیری
میانه یک معیار ساده اما قدرتمند در تحلیل داده است که هر تحلیل گر داده باید بر محاسبه و تفسیر آن مسلط باشد.
میانه به عنوان یک معیار مقاوم در آمار شناخته می شود که برخلاف میانگین، تحت تأثیر مقادیر پرت و افراطی قرار نمی گیرد. این مفهوم در قرن نوزدهم توسط گالتون معرفی شد و امروزه در تمام شاخه های علمی کاربرد دارد.
کاربرد در علوم داده
در تحلیل های اقتصادی، گزارش های اجتماعی و پژوهش های پزشکی، میانه معیار قابل اعتمادتری برای توصیف مرکز داده ها محسوب می شود، به ویژه وقتی توزیع داده ها نامتقارن باشد.
مثال های کاربردی
در گزارش های درآمدی، میانه درآمد معیار بهتری از میانگین است، چون تحت تأثیر درآمدهای بسیار بالا قرار نمی گیرد. در پزشکی، میانه زمان بقای بیماران معیار واقع بینانه تری ارائه می دهد.
محاسبه
برای محاسبه میانه: 1) داده ها را مرتب کنید 2) اگر تعداد داده ها فرد باشد، مقدار وسط را انتخاب کنید 3) اگر زوج باشد، میانگین دو مقدار وسط را بگیرید.
تفاوت با میانگین
میانه در مقابل داده های پرت مقاوم است، درحالی که میانگین به شدت تحت تأثیر آن ها قرار می گیرد. در توزیع های متقارن، میانه و میانگین برابرند.
پیاده سازی
در Python: numpy.median() یا statistics.median()، در R: median()، در SQL: PERCENTILE_CONT(0.5)، در اکسل: MEDIAN().
چالش ها
در توزیع های چندوجهی یا زمانی که داده ها خوشه بندی شده اند، میانه ممکن است نماینده خوبی نباشد. همچنین برای داده های کیفی قابل استفاده نیست.
کاربردهای پیشرفته
در یادگیری ماشین برای تشخیص پرت، در اقتصادسنجی برای تحلیل های رگرسیونی مقاوم، و در کنترل کیفیت برای تعیین محدوده های طبیعی.
تاریخچه
این مفهوم توسط فرانسیس گالتون در قرن 19 معرفی شد و در قرن 20 با توسعه آمار مقاوم، اهمیت بیشتری یافت.
نتیجه گیری
میانه یک معیار ساده اما قدرتمند در تحلیل داده است که هر تحلیل گر داده باید بر محاسبه و تفسیر آن مسلط باشد.
