مقدمه مفهومی درباره واژه مقیاس بندی (Scaling) به توانایی یک سیستم در تطبیق منابع خود با تغییرات بار کاری اشاره دارد. این مفهوم در سه سطح افقی، عمودی و مورب تعریف می شود. کاربرد واژه در برنامه نویسی یا زیرشاخه های فناوری اطلاعات در رایانش ابری، مقیاس بندی خودکار (Auto-scaling) امکان افزایش/کاهش منابع بر اساس ترافیک را فراهم می کند. در پایگاه داده ها، مقیاس بندی خواندن/نوشتن را از هم جدا می کنند. مثال های واقعی و کاربردی سرویس AWS Auto Scaling، سیستم های Kubernetes و معماری های Microservices همگی از الگوهای مقیاس پذیری استفاده می کنند. نقش واژه در توسعه نرم افزار معماری های بدون سرور (Serverless) مانند AWS Lambda ذاتاً مقیاس پذیر طراحی شده اند. در DevOps، مقیاس پذیری یکی از اصول دوازده گانه است. تاریخچه فناوری مفهوم مقیاس پذیری از دهه 1960 با ظهور مین فریم ها آغاز شد. در دهه 2000 با رشد وب سایت های پرترافیک مانند گوگل، این مفهوم حیاتی شد. تفکیک از واژگان مشابه مقیاس پذیری با عملکرد (Performance) یا در دسترس پذیری (Availability) متفاوت است، اگرچه مکمل یکدیگرند. پیاده سازی در زبان های برنامه نویسی در Python با کتابخانه های Asyncio، در جاوا با Spring Cloud و در جاوااسکریپت با معماری های Event-Driven پیاده سازی می شود. چالش های رایج مقیاس پذیری بیش از حد (Over-scaling) هزینه ها را افزایش می دهد. معماری های Monolithic به سختی مقیاس می پذیرند. نتیجه گیری کاربردی طراحی سیستم های مقیاس پذیر نیازمند درک عمیق از الگوهایی مانند Sharding، Caching و Queueing است.