در ریاضیات با تابع خط مستقیم آشنا شده ایم
که در آن

، عرض از مبدا خط و

شیب خط است.
ولی در دنیای واقعی نمی توان دقیقا به چنین تابعی رسید و حتما کمی اختلاف وجود دارد که به علت خطا و عوامل تصادفی دیگر به وجود آمده است.
بنابراین مدل آماری زیر را داریم.
مدل آماری رگرسیون خطی ساده
فرض می کنیم که پاسخ y
i، به مقدار x
i از متغیر کنترل شده، به وسیله ی
مربوط است، که در آن
1)

مجموعه ی مقادیر متغیر کنترل شده ی X هستند که آزمایشگر برای مطالع برگزیره است.
[ اگر متغیر X به وسیله آزمایشگر قابل کنترل نباشد(تصادفی باشد) چه باید کرد؟]
2)

مولفه های خطای نامعلومی هستند که بر رابطه ی خطی واقعی اثر می گذارند و متغیرهای تصادفی غیر قابل مشاهده اند که
فرض می کنیم مستقل بوده، به طور نرمال با میانگین صفر و واریانس
نامعلوم

توزیع شده اند.
3) پارامترهای

و

که با هم موقعیت خط مستقیم را مشخص می کنند و نامعلوم هستند.
در رابطه ی بالا

را خطا، Y را متغیر وابسته و X را متغیر مستقل می گوییم.
نمودار پراکنش چیست؟
روش حداقل مربعات خطا