حداکثر خطای نمونه گیری با تغییرپذیری مشخصه نسبت معکوس دارد. میانگین مربع خطای استاندارد توضیح نمونه برای. خطاهای سیستماتیک و تصادفی

در هنگام مشاهده انتخابی، باید از آن اطمینان حاصل شود تصادفانتخاب واحدها هر واحد باید شانس مساوی برای انتخاب شدن داشته باشد. این همان چیزی است که یک نمونه تصادفی بر اساس آن است.

به نمونه تصادفی واقعی به انتخاب واحدها از کل جمعیت (بدون اینکه ابتدا آن را به هیچ گروهی تقسیم کنیم) با قرعه کشی (عمدتا) یا روش های مشابه دیگر، به عنوان مثال، با استفاده از جدول اعداد تصادفی اشاره دارد. انتخاب تصادفی- این انتخاب تصادفی نیست. اصل تصادفی بودن فرض می کند که گنجاندن یا حذف یک شی از نمونه نمی تواند تحت تأثیر هیچ عامل دیگری غیر از شانس باشد. مثال در واقع تصادفیقرعه کشی های برنده می توانند به عنوان انتخاب عمل کنند: از مجموع تعداد بلیط های صادر شده، بخش خاصی از اعدادی که برنده ها برای آنها اتفاق می افتد به طور تصادفی انتخاب می شود. علاوه بر این، همه اعداد با فرصت برابر برای درج در نمونه ارائه شده است. در این حالت معمولاً تعداد واحدهای انتخاب شده در جامعه نمونه بر اساس نسبت نمونه پذیرفته شده تعیین می شود.

اشتراک نمونه نسبت تعداد واحدهای جامعه نمونه به تعداد واحدهای جامعه عمومی است:

بنابراین، با یک نمونه 5٪ از یک دسته از قطعات 1000 واحدی. اندازهی نمونه پ 50 واحد است و با نمونه 10 درصد - 100 واحد. و غیره. با سازماندهی علمی صحیح نمونه گیری، خطاهای موجود در نمایندگی را می توان به حداقل مقادیر کاهش داد، در نتیجه، مشاهده نمونه کاملاً دقیق می شود.

انتخاب تصادفی مناسب "در شکل خالص" به ندرت در عمل مشاهده انتخابی استفاده می شود، اما انتخاب اولیه در بین سایر انواع انتخاب است که شامل و اجرای اصول اساسی مشاهده انتخابی است.

چند سوال تئوری روش نمونه گیری و فرمول خطا را برای یک نمونه تصادفی ساده در نظر می گیریم.

هنگام استفاده از روش نمونه گیری در آمار، معمولاً از دو نوع شاخص کلی استفاده می شود: مقدار متوسط ​​یک مشخصه کمیو ارزش نسبی مشخصه جایگزین(سهم یا وزن مخصوص واحدها در یک جامعه آماری که تنها با وجود ویژگی مورد مطالعه با سایر واحدهای این جامعه تفاوت دارد).

سهم انتخابی (w)یا فرکانس، که با نسبت تعداد واحدهای دارای ویژگی مورد مطالعه تعیین می شود تی،به تعداد کل واحدهای جامعه نمونه پ:

برای مثال، اگر از 100 جزئیات نمونه ( n=100)، 95 قسمت استاندارد بود (تی=95)، سپس کسر نمونه

w=95/100=0,95 .

برای مشخص کردن قابلیت اطمینان شاخص های نمونه، وجود دارد میانگینو حداکثر خطای نمونه گیری

خطای نمونه گیری ? یا به عبارت دیگر، خطای نمایندگی، تفاوت بین نمونه مربوطه و ویژگی های کلی است:

*

*

خطای نمونه گیری تنها مشخصه مشاهدات نمونه است. هر چه مقدار این خطا بیشتر باشد، شاخص های نمونه با شاخص های کلی مربوطه تفاوت بیشتری دارند.

میانگین نمونه و سهم نمونه ذاتاً هستند متغیرهای تصادفیکه بسته به اینکه کدام واحد از جامعه در نمونه گنجانده شده است، می تواند مقادیر متفاوتی به خود بگیرد. بنابراین خطاهای نمونه گیری نیز متغیرهای تصادفی هستند و می توانند مقادیر متفاوتی به خود بگیرند. بنابراین، میانگین خطاهای احتمالی تعیین می شود - میانگین خطای نمونه گیری.

به چه چیزی بستگی دارد میانگین خطای نمونه گیری؟در صورت رعایت اصل انتخاب تصادفی، ابتدا میانگین خطای نمونه گیری مشخص می شود اندازهی نمونه:هرچه این عدد بیشتر باشد، سایر موارد مساوی باشند، میانگین خطای نمونه برداری کوچکتر است. با پوشش تعداد فزاینده ای از واحدهای جمعیت عمومی با یک نظرسنجی نمونه، کل جمعیت عمومی را بیشتر و دقیق تر توصیف می کنیم.

میانگین خطای نمونه گیری نیز به این بستگی دارد درجه تنوعصفت مورد مطالعه درجه تنوع، همانطور که شناخته شده است، با پراکندگی مشخص می شود؟ 2 یا w(1-w)-- برای یک علامت جایگزین هر چه تغییرات مشخصه و در نتیجه پراکندگی کمتر باشد، میانگین خطای نمونه برداری کوچکتر است و بالعکس. با پراکندگی صفر (ویژگی تغییر نمی‌کند)، میانگین خطای نمونه‌گیری صفر است، یعنی هر واحد در جمعیت عمومی به طور دقیق کل جمعیت را مطابق این مشخصه مشخص می‌کند.

وابستگی میانگین خطای نمونه برداری به حجم آن و درجه تغییر ویژگی در فرمول هایی منعکس می شود که می توان از آنها برای محاسبه میانگین خطای نمونه گیری در شرایط مشاهده انتخابی استفاده کرد، زمانی که ویژگی های کلی ( x,p)ناشناخته هستند، و بنابراین، یافتن خطای واقعی نمونه گیری مستقیماً با استفاده از فرمول ها (فرم 1)، (فرم 2) ممکن به نظر نمی رسد.

ش با نمونه گیری مجدد تصادفی میانگین خطاهااز نظر تئوری با استفاده از فرمول های زیر محاسبه می شود:

* برای مشخصه کمی متوسط

* برای سهم (ویژگی جایگزین)

از آنجایی که عملاً واریانس یک صفت در جمعیت؟ 2 دقیقاً مشخص نیست، در عمل آنها از مقدار پراکندگی S2 استفاده می کنند که برای جامعه نمونه بر اساس قانون اعداد بزرگ محاسبه می شود، که طبق آن جامعه نمونه، با حجم نمونه به اندازه کافی بزرگ، کاملاً دقیق بازتولید می کند. ویژگی های جمعیت عمومی

بدین ترتیب، فرمول های محاسبه میانگین خطاهای نمونه گیری با انتخاب مجدد تصادفی، موارد زیر خواهد بود:

* برای مشخصه کمی متوسط

* برای سهم (ویژگی جایگزین)

اما پراکندگی جامعه نمونه با پراکندگی جامعه عمومی برابری نمی کند و بنابراین میانگین خطاهای نمونه گیری محاسبه شده با استفاده از فرمول های (فرم 5) و (فرم 6) تقریبی خواهد بود. اما در نظریه احتمال ثابت شده است که پراکندگی عمومی از طریق پراکندگی انتخابی با رابطه زیر بیان می شود:

زیرا پ/(n-1) برای به اندازه کافی بزرگ پ --مقدار نزدیک به وحدت است، پس می توان فرض کرد که، و بنابراین، در محاسبات عملی میانگین خطاهای نمونه گیری، می توان از فرمول (فرم. 5) و (فرم. 6) استفاده کرد. و فقط در موارد کوچک بودن نمونه (زمانی که حجم نمونه از 30 بیشتر نباشد) باید ضریب را در نظر گرفت. پ/(n-1) و محاسبه کنید میانگین خطای نمونه کوچکطبق فرمول:

W X با انتخاب تصادفی و غیر تکراری در فرمول های فوق برای محاسبه میانگین خطاهای نمونه گیری، لازم است عبارت رادیکال در 1-(n/N) ضرب شود، زیرا در فرآیند نمونه گیری غیر تکراری تعداد واحدها در جمعیت عمومی کاهش می یابد. بنابراین برای نمونه گیری غیر تکراری فرمول های محاسبه میانگین خطای نمونه گیری به شکل زیر خواهد بود:

* برای مشخصه کمی متوسط

* برای سهم (ویژگی جایگزین)

. (فرم 10)

زیرا پهمیشه کمتر ن، سپس عامل اضافی 1-( n/N) همیشه کمتر از یک خواهد بود. نتیجه این است که میانگین خطا در انتخاب غیر تکراری همیشه کمتر از انتخاب مکرر خواهد بود. در عین حال، با درصد نسبتاً کمی از نمونه، این ضریب به واحد نزدیک است (مثلاً با نمونه 5٪ برابر است با 0.95؛ با نمونه 2٪ 0.98 و غیره است). بنابراین، گاهی اوقات در عمل از فرمول (فرم. 5) و (فرم. 6) بدون ضریب مشخص شده برای تعیین میانگین خطای نمونه استفاده می کنند، اگرچه نمونه به صورت غیر تکراری سازماندهی می شود. این در مواردی اتفاق می‌افتد که تعداد واحدهای جمعیت N ناشناخته یا نامحدود باشد یا زمانی که تعداد واحدها در جمعیت N نامحدود باشد پبسیار کم در مقایسه با نو در اصل، معرفی یک ضریب اضافی، نزدیک به واحد، عملاً هیچ تأثیری بر مقدار میانگین خطای نمونه‌گیری نخواهد داشت.

نمونه برداری مکانیکی شامل این واقعیت است که انتخاب واحدها در جامعه نمونه از جمعیت عمومی، که بر اساس یک معیار خنثی به فواصل (گروه‌های) مساوی تقسیم می‌شوند، به گونه‌ای انجام می‌شود که از هر گروه فقط یک واحد برای نمونه. برای جلوگیری از تعصب، واحدی که در وسط هر گروه قرار دارد باید انتخاب شود.

هنگام سازماندهی انتخاب مکانیکی، واحدهای جمعیت به طور اولیه (معمولاً در یک لیست) به ترتیب خاصی (مثلاً بر اساس حروف الفبا، مکان، به ترتیب صعودی یا نزولی مقادیر برخی از شاخص های غیر مرتبط با دارایی) مرتب می شوند. در حال مطالعه، و غیره). در این حالت، اندازه فاصله در جامعه برابر با مقدار معکوس نسبت نمونه است. بنابراین، با یک نمونه 2٪، هر 50 واحد انتخاب و بررسی می شود (1: 0.02)، با یک نمونه 5٪ - هر 20 واحد (1: 0.05)، به عنوان مثال، قسمت همگرا از دستگاه.

با یک جمعیت به اندازه کافی بزرگ، انتخاب مکانیکی از نظر دقت نتایج نزدیک به انتخاب تصادفی خالص است. بنابراین برای تعیین میانگین خطای نمونه گیری مکانیکی از فرمول های نمونه گیری تصادفی غیر تکراری مناسب استفاده می شود (فرم. 9)، (فرم. 10).

برای انتخاب واحدها از یک جمعیت ناهمگن، به اصطلاح نمونه معمولی , که در مواردی استفاده می شود که همه واحدهای جمعیت عمومی را می توان به چندین گروه کیفی همگن و مشابه با توجه به ویژگی هایی که بر شاخص های مورد مطالعه تأثیر می گذارد، تقسیم کرد.

هنگام بررسی بنگاه ها، چنین گروه هایی می توانند، به عنوان مثال، صنعت و زیر صنعت، اشکال مالکیت باشند. سپس، از هر گروه معمولی، یک نمونه کاملا تصادفی یا مکانیکی برای انتخاب واحدها به صورت جداگانه در جامعه نمونه استفاده می شود.

معمولاً هنگام مطالعه جمعیت های آماری پیچیده از نمونه گیری معمولی استفاده می شود. به عنوان مثال، در طی یک بررسی نمونه از بودجه خانواده کارگران و کارمندان در بخش های خاصی از اقتصاد، بهره وری نیروی کار کارگران شرکت، که توسط گروه های جداگانه بر اساس صلاحیت نشان داده شده است.

یک نمونه معمولی نتایج دقیق تری در مقایسه با سایر روش های انتخاب واحد در جامعه نمونه می دهد. تایپ کردن جمعیت عمومی، نمایندگی چنین نمونه ای را تضمین می کند، نمایش هر گروه گونه شناسی در آن، که امکان حذف تأثیر پراکندگی بین گروهی بر میانگین خطای نمونه گیری را فراهم می کند.

هنگام تعیین میانگین خطای یک نمونه معمولیبه عنوان شاخص تنوع عمل می کند میانگین واریانس های درون گروهی

میانگین خطای نمونه گیری با استفاده از فرمول ها پیدا شد:

* برای مشخصه کمی متوسط

(انتخاب مجدد)؛ (فرم. 11)

(انتخاب برگشت ناپذیر)؛ (فرم. 12)

* برای سهم (ویژگی جایگزین)

(انتخاب مجدد)؛ (فرم.13)

(انتخاب غیر تکراری)، (فرم. 14)

میانگین واریانس های درون گروهی برای جامعه نمونه کجاست.

میانگین واریانس های درون گروهی نسبت (یک مشخصه جایگزین) برای جامعه نمونه.

نمونه برداری سریال شامل انتخاب تصادفی از جمعیت عمومی نه واحدهای منفرد، بلکه از گروه‌های مساوی آنها (لانه، سری) است تا همه واحدهای این گروه‌ها را بدون استثنا مورد مشاهده قرار دهند.

استفاده از نمونه برداری سریال به این دلیل است که بسیاری از کالاها برای حمل، نگهداری و فروش آنها به صورت بسته بندی، جعبه و ... بسته بندی می شوند. بنابراین هنگام نظارت بر کیفیت کالاهای بسته بندی شده، بررسی چند بسته (سری) منطقی تر از انتخاب مقدار مورد نیاز محصول از بین همه بسته ها است.

از آنجایی که در داخل گروه ها (سری ها) همه واحدها بدون استثنا مورد بررسی قرار می گیرند، میانگین خطای نمونه گیری (هنگام انتخاب سری های مساوی) فقط به پراکندگی بین گروهی (بین سری) بستگی دارد.

ش میانگین خطای نمونه گیری برای صفت کمی متوسط در طول انتخاب سریال آنها با استفاده از فرمول ها پیدا می شوند:

(انتخاب مجدد)؛ (فرم.15)

(انتخاب غیر تکراری)، (فرم. 16)

جایی که r-تعداد قسمت های انتخاب شده؛ R-تعداد کل قسمت ها

واریانس بین گروهی یک نمونه سریال به صورت زیر محاسبه می شود:

میانگین کجاست من- سری هفتم؛ - میانگین کلی برای کل جامعه نمونه.

ش میانگین خطای نمونه برداری برای اشتراک (ویژگی جایگزین) در انتخاب سریال:

(انتخاب مجدد)؛ (فرم. 17)

(انتخاب غیر تکراری). (فرم. 18)

بین گروهی(بین سری) واریانس سهم نمونه‌گیری سریالیبا فرمول تعیین می شود:

، (فرم 19)

سهم مشخصه در کجاست منسری -ام؛ - سهم کل مشخصه در کل جامعه نمونه.

در عمل بررسی های آماری، علاوه بر روش های انتخابی که قبلاً مطرح شد، از ترکیبی از آنها استفاده می شود. (انتخاب ترکیبی).

خطاهای سیستماتیک و تصادفی

خطاهای نمونه گیری واحد 2 مدولار

از آنجایی که یک نمونه معمولاً بخش بسیار کوچکی از جامعه را پوشش می دهد، باید فرض کرد که بین برآورد و ویژگی های جامعه ای که برآورد منعکس می کند، تفاوت هایی وجود خواهد داشت. به این تفاوت ها خطاهای نگاشت یا خطاهای نمایندگی می گویند. خطاهای نمایندگی به دو نوع سیستماتیک و تصادفی تقسیم می شوند.

خطاهای سیستماتیک- این یک تخمین یا دست کم گرفتن ثابت ارزش ارزیابی در مقایسه با ویژگی های جمعیت عمومی است. دلیل بروز خطای سیستماتیک عدم رعایت اصل احتمال برابری هر واحد از جمعیت عمومی در نمونه است، یعنی نمونه عمدتاً از "بدترین" (یا "بهترین") تشکیل شده است. نمایندگان جمعیت عمومی رعایت اصل فرصت برابر برای هر واحد برای درج در نمونه به ما این امکان را می دهد که این نوع خطا را به طور کامل حذف کنیم.

خطاهای تصادفی -اینها تفاوت هایی هستند که از نمونه ای به نمونه دیگر در علامت و بزرگی بین برآورد و ویژگی ارزیابی شده جامعه متفاوت است. دلیل وقوع خطاهای تصادفی، بازی شانس در هنگام تشکیل نمونه ای است که تنها بخشی از جمعیت عمومی را تشکیل می دهد. این نوع خطا به طور ارگانیک در روش نمونه گیری ذاتی است. حذف کامل آنها غیرممکن است. ترتیب اقدامات مربوط به این از در نظر گرفتن سه نوع خطای تصادفی به دست می آید: خاص، متوسط ​​و افراطی.

2.2.1 خاصخطا خطای یک نمونه گرفته شده است. اگر میانگین برای این نمونه () تخمینی برای میانگین کلی (0) باشد و با فرض اینکه این میانگین کلی برای ما شناخته شده باشد، تفاوت = -0 و خطای خاص این نمونه خواهد بود. اگر نمونه ای از این جمعیت عمومی را بارها تکرار کنیم، هر بار یک مقدار جدید برای یک خطای خاص دریافت می کنیم: ... و غیره. در مورد این خطاهای خاص می توان گفت: برخی از آنها از نظر بزرگی و علامت با یکدیگر منطبق خواهند شد، یعنی توزیع خطاها وجود دارد، برخی از آنها برابر با 0 خواهند بود، برآورد تصادفی وجود دارد. و پارامتر جمعیت عمومی؛

2.2.2 خطای متوسطمجذور میانگین تمام خطاهای تخمینی خاص ممکن است تصادفی باشد: , مقدار تغییر خطاهای خاص کجاست. فراوانی (احتمال) وقوع یک خطای خاص. میانگین خطای نمونه گیری نشان می دهد که اگر قضاوتی در مورد پارامتر جمعیت بر اساس برآورد انجام شود، به طور متوسط ​​چقدر خطا می تواند انجام شود. فرمول بالا محتوای خطای میانگین را نشان می دهد، اما نمی توان از آن برای محاسبات عملی استفاده کرد، البته فقط به این دلیل که دانش پارامتر جمعیت را پیش فرض می گیرد، که خود نیاز به نمونه گیری را بی نیاز می کند.



محاسبات عملی میانگین خطای تخمین بر این فرض استوار است که آن (خطای متوسط) اساساً انحراف استاندارد همه مقادیر تخمین ممکن است. این فرض به ما امکان می دهد الگوریتم هایی را برای محاسبه میانگین خطا بر اساس داده های یک نمونه واحد بدست آوریم. به طور خاص، میانگین خطای میانگین نمونه را می توان بر اساس استدلال زیر تعیین کرد. یک نمونه (،…) متشکل از واحدها وجود دارد. برای نمونه، میانگین نمونه به عنوان تخمینی از میانگین کلی تعریف می شود. هر مقدار (،...) در زیر علامت جمع باید به عنوان یک متغیر تصادفی مستقل در نظر گرفته شود، زیرا با تکرار بی نهایت نمونه اول، دوم و غیره. واحدها می توانند هر یک از مقادیر موجود در جمعیت را دریافت کنند. از این رو از آنجایی که همانطور که مشخص است واریانس مجموع متغیرهای تصادفی مستقل برابر است با مجموع واریانس ها، پس . بنابراین میانگین خطای میانگین نمونه برابر خواهد بود و با حجم نمونه (از طریق جذر آن) و نسبت مستقیم با انحراف معیار مشخصه در جامعه عمومی رابطه معکوس دارد. این منطقی است، زیرا میانگین نمونه یک تخمین ثابت برای میانگین عمومی است و با افزایش حجم نمونه، مقدار آن به پارامتر تخمینی جمعیت عمومی نزدیک می‌شود. وابستگی مستقیم میانگین خطا به متغیر بودن یک مشخصه به این دلیل است که هر چه تنوع مشخصه در جمعیت عمومی بیشتر باشد، ساختن یک مدل مناسب از جامعه عمومی بر اساس نمونه دشوارتر است. در عمل، انحراف معیار یک مشخصه در جامعه با تخمین آن در نمونه جایگزین می‌شود و سپس فرمول محاسبه میانگین خطای میانگین نمونه به شکل زیر در می‌آید: با در نظر گرفتن سوگیری واریانس نمونه، نمونه انحراف معیار با استفاده از فرمول = محاسبه می شود. از آنجایی که نماد n نشان دهنده حجم نمونه است. ، پس از مخرج هنگام محاسبه انحراف معیار نباید از حجم نمونه (n) استفاده شود، بلکه به اصطلاح از تعداد درجه آزادی (n-1) استفاده شود. تعداد درجات آزادی به عنوان تعداد واحدهایی در یک مجموعه درک می شود که اگر مشخصه ای از کل مشخص شود، آزادانه می تواند تغییر کند (تغییر کند). در مورد ما، از آنجایی که میانگین نمونه تعیین می شود، واحدها می توانند آزادانه تغییر کنند.

جدول 2.2 فرمول هایی را برای محاسبه میانگین خطاهای برآوردهای نمونه مختلف ارائه می دهد. همانطور که از این جدول مشاهده می شود، میانگین خطا برای همه برآوردها با حجم نمونه رابطه معکوس دارد و با تغییرپذیری رابطه مستقیم دارد. این را می توان در مورد میانگین خطای کسر نمونه (فرکانس) نیز گفت. زیر ریشه واریانس مشخصه جایگزین است که از نمونه ایجاد شده است ()

فرمول های ارائه شده در جدول 2.2 به انتخاب تصادفی و مکرر واحدها در نمونه اشاره دارد. با روش های دیگر انتخاب، که در زیر مورد بحث قرار خواهد گرفت، فرمول ها کمی تغییر خواهند کرد.

جدول 2.2

فرمول های محاسبه میانگین خطاهای برآورد نمونه

2.2.3 خطای نمونه گیری حاشیه ایآگاهی از برآورد و میانگین خطای آن در برخی موارد کاملاً ناکافی است. به عنوان مثال، هنگام استفاده از هورمون ها در تغذیه حیوانات، دانستن تنها اندازه متوسط ​​باقی مانده های مضر تجزیه نشده آنها و میانگین خطای آنها به معنای قرار دادن مصرف کنندگان محصول در معرض خطر جدی است. این به شدت نیاز به تعیین حداکثر ( حداکثر خطا). هنگام استفاده از روش نمونه گیری، حداکثر خطا نه به صورت یک مقدار خاص، بلکه در قالب مرزهای مساوی تنظیم می شود.

(فاصله ها) در هر جهت از مقدار ارزیابی.

تعیین حدود حداکثر خطا بر اساس ویژگی های توزیع خطاهای خاص است. برای نمونه های به اصطلاح بزرگ، که تعداد آنها بیش از 30 واحد است ()، خطاهای خاص مطابق با قانون توزیع عادی توزیع می شوند. با نمونه های کوچک () خطاهای خاص مطابق با قانون توزیع Gosset توزیع می شوند

(دانشجو). در رابطه با خطاهای خاص در میانگین نمونه، تابع توزیع نرمال به شکل زیر است: , چگالی احتمال وقوع مقادیر معین کجاست، مشروط بر اینکه میانگین نمونه کجا باشد; - میانگین کلی، - میانگین خطا برای میانگین نمونه. از آنجایی که خطای متوسط ​​() یک مقدار ثابت است، خطاهای خاص مطابق با قانون عادی توزیع می شوند که به صورت سهم خطای متوسط ​​یا به اصطلاح انحرافات نرمال شده بیان می شود.

با گرفتن انتگرال تابع توزیع نرمال، می‌توانیم احتمال اینکه خطا در بازه معینی از تغییر t باشد و احتمال اینکه خطا از این بازه فراتر خواهد رفت (رویداد مخالف) را تعیین کنیم. به عنوان مثال، احتمال اینکه خطا از نصف خطای میانگین تجاوز نکند (در هر جهت از میانگین عمومی) 0.3829 است، که خطا در یک خطای متوسط ​​- 0.6827، 2 خطای متوسط ​​- 0.9545 و غیره قرار می گیرد.

رابطه بین سطح احتمال و فاصله تغییر t (و در نهایت بازه تغییر خطا) به ما اجازه می دهد تا به تعیین بازه (یا حدود) حداکثر خطا نزدیک شویم و مقدار آن را با احتمال مرتبط کنیم. احتمال وقوع احتمال وقوع خطا در یک بازه زمانی است. احتمال وقوع "اطمینان" خواهد بود اگر رویداد مخالف (خطا خارج از بازه زمانی باشد) دارای چنین احتمالی باشد که بتوان از آن چشم پوشی کرد. بنابراین، سطح اطمینان احتمال، به عنوان یک قاعده، حداقل 0.90 تنظیم می شود (احتمال رویداد مخالف 0.10 است). هر چه وقوع خطاهای خارج از بازه تعیین شده پیامدهای منفی بیشتری داشته باشد، سطح اطمینان احتمال باید بالاتر باشد (95/0؛ 99/0؛ 999/0 و غیره).

با انتخاب سطح اطمینان احتمال از جدول انتگرال احتمال توزیع نرمال، باید مقدار مربوط به t را پیدا کنید و سپس با استفاده از عبارت = فاصله حداکثر خطا را تعیین کنید. معنای مقدار بدست آمده به این صورت است: با سطح احتمال اطمینان پذیرفته شده، حداکثر خطای میانگین نمونه از مقدار بیشتر نخواهد شد.

برای تعیین حدود حداکثر خطا بر اساس نمونه‌های بزرگ برای سایر تخمین‌ها (واریانس، انحراف استاندارد، نسبت و غیره)، با در نظر گرفتن این واقعیت که از الگوریتم متفاوتی برای تعیین میانگین استفاده می‌شود، از رویکرد مورد بحث در بالا استفاده می‌شود. خطا برای هر برآورد

همانطور که در مورد نمونه های کوچک ()، همانطور که قبلا ذکر شد، توزیع خطاهای تخمین در این مورد با توزیع t - Student مطابقت دارد. ویژگی این توزیع این است که به عنوان پارامتر در آن، همراه با خطا، حجم نمونه، یا بهتر است بگوییم نه حجم نمونه، بلکه تعداد درجات آزادی با افزایش حجم نمونه، توزیع t-Student وجود دارد به نرمال نزدیک می شود و در این توزیع ها عملاً منطبق هستند. با مقایسه مقادیر مقدار t-Student و توزیع t-نرمال در سطح اطمینان یکسان، می توان گفت که مقدار t-Student همیشه از توزیع t-نرمال بیشتر است و تفاوت ها با کاهش در افزایش می یابد. حجم نمونه و با افزایش سطح اطمینان احتمال. در نتیجه، هنگام استفاده از نمونه‌های کوچک، در مقایسه با نمونه‌های بزرگ، محدودیت‌های گسترده‌تری برای حداکثر خطا وجود دارد و این محدودیت‌ها با کاهش حجم نمونه و افزایش سطح اطمینان احتمال گسترش می‌یابد.

مفهوم و محاسبه خطای نمونه گیری.

وظیفه مشاهده نمونه این است که بر اساس برخی از آنها که در معرض مشاهده قرار گرفته اند، ایده های درستی در مورد شاخص های کل کل جمعیت ارائه دهد. انحراف احتمالی نسبت نمونه و میانگین نمونه از نسبت و میانگین در جامعه نامیده می شود خطای نمونه گیری یا خطای نمایندگی هر چه اندازه این خطا بزرگتر باشد، شاخص های مشاهده نمونه با شاخص های جمعیت عمومی تفاوت بیشتری دارد.

تفاوت دارند:

خطاهای نمونه گیری؛

خطاهای ثبت نام

خطاهای ثبت نامزمانی بوجود می آیند که یک واقعیت در طول فرآیند مشاهده به اشتباه ثابت شود. آنها هم برای مشاهده مداوم و هم برای مشاهده انتخابی مشخص هستند، اما در مشاهده انتخابی تعداد آنها کمتر است.

ذاتاً خطاها عبارتند از:

تمایلی - عمدی، یعنی. بهترین یا بدترین واحدهای جامعه انتخاب شدند. در این صورت مشاهدات معنی خود را از دست می دهند.

تصادفی - اصل اساسی سازمانی مشاهده نمونه گیری پرهیز از انتخاب عمدی است، به عنوان مثال. از رعایت دقیق اصل انتخاب تصادفی اطمینان حاصل کنید.

قانون کلی انتخاب تصادفیاین است: واحدهای منفرد از جمعیت عمومی باید دقیقاً شرایط و فرصت‌های مشابهی برای قرار گرفتن در تعداد واحدهای موجود در نمونه داشته باشند. این مشخصه استقلال نتیجه نمونه گیری از اراده ناظر است. اراده ناظر باعث بروز خطاهای احتمالی می شود. خطای نمونه گیری در نمونه گیری تصادفی تصادفی است. اندازه انحراف ویژگی های عمومی از ویژگی های نمونه را مشخص می کند.

با توجه به اینکه ویژگی ها در جامعه مورد مطالعه متفاوت است، ترکیب واحدهای موجود در نمونه ممکن است با ترکیب واحدهای کل جامعه منطبق نباشد. این به آن معنا است آرو منطبق با دبلیوو . اختلاف احتمالی بین این ویژگی ها با خطای نمونه گیری مشخص می شود که با فرمول تعیین می شود:

واریانس کلی کجاست

واریانس نمونه کجاست

این نشان می‌دهد که واریانس کلی با یک عامل متفاوت از واریانس نمونه است.

انتخاب مکرر و غیر تکراری وجود دارد. ماهیت انتخاب مکرر این است که هر واحدی که در نمونه گنجانده شده است، پس از مشاهده به جامعه عمومی باز می گردد و قابل بررسی مجدد است. هنگام نمونه گیری مجدد، میانگین خطای نمونه گیری محاسبه می شود:

برای نشانگر سهم یک مشخصه جایگزین، واریانس نمونه با فرمول تعیین می شود:

در عمل، انتخاب مکرر به ندرت استفاده می شود. با انتخاب غیر تکراری، اندازه جمعیت عمومی ندر طول نمونه برداری کاهش می یابد، فرمول میانگین خطای نمونه گیری برای یک مشخصه کمی به شکل زیر است:



، سپس

یکی از مقادیر ممکن که در آن سهم مشخصه مورد مطالعه ممکن است برابر باشد:

خطای نمونه گیری ویژگی جایگزین کجاست.

مثال.

هنگام نمونه برداری 10 درصد از محصولات در دسته ای از محصولات نهایی با استفاده از روش بدون نمونه گیری مکرر، داده های زیر در مورد رطوبت نمونه ها به دست آمد.

میانگین درصد رطوبت، پراکندگی، انحراف معیار، با احتمال 0.954 حد ممکن را تعیین کنید که در آن میانگین انتظار می رود. درصد رطوبت تمام محصولات نهایی، با احتمال 0.987 حد ممکن وزن مخصوص محصولات استاندارد، مشروط بر اینکه دسته غیر استاندارد شامل محصولاتی با رطوبت حداکثر 13 و بالاتر از 19 درصد باشد.

فقط با احتمال معینی می توان گفت که سهم کلی از سهم نمونه و میانگین کلی از نمونه میانگین انحراف دارد. تییک بار.

در آمار به این انحرافات گفته می شود حداکثر خطای نمونه گیری و تعیین شده اند.

احتمال قضاوت را می توان با توجه به افزایش یا کاهش داد تییک بار. با احتمال 0.683، در 0.954، در 0.987، سپس شاخص های جامعه عمومی از شاخص های نمونه تعیین می شود.

اختلاف بین مقدار هر شاخصی که از طریق مشاهدات آماری یافت می شود و اندازه واقعی آن نامیده می شود خطاهای مشاهده . بسته به دلایل وقوع آنها، خطاهای ثبت نام و خطاهای نمایندگی متمایز می شوند.

خطاهای ثبت نام در نتیجه شناسایی نادرست حقایق یا ثبت اشتباه در فرآیند مشاهده یا مصاحبه ایجاد می شود. آنها می توانند تصادفی یا سیستماتیک باشند. خطاهای ثبت نام تصادفی می تواند هم توسط پاسخ دهندگان در پاسخ های خود و هم توسط مصاحبه کنندگان انجام شود. خطاهای سیستماتیک می توانند هم عمدی و هم غیرعمدی باشند. تحریفات عمدی - آگاهانه و تمایلی در وضعیت واقعی امور. موارد غیر عمدی به دلایل تصادفی مختلف (غفلت، بی توجهی) ایجاد می شود.

خطاهای نمایندگی (نمایندگی) در نتیجه یک بررسی ناقص ایجاد می شود و اگر جمعیت مورد بررسی به طور کامل جمعیت عمومی را بازتولید نکند. آنها می توانند تصادفی و سیستماتیک باشند. خطاهای تصادفی بازنمایی انحرافاتی هستند که در هنگام مشاهده ناقص به دلیل این واقعیت که مجموعه واحدهای مشاهده انتخابی (نمونه) به طور کامل کل جمعیت را به عنوان یک کل بازتولید نمی کنند، به وجود می آیند. خطاهای سیستماتیک نمایندگی انحرافاتی هستند که در نتیجه نقض اصول انتخاب تصادفی واحدها ایجاد می شوند. خطاهای نمایندگی به طور ارگانیک در مشاهده انتخابی ذاتی هستند و به دلیل این واقعیت ایجاد می شوند که جامعه نمونه به طور کامل جمعیت عمومی را بازتولید نمی کند. اجتناب از خطاهای نمایندگی غیرممکن است، با این حال، با استفاده از روش های نظریه احتمال مبتنی بر استفاده از قضایای حدی قانون اعداد بزرگ، این خطاها را می توان به حداقل مقادیر کاهش داد که مرزهای آن با دقت کافی بالا تعیین می شود.

خطاهای نمونه گیری – تفاوت بین ویژگی های نمونه و جامعه عمومی. برای مقدار متوسط، خطا با فرمول تعیین می شود

جایی که

اندازه
تماس گرفت خطای شدید نمونه ها.

حداکثر خطای نمونه گیری یک مقدار تصادفی است. قضایای حدی قانون اعداد بزرگ به مطالعه الگوهای خطاهای نمونه گیری تصادفی اختصاص دارد. این الگوها به طور کامل در قضایای P. L. Chebyshev و A. M. Lyapunov آشکار می شوند.

قضیه P. L. Chebyshev در رابطه با روش مورد بررسی، می توان آن را به صورت زیر فرمول بندی کرد: با تعداد کافی مشاهدات مستقل، می توان با احتمال نزدیک به یک (یعنی تقریباً با قطعیت) ادعا کرد که انحراف نمونه میانگین از میانگین عمومی به اندازه دلخواه کوچک خواهد بود. در قضیه P. L. Chebyshev ثابت شده است که بزرگی خطا نباید از . به نوبه خود، ارزش بیان انحراف معیار میانگین نمونه از میانگین کلی، به متغیر بودن مشخصه در جامعه بستگی دارد. و تعداد واحدهای انتخاب شده n. این وابستگی با فرمول بیان می شود

, (7.2)

جایی که به روش نمونه گیری نیز بستگی دارد.

اندازه =تماس گرفت میانگین خطای نمونه گیری در این بیان - واریانس عمومی n- اندازه جامعه نمونه

بیایید در نظر بگیریم که چگونه تعداد واحدهای انتخاب شده بر میانگین خطا تأثیر می گذارد n. از نظر منطقی، تأیید اینکه وقتی تعداد واحدهای زیادی انتخاب می‌شوند، تفاوت بین میانگین‌ها کمتر خواهد بود، کار دشواری نیست، یعنی بین میانگین خطای نمونه‌گیری و تعداد واحدهای انتخاب شده رابطه معکوس وجود دارد. در این حالت فقط یک رابطه ریاضی معکوس شکل نمی گیرد، بلکه رابطه ای که نشان می دهد مجذور اختلاف بین میانگین ها با تعداد واحدهای انتخاب شده نسبت معکوس دارد.

افزایش در تغییرپذیری یک مشخصه مستلزم افزایش انحراف معیار و در نتیجه یک خطا است. اگر فرض کنیم که همه واحدها دارای مقدار یکسانی از ویژگی باشند، انحراف معیار صفر می شود و خطای نمونه گیری نیز از بین می رود. سپس نیازی به اعمال نمونه گیری نیست. با این حال، باید در نظر داشت که میزان تغییرپذیری یک صفت در جمعیت عمومی ناشناخته است، زیرا اندازه واحدهای موجود در آن ناشناخته است. محاسبه تنها متغیر بودن یک مشخصه در یک جامعه نمونه امکان پذیر است. رابطه بین واریانس های جمعیت عمومی و نمونه با فرمول بیان می شود

از آنجایی که ارزش به اندازه کافی بزرگ nنزدیک به وحدت است، تقریباً می توانیم فرض کنیم که واریانس نمونه برابر با واریانس عمومی است، یعنی.

در نتیجه، میانگین خطای نمونه گیری نشان می دهد که چه انحرافات احتمالی ویژگی های جامعه نمونه از ویژگی های مربوط به جامعه عمومی وجود دارد. با این حال، بزرگی این خطا را می توان با احتمال خاصی قضاوت کرد. مقدار احتمال با ضریب نشان داده می شود

قضیه A. M. Lyapunov . A. M. Lyapunov ثابت کرد که توزیع میانگین نمونه (و بنابراین انحراف آنها از میانگین کلی) با تعداد کافی مشاهدات مستقل به اندازه کافی نرمال است، مشروط بر اینکه جمعیت عمومی دارای میانگین محدود و واریانس محدود باشد.

از نظر ریاضی قضیه لیاپانوفمی توان اینگونه نوشت:

(7.3)

جایی که
, (7.4)

جایی که
- ثابت ریاضی؛

خطای نمونه برداری حاشیه ای , که این امکان را فراهم می کند تا دریابیم که مقدار میانگین عمومی در چه محدوده هایی قرار دارد.

مقادیر این انتگرال برای مقادیر مختلف ضریب اطمینان تیمحاسبه و در جداول ریاضی ویژه ارائه شده است. به ویژه زمانی که:

زیرا تینشان دهنده احتمال مغایرت است
یعنی احتمال تفاوت میانگین کلی با میانگین نمونه چقدر خواهد بود، سپس می توان آن را به صورت زیر خواند: با احتمال 0.683 می توان بیان کرد که تفاوت بین میانگین های نمونه و میانگین های عمومی از یک مقدار بیشتر نمی شود. میانگین خطای نمونه گیری به عبارت دیگر در 68.3 درصد موارد خطای بازنمایی از حد مجاز فراتر نخواهد رفت
با احتمال 0.954 می توان بیان کرد که خطای بازنمایی بیشتر نیست
(یعنی در 95 درصد موارد). با احتمال 0.997، یعنی کاملاً نزدیک به وحدت، می‌توان انتظار داشت که اختلاف بین نمونه و میانگین عمومی سه برابر میانگین خطای نمونه‌گیری و غیره بیشتر نشود.

به طور منطقی، ارتباط در اینجا کاملاً واضح به نظر می رسد: هر چه محدودیت هایی که در آن یک خطای احتمالی مجاز است بیشتر باشد، احتمال قضاوت در مورد بزرگی آن بیشتر است.

دانستن مقدار میانگین نمونه صفت
و خطای نمونه گیری حاشیه ای
، می توان حدود (حدود) را تعیین کرد که میانگین کلی در آن قرار دارد

1 . نمونه گیری تصادفی مناسب - این روش بر انتخاب واحدها از جمعیت عمومی بدون هیچ گونه تقسیم بندی به بخش ها یا گروه ها متمرکز است. در عین حال، به منظور رعایت اصل اولیه نمونه گیری - فرصت برابر برای انتخاب همه واحدهای عمومی - از طرحی برای استخراج تصادفی واحدها با قرعه کشی (قرعه کشی) یا جدول اعداد تصادفی استفاده می شود. . انتخاب واحدهای تکراری و غیر تکراری امکان پذیر است

میانگین خطای یک نمونه واقعا تصادفی، انحراف معیار مقادیر احتمالی میانگین نمونه از میانگین عمومی است. میانگین خطاهای نمونه گیری با استفاده از روش نمونه گیری صرفاً تصادفی در جدول ارائه شده است. 7.2.

جدول 7.2

میانگین خطای نمونه گیری μ

هنگام انتخاب

تکرار کرد

قابل تکرار

برای میانگین

از نمادهای زیر در جدول استفاده شده است:

- واریانس جامعه نمونه؛

- اندازهی نمونه؛

- اندازه جمعیت عمومی؛

- نسبت نمونه از واحدهای دارای صفت مورد مطالعه؛

- تعداد واحدهای دارای ویژگی مورد مطالعه؛

- اندازهی نمونه.

برای افزایش دقت به جای ضریب باید ضریب بگیری
، اما با تعداد زیادی نتفاوت بین این عبارات هیچ اهمیت عملی ندارد.

حداکثر خطای یک نمونه واقعا تصادفی
با فرمول محاسبه می شود

, (7.6)

جایی که تی - ضریب اطمینان به مقدار احتمال بستگی دارد.

مثال.هنگام بررسی صد نمونه از محصولات انتخاب شده از دسته به طور تصادفی، 20 نمونه غیر استاندارد بودند. با احتمال 0.954، حدودی را تعیین کنید که در آن سهم محصولات غیر استاندارد در دسته قرار دارد.

راه حل. بیایید سهم عمومی را محاسبه کنیم ( آر):
.

سهم محصولات غیر استاندارد:
.

حداکثر خطای سهم نمونه با احتمال 0.954 با استفاده از فرمول (7.6) با استفاده از فرمول جدول محاسبه می شود. 7.2 برای اشتراک گذاری:

با احتمال 0.954 می توان عنوان کرد که سهم محصولات غیر استاندارد در یک دسته از کالاها در محدوده 12٪ ≤ پ≤ 28 %.

در عمل طراحی مشاهده نمونه، نیاز به تعیین اندازه نمونه وجود دارد که برای اطمینان از دقت خاصی در محاسبه میانگین های عمومی ضروری است. حداکثر خطای نمونه گیری و احتمال آن داده شده است. از فرمول
و فرمول میانگین خطاهای نمونه گیری، حجم نمونه مورد نیاز تعیین می شود. فرمول های تعیین حجم نمونه ( n) به روش انتخاب بستگی دارد. محاسبه حجم نمونه برای یک نمونه کاملا تصادفی در جدول آورده شده است. 7.3.

جدول 7.3

انتخاب تخمینی

برای متوسط

تکرار شد

بی تکرار

2 . نمونه برداری مکانیکی - با این روش، آنها از در نظر گرفتن ویژگی های خاصی از مکان اشیاء در جمعیت عمومی، ترتیب آنها (بر اساس لیست، شماره، الفبا) اقدام می کنند. نمونه برداری مکانیکی با انتخاب اشیاء فردی از جمعیت عمومی در یک بازه زمانی معین (هر 10 یا 20) انجام می شود. فاصله در رابطه با محاسبه می شود ، جایی که n- اندازهی نمونه، ن- اندازه جمعیت عمومی بنابراین، اگر انتظار می رود از یک جمعیت 500000 واحدی، نمونه 2% به دست آید، یعنی 10000 واحد انتخاب شود، نسبت انتخاب خواهد بود.
انتخاب واحدها مطابق با نسبت تعیین شده در فواصل منظم انجام می شود. اگر مکان اشیاء در جمعیت عمومی تصادفی باشد، نمونه برداری مکانیکی از نظر محتوا شبیه به انتخاب تصادفی است. در انتخاب مکانیکی فقط از نمونه برداری غیر تکراری استفاده می شود.

میانگین خطا و اندازه نمونه در طول انتخاب مکانیکی با استفاده از فرمول‌های نمونه‌برداری تصادفی مناسب محاسبه می‌شود (جدول 7.2 و 7.3 را ببینید).

3 . نمونه معمولی ، که در آن جمعیت عمومی بر اساس برخی ویژگی های اساسی به گروه های معمولی تقسیم می شود. انتخاب واحدها از گروه های معمولی انجام می شود. با این روش انتخاب، جمعیت عمومی به گروه هایی تقسیم می شوند که از برخی جهات همگن هستند که ویژگی های خاص خود را دارند و سؤال به تعیین حجم نمونه از هر گروه می رسد. شاید نمونه برداری یکنواخت – با این روش تعداد واحدهای یکسانی از هر گروه معمولی انتخاب می شود
این رویکرد تنها در صورتی توجیه می شود که تعداد گروه های معمولی اصلی برابر باشد. با انتخاب معمولی، نامتناسب با اندازه گروه ها، تعداد کل واحدهای انتخاب شده بر تعداد گروه های معمولی تقسیم می شود، مقدار حاصل تعداد انتخاب از هر گروه معمولی را می دهد.

یک شکل پیشرفته تر از انتخاب است نمونه گیری متناسب . طرحی برای تشکیل یک جامعه نمونه زمانی متناسب نامیده می شود که تعداد نمونه های گرفته شده از هر گروه معمولی در جامعه عمومی با اعداد، واریانس ها (یا ترکیبی از هر دو اعداد و واریانس ها) متناسب باشد. ما به صورت مشروط حجم نمونه را 100 واحد تعیین می کنیم و واحدها را از گروه ها انتخاب می کنیم:

متناسب با اندازه جمعیت عمومی آنها (جدول 7.4). جدول نشان می دهد:

ن من- اندازه گروه معمولی؛

د j- اشتراک گذاری ( نمن/ ن);

ن- اندازه جمعیت عمومی؛

n من- حجم نمونه از یک گروه معمولی محاسبه می شود:

, (7.7)

n- حجم نمونه از جامعه عمومی.

جدول 7.4

ن من

د j

n من

متناسب با انحراف معیار (جدول 7.5).

اینجا  من- انحراف معیار گروه های معمولی؛

n من - حجم نمونه از یک گروه معمولی با استفاده از فرمول محاسبه می شود

(7.8)

جدول 7.5

ن من

n من

ترکیب شده (جدول 7.6).

حجم نمونه با استفاده از فرمول محاسبه می شود

. (7.9)

جدول 7.6

من ن من

هنگام انجام یک نمونه معمولی، انتخاب مستقیم از هر گروه با استفاده از نمونه گیری تصادفی انجام می شود.

میانگین خطاهای نمونه گیری با استفاده از فرمول های جدول محاسبه می شود. 7.7 بسته به روش انتخاب از گروه های معمولی.

جدول 7.7

روش انتخاب

تکرار شد

بی تکرار

برای متوسط

برای اشتراک گذاری

برای متوسط

برای اشتراک گذاری

نامتناسب با اندازه گروه

متناسب با اندازه گروه

متناسب با نوسانات گروه ها (سودآورترین است)

اینجا
- میانگین واریانس های درون گروهی گروه های معمولی؛

- نسبت واحدهای دارای صفت مورد مطالعه؛

- میانگین واریانس های درون گروهی برای سهم؛

- انحراف معیار در نمونه ای از منگروه معمولی

- حجم نمونه از یک گروه معمولی؛

- حجم کل نمونه؛

- حجم یک گروه معمولی؛

- حجم جمعیت عمومی

حجم نمونه از هر گروه معمولی باید متناسب با انحراف معیار در این گروه باشد
.محاسبه اعداد
مطابق فرمول های ارائه شده در جدول تولید شده است. 7.8.

جدول 7.8

4 . نمونه برداری سریال - مناسب در مواردی که واحدهای جمعیتی در گروه ها یا سری های کوچک ترکیب می شوند. در نمونه‌گیری سریالی، جمعیت عمومی به گروه‌هایی با اندازه مساوی – سری تقسیم می‌شوند. سری ها در جامعه نمونه انتخاب می شوند. ماهیت نمونه‌برداری سریال، انتخاب تصادفی یا مکانیکی سری‌ها است که در آن بررسی مداوم واحدها انجام می‌شود. میانگین خطای یک نمونه سریال با سری مساوی فقط به بزرگی واریانس بین گروه بستگی دارد. میانگین خطاها در جدول خلاصه شده است. 7.9.

جدول 7.9

روش انتخاب سری

برای متوسط

برای اشتراک گذاری

تکرار شد

بی تکرار

اینجا آر- تعداد سریال ها در جمعیت عمومی؛

r- تعداد سری های انتخابی؛

- پراکندگی میان سری (بین گروهی) وسایل؛

- پراکندگی بین سری (بین گروهی) سهم.

با انتخاب سریال، تعداد سری های انتخابی مورد نیاز مانند روش انتخاب کاملا تصادفی تعیین می شود.

تعداد نمونه های سریال با استفاده از فرمول های ارائه شده در جدول محاسبه می شود. 7.10.

جدول 7.10

مثال.در کارگاه مکانیکی کارخانه 100 کارگر در ده تیم کار می کنند. به منظور بررسی صلاحیت کارگران، نمونه 20 درصدی سریال غیر تکراری شامل دو تیم تهیه شد. توزیع زیر از کارگران بررسی شده بر اساس دسته به دست آمد:

دسته بندی کارگران تیپ 1

دسته بندی کارگران تیپ 2

دسته بندی کارگران تیپ 1

دسته بندی کارگران تیپ 2

لازم است با احتمال 0.997 حدودی تعیین شود که میانگین طبقه بندی کارگران در یک ماشین سازی در آن قرار دارد.

راه حل.اجازه دهید میانگین های نمونه برای تیم ها و میانگین کلی را به عنوان میانگین وزنی میانگین های گروه تعیین کنیم:

اجازه دهید پراکندگی بین سری ها را با استفاده از فرمول (5.25) تعیین کنیم:

بیایید میانگین خطای نمونه گیری را با استفاده از فرمول جدول محاسبه کنیم. 7.9:

بیایید حداکثر خطای نمونه گیری را با احتمال 0.997 محاسبه کنیم:

با احتمال 0.997 می توان بیان کرد که میانگین رده کارگران یک ماشین سازی در محدوده

    فرمول اطمینان برای برآورد کلی هیچ سهمی از صفت میانگین مربعات خطای تکرار و نمونه گیری غیر تکراری و ایجاد فاصله اطمینان برای سهم کلی این صفت

  1. فرمول اطمینان برای تخمین میانگین عمومی. میانگین مربعات خطای نمونه های تکراری و تکرار نشده و ایجاد فاصله اطمینان برای میانگین کلی.

ایجاد فاصله اطمینان برای میانگین کلی و سهم کلی برای نمونه های بزرگ . برای ساخت فواصل اطمینان برای پارامترهای جمعیت های عمومی، m.b. 2 رویکرد بر اساس آگاهی از توزیع دقیق (برای یک اندازه نمونه معین n) یا مجانبی (برای n → ∞) ویژگی های نمونه (یا برخی از توابع آنها) اجرا شده است. رویکرد اول بیشتر در هنگام ساخت تخمین های فاصله ای پارامترها برای نمونه های کوچک اجرا می شود. این بخش رویکرد دوم را مورد بحث قرار می دهد که برای نمونه های بزرگ (به ترتیب صدها مشاهده) قابل استفاده است.

قضیه . این باور که انحراف میانگین نمونه (یا سهم) از میانگین عمومی (یا سهم) از عدد Δ > 0 (در مقدار مطلق) تجاوز نخواهد کرد برابر است با:

جایی که

,

جایی که
.

Ф(t) - تابع (انتگرال احتمال) لاپلاس.

فرمول ها نامگذاری شدند فرمول اطمینان برای میانگین و کسری .

انحراف معیار میانگین نمونه و به اشتراک گذاری نمونه نمونه گیری تصادفی مناسب نامیده می شود میانگین مربعات (استاندارد) خطا نمونه ها (برای نمونه گیری غیر تکراری بر این اساس مشخص می کنیم و ).

نتیجه 1 . برای یک سطح اطمینان داده شده γ، حداکثر خطای نمونه برابر است با t برابر میانگین مربعات خطا، که در آن Ф(t) = γ، یعنی.

,

.

نتیجه 2 . تخمین های فاصله ای (فاصله های اطمینان) برای میانگین عمومی و سهم عمومی را می توان با استفاده از فرمول های زیر یافت:

,

.

  1. تعیین حجم مورد نیاز نمونه های تکراری و غیر تکراری هنگام تخمین میانگین کلی و سهم.

برای انجام یک مشاهده نمونه، تعیین صحیح اندازه نمونه n بسیار مهم است، که تا حد زیادی زمان، کار و هزینه های لازم برای تعیین n را تعیین می کند، لازم است که قابلیت اطمینان (اطمینان) تخمین γ و دقت تنظیم شود. (حداکثر خطای نمونه گیری) Δ .

اگر حجم نمونه برداری مکرر n یافت شود، حجم نمونه گیری غیر تکراری مربوطه n" را می توان با فرمول تعیین کرد:

.

زیرا
، پس با همان دقت و پایایی تخمین ها، حجم نمونه برداری غیر تکراری n" همیشه کمتر از حجم نمونه برداری مکرر n است.

  1. فرضیه آماری و آزمون آماری. خطاهای نوع 1 و 2 سطح اهمیت و قدرت معیار. اصل یقین عملی.

تعریف . فرضیه آماری هر فرضی در مورد نوع یا پارامترهای یک قانون توزیع ناشناخته است.

فرضیه های آماری ساده و پیچیده ای وجود دارد. فرضیه ساده بر خلاف پیچیده، تابع توزیع نظری SW را به طور کامل تعیین می کند.

فرضیه مورد آزمایش معمولا نامیده می شود خالی (یا پایه ای ) و H 0 را نشان می دهیم. همراه با فرضیه صفر در نظر می گیریم جایگزین ، یا رقابت ، فرضیه H 1 که نفی منطقی H 0 است. فرضیه صفر و جایگزین نشان دهنده دو انتخاب انجام شده در مسائل آزمون فرضیه های آماری است.

ماهیت آزمایش یک فرضیه آماری این است که از یک مشخصه نمونه (آمار) به طور خاص گردآوری شده استفاده شود.
، از نمونه بدست آمده است
، که توزیع دقیق یا تقریبی آن مشخص است.

سپس مقدار بحرانی از این توزیع نمونه گیری تعیین می شود - به گونه ای که اگر فرضیه H 0 درست باشد، آن باور
کم اهمیت؛ به طوری که با رعایت اصل یقین عملی، در شرایط این مطالعه واقعه
می تواند (با مقداری ریسک) عملاً غیرممکن در نظر گرفته شود. بنابراین، اگر در این مورد خاص یک انحراف تشخیص داده شود
، سپس فرضیه H 0 رد می شود، در حالی که ظاهر مقدار
، با فرضیه H 0 سازگار در نظر گرفته می شود که سپس پذیرفته می شود (به طور دقیق تر، رد نمی شود). قاعده ای که به موجب آن فرضیه H 0 رد یا پذیرفته می شود نامیده می شود معیار آماری یا آزمون آماری .

اصل یقین عملی:

اگر احتمال رخداد A در یک آزمون داده شده بسیار کم است، در این صورت اگر آزمون یک بار انجام شود، می توانید مطمئن باشید که رویداد A رخ نخواهد داد و در عمل طوری رفتار کنید که گویی رویداد A کاملا غیرممکن است.

بنابراین، مجموعه مقادیر ممکن آمار - معیار (آمار بحرانی) به 2 زیر مجموعه مجزا تقسیم می شود: منطقه بحرانی(منطقه رد فرضیه) دبلیوو محدوده مقادیر قابل قبول(حوزه پذیرش فرضیه) . اگر مقدار واقعی مشاهده شده از آماره معیار در ناحیه بحرانی W قرار می گیرد، سپس فرضیه H 0 رد می شود. در این مورد، چهار حالت ممکن است:

تعریف . احتمال α خطای نوع دوم، یعنی. رد فرضیه H 0 زمانی که درست باشد نامیده می شود سطح اهمیت ، یا اندازه معیار .

احتمال خطای نوع 2، یعنی. فرضیه H 0 را زمانی که نادرست است، که معمولاً با β نشان داده می شود، بپذیرید.

تعریف . احتمال (1-β) عدم ایجاد خطای نوع 2، یعنی. رد فرضیه H 0 در صورت نادرست بودن نامیده می شود قدرت (یا تابع توان ) شاخص .

باید منطقه بحرانی را ترجیح داد که در آن قدرت معیار بیشتر است.