داده های آماری قابل اعتماد مشاهده اهمیت آماری آستانه های مهم در مناطق خاص

امروز واقعاً خیلی آسان است: می‌توانید به سمت رایانه بروید و بدون آگاهی کم یا بی‌اطلاع از کاری که انجام می‌دهید، هوشمندی و مزخرفات را با سرعتی واقعاً شگفت‌آور خلق کنید. (جی. باکس)

اصطلاحات و مفاهیم اولیه آمار پزشکی

در این مقاله برخی از مفاهیم آماری کلیدی را که در انجام تحقیقات پزشکی مرتبط هستند، ارائه خواهیم کرد. این اصطلاحات با جزئیات بیشتری در مقالات مربوطه مورد بحث قرار گرفته است.

تغییر

تعریف.درجه پراکندگی داده ها (مقادیر ویژگی) در محدوده مقادیر

احتمال

تعریف. احتمال، درجه امکان وقوع یک رویداد معین در شرایط معین است.

مثال. اجازه دهید تعریف این عبارت را در جمله "احتمال بهبودی هنگام استفاده از داروی آریمیدکس 70٪" توضیح دهیم. این رویداد "بهبود بیمار" است، شرایط "بیمار Arimidex مصرف می کند"، درجه احتمال 70٪ است (به طور کلی، از 100 نفری که Arimidex مصرف می کنند، 70 نفر بهبود می یابند).

احتمال تجمعی

تعریف.احتمال تجمعی زنده ماندن در زمان t برابر با نسبت بیماران زنده در آن زمان است.

مثال. اگر گفته شود که احتمال بقای تجمعی پس از یک دوره درمانی پنج ساله 0.7 است، این بدان معناست که از گروه بیماران مورد بررسی، 70٪ از تعداد اولیه زنده ماندند و 30٪ فوت کردند. به عبارت دیگر، از هر صد نفر، 30 نفر در 5 سال اول فوت کردند.

زمان قبل از رویداد

تعریف.زمان قبل از یک رویداد زمانی است که در برخی واحدها بیان می شود که از یک نقطه اولیه در زمان تا وقوع یک رویداد گذشته است.

توضیح. واحدهای زمان در تحقیقات پزشکی روز، ماه و سال است.

نمونه های معمولی از زمان های اولیه:

    شروع به نظارت بر بیمار کنید

    درمان جراحی

نمونه های معمولی از رویدادهای در نظر گرفته شده:

    پیشرفت بیماری

    وقوع عود

    مرگ بیمار

نمونه

تعریف.بخشی از یک جمعیت که با انتخاب به دست می آید.

بر اساس نتایج تجزیه و تحلیل نمونه، در مورد کل جامعه نتیجه گیری می شود که تنها در صورتی معتبر است که انتخاب به صورت تصادفی باشد. از آنجایی که انتخاب تصادفی از یک جامعه عملا غیرممکن است، باید تلاش کرد تا اطمینان حاصل شود که نمونه حداقل نماینده جامعه است.

نمونه های وابسته و مستقل

تعریف.نمونه هایی که در آنها افراد مورد مطالعه مستقل از یکدیگر انتخاب شدند. جایگزینی برای نمونه های مستقل، نمونه های وابسته (متصل، جفت) است.

فرضیه

فرضیه های دو طرفه و یک طرفه

ابتدا اجازه دهید کاربرد اصطلاح فرضیه در آمار را توضیح دهیم.

هدف بیشتر تحقیقات، آزمایش درستی برخی گزاره ها است. هدف از آزمایش دارو اغلب آزمایش این فرضیه است که یک دارو از داروی دیگر مؤثرتر است (به عنوان مثال، آریمیدکس مؤثرتر از تاموکسیفن است).

برای اطمینان از دقت مطالعه، عبارتی که تأیید می شود به صورت ریاضی بیان می شود. به عنوان مثال، اگر A تعداد سال‌هایی باشد که بیمار مصرف‌کننده آریمیدکس زندگی می‌کند و T تعداد سال‌هایی است که بیمار مصرف‌کننده تاموکسیفن زنده خواهد ماند، فرضیه مورد آزمایش را می‌توان به صورت A>T نوشت.

تعریف.فرضیه ای دو طرفه نامیده می شود که از تساوی دو کمیت تشکیل شده باشد.

مثالی از فرضیه دو طرفه: A=T.

تعریف. فرضیه ای یک طرفه (یک طرفه) نامیده می شود اگر شامل نابرابری دو کمیت باشد.

نمونه هایی از فرضیه های یک طرفه:

داده های دوگانه (دودویی).

تعریف.داده ها تنها با دو مقدار جایگزین معتبر بیان می شوند

مثال: بیمار "سالم" - "بیمار" است. ادم "است" - "نه".

فاصله اطمینان

تعریف.فاصله اطمینان برای یک کمیت، محدوده حول مقدار کمیتی است که مقدار واقعی آن کمیت در آن قرار دارد (با سطح مشخصی از اطمینان).

مثال. بگذارید مقدار مورد مطالعه تعداد بیماران در سال باشد. به طور متوسط ​​تعداد آنها 500 و فاصله اطمینان 95٪ (350، 900) است. یعنی به احتمال زیاد (با احتمال 95 درصد) در طول سال حداقل 350 و بیش از 900 نفر با کلینیک تماس خواهند گرفت.

تعیین. یک علامت اختصاری بسیار رایج این است: CI 95% یک فاصله اطمینان با سطح اطمینان 95٪ است.

پایایی، معناداری آماری (سطح P)

تعریف.اهمیت آماری یک نتیجه، معیاری برای اطمینان از «حقیقت» آن است.

هر تحقیقی تنها بر اساس بخشی از اشیاء انجام می شود. مطالعه اثربخشی یک دارو نه بر اساس همه بیماران در این سیاره، بلکه فقط بر روی گروه خاصی از بیماران انجام می شود (انجام تجزیه و تحلیل بر اساس همه بیماران به سادگی غیرممکن است).

بیایید فرض کنیم که در نتیجه تجزیه و تحلیل نتیجه خاصی گرفته شد (به عنوان مثال، استفاده از Arimidex به عنوان یک درمان کافی 2 برابر موثرتر از تاموکسیفن است).

سوالی که باید پرسیده شود این است: "چقدر می توان به این نتیجه اعتماد کرد؟"

تصور کنید که ما مطالعه ای را بر اساس تنها دو بیمار انجام دادیم. البته، در این مورد، نتایج باید با احتیاط درمان شوند. اگر تعداد زیادی از بیماران مورد بررسی قرار گرفتند (مقدار عددی "تعداد بزرگ" به موقعیت بستگی دارد)، آنگاه می توان به نتایج به دست آمده از قبل اعتماد کرد.

بنابراین، درجه اطمینان با مقدار p-level (p-value) تعیین می شود.

سطح p بالاتر مربوط به سطح پایین تری از اطمینان در نتایج به دست آمده از تجزیه و تحلیل نمونه است. به عنوان مثال، سطح p برابر با 0.05 (5٪) نشان می دهد که نتیجه گیری از تجزیه و تحلیل یک گروه خاص تنها یک ویژگی تصادفی از این اشیاء با احتمال تنها 5٪ است.

به عبارت دیگر، با احتمال بسیار بالا (95٪) می توان نتیجه را به همه اشیاء تعمیم داد.

بسیاری از مطالعات 5% را به عنوان یک مقدار سطح p قابل قبول در نظر می گیرند. این بدان معنی است که اگر برای مثال p = 0.01 باشد، می توان به نتایج اعتماد کرد، اما اگر p = 0.06، آنگاه نمی توانید.

مطالعه

مطالعه آینده نگرمطالعه ای است که در آن نمونه ها بر اساس یک عامل اولیه انتخاب شده و برخی از عوامل حاصل در نمونه ها مورد تجزیه و تحلیل قرار می گیرد.

مطالعه گذشته نگرمطالعه ای است که در آن نمونه ها بر اساس یک عامل حاصل انتخاب می شوند و برخی از عوامل اولیه در نمونه ها مورد تجزیه و تحلیل قرار می گیرند.

مثال. عامل اولیه یک زن باردار جوانتر/بالای 20 سال است. فاکتور حاصل این است که کودک سبکتر/سنگین تر از 2.5 کیلوگرم است. ما تجزیه و تحلیل می کنیم که آیا وزن کودک به سن مادر بستگی دارد یا خیر.

اگر ما 2 نمونه را انتخاب کنیم، یکی با مادران زیر 20 سال، دیگری با مادران بزرگتر، و سپس توده کودکان در هر گروه را تجزیه و تحلیل کنیم، آنگاه این یک مطالعه آینده نگر است.

اگر 2 نمونه را انتخاب کنیم، در یکی - مادرانی که بچه هایی با وزن کمتر از 2.5 کیلوگرم به دنیا آورده اند، در دیگری - سنگین تر، و سپس سن مادران هر گروه را تجزیه و تحلیل کنیم، آنگاه این یک مطالعه گذشته نگر است (طبیعاً چنین مطالعه ای است. را می توان تنها زمانی انجام داد که آزمایش کامل شود، یعنی همه بچه ها متولد شوند).

خروج

تعریف.یک پدیده بالینی مهم، نشانگر یا علامت آزمایشگاهی که به عنوان یک موضوع مورد علاقه محقق عمل می کند. هنگام انجام کارآزمایی های بالینی، نتایج به عنوان معیاری برای ارزیابی اثربخشی یک مداخله درمانی یا پیشگیرانه عمل می کنند.

اپیدمیولوژی بالینی

تعریف.علمی که امکان پیش بینی نتیجه خاصی را برای هر بیمار خاص بر اساس مطالعه سیر بالینی بیماری در موارد مشابه با استفاده از روش های علمی دقیق مطالعه بیماران برای اطمینان از صحت پیش بینی ها ممکن می سازد.

گروه

تعریف.گروهی از شرکت کنندگان در مطالعه با برخی ویژگی های مشترک در زمان شکل گیری آن متحد شدند و در یک دوره زمانی طولانی مطالعه کردند.

کنترل

کنترل تاریخی

تعریف.یک گروه کنترل تشکیل شد و در دوره قبل از مطالعه مورد بررسی قرار گرفت.

کنترل موازی

تعریف.یک گروه کنترل همزمان با تشکیل گروه اصلی تشکیل شد.

همبستگی

تعریف.یک رابطه آماری بین دو مشخصه (کمی یا ترتیبی) که نشان می دهد مقدار بزرگتر یک مشخصه در بخش خاصی از موارد با مقدار بزرگتر - در صورت همبستگی مثبت (مستقیم) - مشخصه دیگر یا کوچکتر مطابقت دارد. مقدار - در مورد همبستگی منفی (معکوس).

مثال. ارتباط معنی داری بین سطح پلاکت ها و لکوسیت ها در خون بیمار مشاهده شد. ضریب همبستگی 0.76 است.

ضریب ریسک (RR)

تعریف.نسبت ریسک، نسبت احتمال وقوع یک رویداد ("بد") برای گروه اول از اشیاء به احتمال وقوع همان رویداد برای گروه دوم از اشیاء است.

مثال. اگر احتمال ابتلا به سرطان ریه در افراد غیر سیگاری 20% و در افراد سیگاری 100% باشد، CR برابر با یک پنجم خواهد بود. در این مثال، اشیاء گروه اول غیر سیگاری، گروه دوم سیگاری هستند و بروز سرطان ریه به عنوان یک رویداد «بد» در نظر گرفته شده است.

بدیهی است که:

1) اگر KR = 1 باشد، احتمال وقوع یک رویداد در گروه ها یکسان است

2) اگر KP>1، آنگاه رویداد بیشتر با اشیاء از گروه اول رخ می دهد تا از گروه دوم

3) اگر KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

متاآنالیز

تعریف. باتجزیه و تحلیل آماری که نتایج چندین مطالعه را در مورد یک مشکل (معمولاً اثربخشی درمان، پیشگیری، روش‌های تشخیصی) خلاصه می‌کند. مطالعات ادغام نمونه بزرگتری برای تجزیه و تحلیل و قدرت آماری بیشتر برای مطالعات ترکیبی فراهم می کند. برای افزایش شواهد یا اطمینان در نتیجه گیری در مورد اثربخشی روش مورد مطالعه استفاده می شود.

روش کاپلان مایر (برآوردهای ضریب کاپلان مایر)

این روش توسط آماردانان E.L. Kaplan و Paul Meyer ابداع شد.

این روش برای محاسبه مقادیر مختلف مرتبط با زمان مشاهده بیمار استفاده می شود. نمونه هایی از این مقادیر:

    احتمال بهبودی در طی یک سال هنگام استفاده از دارو

    احتمال عود پس از جراحی در عرض سه سال پس از جراحی

    احتمال تجمعی بقا در پنج سال در میان بیماران مبتلا به سرطان پروستات پس از قطع عضو

اجازه دهید مزایای استفاده از روش Kaplan-Meier را توضیح دهیم.

مقادیر مقادیر در تجزیه و تحلیل "متعارف" (بدون استفاده از روش Kaplan-Meier) بر اساس تقسیم فاصله زمانی مورد نظر به فواصل محاسبه می شود.

به عنوان مثال، اگر احتمال مرگ بیمار را در عرض 5 سال مطالعه کنیم، فاصله زمانی را می توان به 5 قسمت تقسیم کرد (کمتر از 1 سال، 1-2 سال، 2-3 سال، 3-4 سال، 4- 5 سال)، بنابراین و برای 10 (هر کدام شش ماه)، یا برای تعداد دیگری از فواصل. نتایج برای پارتیشن های مختلف متفاوت خواهد بود.

انتخاب مناسب ترین پارتیشن کار آسانی نیست.

تخمین مقادیر بدست آمده با استفاده از روش Kaplan-Meier به تقسیم زمان مشاهده به فواصل زمانی بستگی ندارد، بلکه تنها به طول عمر هر بیمار بستگی دارد.

بنابراین، انجام تجزیه و تحلیل برای محقق آسانتر است و نتایج اغلب بهتر از نتایج تجزیه و تحلیل «متعارف» است.

منحنی کاپلان - مایر نموداری از منحنی بقا است که با استفاده از روش کاپلان مایر به دست آمده است.

مدل کاکس

این مدل توسط سر دیوید راکسبی کاکس (متولد 1924)، آماردان مشهور انگلیسی، نویسنده بیش از 300 مقاله و کتاب، اختراع شد.

مدل کاکس در موقعیت‌هایی استفاده می‌شود که کمیت‌های مورد مطالعه در تحلیل بقا به توابع زمان بستگی دارد. برای مثال، احتمال عود پس از t سال (t=1,2,...) ممکن است به لگاریتم زمان log(t) بستگی داشته باشد.

مزیت مهم روش ارائه شده توسط کاکس، کاربرد این روش در تعداد زیادی از موقعیت ها است (مدل محدودیت های سختی را در ماهیت یا شکل توزیع احتمال اعمال نمی کند).

بر اساس مدل کاکس می توان تحلیلی انجام داد (به نام آنالیز کاکس) که نتیجه آن مقدار ضریب ریسک و فاصله اطمینان برای ضریب ریسک است.

روش های آماری ناپارامتریک

تعریف.دسته ای از روش های آماری که عمدتاً برای تجزیه و تحلیل داده های کمی که توزیع نرمال را تشکیل نمی دهند و همچنین برای تجزیه و تحلیل داده های کیفی استفاده می شود.

مثال. برای تشخیص اهمیت تفاوت در فشار سیستولیک بیماران بسته به نوع درمان، از آزمون ناپارامتریک من ویتنی استفاده می کنیم.

علامت (متغیر)

تعریف. ایکسویژگی های موضوع مورد مطالعه (مشاهده). ویژگی های کیفی و کمی وجود دارد.

تصادفی سازی

تعریف.روشی برای توزیع تصادفی اشیاء تحقیق به گروه های اصلی و کنترل با استفاده از ابزارهای خاص (جدول یا شمارنده اعداد تصادفی، پرتاب سکه و سایر روش های اختصاص تصادفی شماره گروه به یک مشاهده شامل). تصادفی سازی تفاوت بین گروه ها در خصوص ویژگی های شناخته شده و ناشناخته را که به طور بالقوه بر نتیجه مورد مطالعه تأثیر می گذارد، به حداقل می رساند.

خطر

اسنادی- خطر اضافی یک نتیجه نامطلوب (به عنوان مثال، بیماری) به دلیل وجود یک ویژگی خاص (عامل خطر) در موضوع مطالعه. این بخشی از خطر ابتلا به بیماری است که با آن همراه است، توضیح داده می شود و در صورت حذف عامل خطر می توان آن را از بین برد.

ریسک نسبی- نسبت خطر یک وضعیت نامطلوب در یک گروه به خطر ابتلا به این وضعیت در گروه دیگر. در مطالعات آینده نگر و مشاهده ای زمانی که گروه ها از قبل تشکیل شده اند و وقوع شرایط مورد مطالعه هنوز رخ نداده است استفاده می شود.

آزمون چرخشی

تعریف.روشی برای بررسی پایداری، قابلیت اطمینان، عملکرد (اعتبار) یک مدل آماری با حذف پی در پی مشاهدات و محاسبه مجدد مدل. هر چه مدل‌های حاصل شبیه‌تر باشند، مدل پایدارتر و قابل اعتمادتر است.

رویداد

تعریف.نتایج بالینی مشاهده شده در مطالعه، مانند بروز عارضه، عود، بهبودی، مرگ.

طبقه بندی

تعریف. میک روش نمونه‌گیری که در آن، جمعیت همه شرکت‌کنندگانی که معیارهای ورود به مطالعه را دارند، ابتدا بر اساس یک یا چند ویژگی (معمولاً جنس، سن) که بالقوه بر نتیجه مورد علاقه تأثیر می‌گذارند، به گروه‌ها (قشر) تقسیم می‌شوند. این گروه ها (قشر) شرکت کنندگان به طور مستقل در دو گروه آزمایش و کنترل انتخاب می شوند. این به محقق اجازه می دهد تا بین ویژگی های مهم بین گروه های آزمایش و کنترل تعادل ایجاد کند.

جدول احتمالی

تعریف.جدولی از فرکانس های مطلق (اعداد) مشاهدات که ستون های آن با مقادیر یک مشخصه مطابقت دارد و ردیف ها با مقادیر یک مشخصه دیگر (در مورد یک جدول احتمالی دو بعدی). مقادیر فرکانس مطلق در سلول ها در محل تقاطع سطرها و ستون ها قرار دارند.

بیایید یک مثال از یک جدول احتیاطی ارائه دهیم. جراحی آنوریسم در 194 بیمار انجام شد. شدت ادم در بیماران قبل از جراحی مشخص است.

ادم\ نتیجه

بدون تورم 20 6 26
تورم متوسط 27 15 42
ادم تلفظ شده 8 21 29
m j 55 42 194

بنابراین از 26 بیمار بدون ادم، 20 بیمار پس از جراحی زنده ماندند و 6 بیمار فوت کردند. از 42 بیمار مبتلا به ادم متوسط، 27 بیمار زنده ماندند، 15 نفر فوت کردند و غیره.

تست مجذور کای برای جداول احتمالی

برای تعیین اهمیت (قابلیت اطمینان) تفاوت ها در یک علامت بسته به علامت دیگر (به عنوان مثال، نتیجه یک عمل بسته به شدت ادم)، از آزمون کای دو برای جداول احتمالی استفاده می شود:


شانس. فرصت

فرض کنید احتمال وقوع یک رویداد برابر با p باشد. سپس احتمال اینکه رویداد رخ ندهد 1-p است.

به عنوان مثال، اگر احتمال زنده ماندن بیمار پس از پنج سال 0.8 (80٪) باشد، احتمال مرگ او در این بازه زمانی 0.2 (20٪) است.

تعریف.شانس نسبت احتمال وقوع یک رویداد به احتمال عدم وقوع آن رویداد است.

مثال. در مثال ما (در مورد یک بیمار)، شانس 4 است، زیرا 0.8/0.2=4 است

بنابراین، احتمال بهبودی 4 برابر بیشتر از احتمال مرگ است.

تفسیر ارزش یک کمیت.

1) اگر شانس=1 باشد، احتمال وقوع یک رویداد برابر با احتمال عدم وقوع آن رویداد است.

2) اگر شانس > 1 باشد، پس احتمال وقوع رویداد بیشتر از احتمال رخ ندادن رویداد است.

3) اگر شانس<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

نسبت شانس

تعریف.نسبت شانس، نسبت شانس برای دسته اول اشیاء به نسبت شانس برای اشیاء گروه دوم است.

مثال. بیایید فرض کنیم که هم مردان و هم زنان تحت درمان قرار می گیرند.

احتمال زنده ماندن یک بیمار مرد پس از پنج سال 0.6 (60%) است. احتمال مرگ او در این بازه زمانی 0.4 (40%) است.

احتمالات مشابه برای زنان 0.8 و 0.2 است.

نسبت شانس در این مثال است

تفسیر ارزش یک کمیت.

1) اگر نسبت شانس = 1 باشد، شانس گروه اول برابر با شانس گروه دوم است.

2) اگر نسبت شانس > 1 باشد، شانس گروه اول بیشتر از شانس گروه دوم است.

3) اگر نسبت شانس<1, то шанс для первой группы меньше шанса для второй группы

فکر می کنید چه چیزی «نیمه دیگر» شما را خاص و معنادار می کند؟ آیا به شخصیت او یا احساساتی که نسبت به این شخص دارید مربوط است؟ یا شاید با این واقعیت ساده که فرضیه تصادفی بودن همدردی شما، همانطور که مطالعات نشان می دهد، احتمال کمتر از 5 درصد دارد؟ اگر آخرین بیانیه را قابل اعتماد بدانیم، در اصل سایت های دوستیابی موفق وجود ندارند:

هنگامی که تست تقسیم یا هر تحلیل دیگری از وب سایت خود انجام می دهید، درک نادرست از "اهمیت آماری" می تواند منجر به تفسیر نادرست نتایج و در نتیجه اقدامات نادرست در فرآیند بهینه سازی تبدیل شود. این در مورد هزاران آزمایش آماری دیگر که هر روز در هر صنعت موجود انجام می شود صادق است.

برای درک اینکه "اهمیت آماری" چیست، باید در تاریخچه این اصطلاح غوطه ور شوید، معنای واقعی آن را بیاموزید و درک کنید که چگونه این درک قدیمی "جدید" به شما کمک می کند تا نتایج تحقیق خود را به درستی تفسیر کنید.

کمی تاریخچه

اگرچه بشریت قرن‌هاست که از آمار برای حل مسائل مختلف استفاده می‌کند، اما درک مدرن از اهمیت آماری، آزمایش فرضیه‌ها، تصادفی‌سازی و حتی طراحی آزمایش‌ها (DOE) تنها در آغاز قرن بیستم شکل گرفت و به طور جدایی ناپذیری با نام سر رونالد فیشر (سر رونالد فیشر، 1890-1962):

رونالد فیشر یک زیست شناس تکاملی و آماردان بود که اشتیاق خاصی به مطالعه تکامل و انتخاب طبیعی در قلمرو حیوانات و گیاهان داشت. او در طول دوران کاری درخشان خود، ابزارهای آماری مفیدی را توسعه داد و رایج کرد که ما هنوز هم از آنها استفاده می کنیم.

فیشر از تکنیک هایی که توسعه داد برای توضیح فرآیندهای زیست شناسی مانند تسلط، جهش و انحرافات ژنتیکی استفاده کرد. امروزه می توانیم از همین ابزارها برای بهینه سازی و بهبود محتوای منابع وب استفاده کنیم. این واقعیت که این ابزارهای تجزیه و تحلیل را می توان برای کار با اشیایی که حتی در زمان ایجاد آنها وجود نداشتند استفاده کرد بسیار شگفت آور به نظر می رسد. به همان اندازه تعجب آور است که مردم قبلاً محاسبات پیچیده را بدون ماشین حساب یا رایانه انجام می دادند.

فیشر برای توصیف نتایج یک آزمایش آماری به عنوان دارای احتمال بالای درست بودن، از کلمه "معنی" استفاده کرد.

همچنین، یکی از جالب‌ترین پیشرفت‌های فیشر را می‌توان فرضیه «پسر سکسی» نامید. بر اساس این نظریه، زنان مردانی را ترجیح می دهند که از نظر جنسی بی بند و باری (بی بند و باری) باشند، زیرا این امر به پسران متولد شده از این مردان امکان می دهد که استعداد مشابهی داشته باشند و فرزندان بیشتری تولید کنند (توجه داشته باشید که این فقط یک نظریه است).

اما هیچ کس، حتی دانشمندان برجسته، از اشتباه مصون نیستند. ایرادات فیشر هنوز متخصصان را تا به امروز آزار می دهد. اما سخنان آلبرت انیشتین را به خاطر داشته باشید: "کسی که هرگز اشتباه نکرده است، هرگز چیز جدیدی خلق نکرده است."

قبل از اینکه به نکته بعدی بروید، به یاد داشته باشید: اهمیت آماری زمانی است که تفاوت در نتایج آزمون آنقدر زیاد باشد که این تفاوت با عوامل تصادفی قابل توضیح نباشد.

فرضیه شما چیست؟

برای درک معنای «اهمیت آماری»، ابتدا باید بفهمید که «آزمایش فرضیه» چیست، زیرا این دو اصطلاح کاملاً در هم تنیده هستند.
یک فرضیه فقط یک نظریه است. هنگامی که یک نظریه را توسعه دادید، باید فرآیندی را برای جمع آوری شواهد کافی و در واقع جمع آوری آن شواهد ایجاد کنید. دو نوع فرضیه وجود دارد.

سیب یا پرتقال - کدام بهتر است؟

فرضیه صفر

به عنوان یک قاعده، این جایی است که بسیاری از مردم مشکلات را تجربه می کنند. نکته ای که باید در نظر داشت این است که فرضیه صفر چیزی نیست که نیاز به اثبات داشته باشد، مثلاً ثابت کنید که تغییر خاصی در یک وب سایت منجر به افزایش تبدیل می شود، اما برعکس. فرضیه صفر نظریه ای است که بیان می کند اگر هر تغییری در سایت ایجاد کنید، هیچ اتفاقی نمی افتد. و هدف محقق رد این نظریه است نه اثبات آن.

اگر به تجربه حل جرایم نگاه کنیم، جایی که بازپرس فرضیه هایی را نیز مبنی بر اینکه مجرم کیست تشکیل می دهد، فرضیه تهی شکل به اصطلاح فرض برائت را به خود می گیرد، مفهومی که براساس آن متهم تا زمانی که مجرمیت ثابت نشود، بی گناه فرض می شود. در یک دادگاه حقوقی

اگر فرض صفر این است که دو شی از نظر خصوصیات برابر هستند، و شما سعی دارید ثابت کنید که یکی بهتر است (مثلاً A بهتر از B است)، باید فرضیه صفر را به نفع جایگزین رد کنید. به عنوان مثال، شما در حال مقایسه یک ابزار بهینه سازی تبدیل هستید. در فرضیه صفر، هر دو اثر یکسان (یا بدون تأثیر) روی هدف دارند. در عوض، تأثیر یکی از آنها بهتر است.

فرضیه جایگزین شما ممکن است حاوی یک مقدار عددی باشد، مانند B - A > 20%. در این حالت، فرضیه صفر و جایگزین می تواند به شکل زیر باشد:

نام دیگر فرضیه جایگزین، فرضیه تحقیق است زیرا محقق همواره علاقه مند به اثبات این فرضیه خاص است.

معناداری آماری و مقدار p

بیایید دوباره به رونالد فیشر و مفهوم او از اهمیت آماری بازگردیم.

حالا که شما یک فرضیه صفر و یک جایگزین دارید، چگونه می توانید یکی را اثبات کنید و دیگری را رد کنید؟

از آنجایی که آمار به دلیل ماهیت خود شامل مطالعه یک جمعیت خاص (نمونه) است، هرگز نمی توانید از نتایج به دست آمده 100% مطمئن باشید. یک مثال خوب: نتایج انتخابات اغلب با نتایج نظرسنجی های اولیه و حتی خروجی ها متفاوت است.

دکتر فیشر می خواست خط جدایی ایجاد کند که به شما اطلاع دهد که آیا آزمایش شما موفقیت آمیز بوده است یا خیر. به این ترتیب شاخص قابلیت اطمینان ظاهر شد. اعتبار سطحی است که برای گفتن اینکه چه چیزی را «مهم» می‌دانیم و چه چیزی را نمی‌دانیم، می‌گیریم. اگر "p"، شاخص معناداری، 0.05 یا کمتر باشد، نتایج قابل اعتماد هستند.

نگران نباشید، در واقع آنقدر که به نظر می رسد گیج کننده نیست.

توزیع احتمال گاوسی در امتداد لبه ها، مقادیر کمتر احتمالی متغیر، در مرکز، محتمل ترین هستند. P-score (منطقه سایه دار سبز) احتمال وقوع نتیجه مشاهده شده به طور تصادفی است.

توزیع احتمال نرمال (توزیع گاوسی) نمایشی از تمام مقادیر ممکن یک متغیر خاص در یک نمودار (در شکل بالا) و فرکانس آنها است. اگر تحقیق خود را به درستی انجام دهید و سپس تمام پاسخ های خود را بر روی یک نمودار رسم کنید، دقیقاً این توزیع را دریافت خواهید کرد. با توجه به توزیع نرمال، درصد زیادی از پاسخ های مشابه را دریافت خواهید کرد و گزینه های باقی مانده در لبه های نمودار قرار خواهند گرفت (به اصطلاح "دم"). این توزیع مقادیر اغلب در طبیعت یافت می شود، به همین دلیل است که به آن "عادی" می گویند.

با استفاده از یک معادله بر اساس نمونه و نتایج آزمایش خود، می توانید آنچه را که «آمار آزمون» نامیده می شود محاسبه کنید، که نشان می دهد نتایج شما چقدر انحراف دارند. همچنین به شما می گوید که چقدر به صحت فرضیه صفر نزدیک هستید.

برای کمک به شما، از ماشین حساب های آنلاین برای محاسبه اهمیت آماری استفاده کنید:

یک نمونه از این ماشین حساب ها

حرف "p" نشان دهنده احتمال درستی فرضیه صفر است. اگر تعداد کم باشد، نشان دهنده تفاوت بین گروه های آزمایشی است، در حالی که فرض صفر این است که آنها یکسان هستند. از نظر گرافیکی، به نظر می‌رسد که آمار آزمون شما به یکی از دنباله‌های توزیع زنگ‌شکل شما نزدیک‌تر است.

دکتر فیشر تصمیم گرفت که آستانه معناداری را 0.05 ≤ p قرار دهد. با این حال، این بیانیه بحث برانگیز است، زیرا منجر به دو مشکل می شود:

1. اولاً اینکه شما نادرست بودن فرضیه صفر را ثابت کرده اید به این معنی نیست که فرضیه جایگزین را ثابت کرده اید. تمام این اهمیت فقط به این معنی است که شما نمی توانید A یا B را ثابت کنید.

2. ثانیاً اگر نمره p 0.049 باشد به این معنی است که احتمال فرض صفر 4.9 درصد خواهد بود. این ممکن است به این معنی باشد که نتایج آزمایش شما ممکن است همزمان درست و نادرست باشد.

ممکن است از p-score استفاده کنید یا نه، اما پس از آن باید احتمال فرضیه صفر را به صورت موردی محاسبه کنید و تصمیم بگیرید که آیا آنقدر بزرگ است که شما را از ایجاد تغییراتی که برنامه ریزی و آزمایش کرده اید باز دارد. .

رایج ترین سناریو برای انجام یک آزمون آماری امروزه، تعیین آستانه معنی داری p ≤ 0.05 قبل از اجرای خود آزمون است. فقط مطمئن شوید که هنگام بررسی نتایج خود به مقدار p دقت کنید.

خطاهای 1 و 2

زمان زیادی گذشته است که اشتباهاتی که ممکن است در هنگام استفاده از متریک اهمیت آماری رخ دهد حتی نام خود را نیز داده اند.

خطاهای نوع 1

همانطور که در بالا ذکر شد، p-value 0.05 به این معنی است که 5٪ احتمال دارد که فرضیه صفر درست باشد. اگر این کار را نکنید، مرتکب اشتباه شماره 1 خواهید شد. نتایج نشان می‌دهد که وب‌سایت جدید شما نرخ تبدیل شما را افزایش داده است، اما به احتمال 5 درصد وجود دارد که اینطور نباشد.

خطاهای نوع 2

این خطا برعکس خطای 1 است: شما فرضیه صفر را زمانی می پذیرید که نادرست باشد. به عنوان مثال، نتایج آزمایش به شما می گوید که تغییرات ایجاد شده در سایت هیچ پیشرفتی نداشته است، در حالی که تغییراتی وجود داشته است. در نتیجه، فرصت بهبود عملکرد خود را از دست می دهید.

این خطا در تست هایی با حجم نمونه ناکافی رایج است، بنابراین به یاد داشته باشید: هر چه نمونه بزرگتر باشد، نتیجه قابل اعتمادتر است.

نتیجه

شاید هیچ اصطلاحی به اندازه معناداری آماری در بین محققان محبوب نباشد. وقتی نتایج آزمایش از نظر آماری معنی دار نباشد، پیامدهای آن از افزایش نرخ تبدیل تا سقوط یک شرکت متغیر است.

و از آنجایی که بازاریابان از این اصطلاح هنگام بهینه سازی منابع خود استفاده می کنند، باید بدانید که واقعاً به چه معناست. شرایط آزمون ممکن است متفاوت باشد، اما اندازه نمونه و معیارهای موفقیت همیشه مهم هستند. این را به خاطر بسپار.

پایایی آماری در عمل محاسباتی FCC ضروری است. قبلاً ذکر شد که چند نمونه را می توان از یک جامعه انتخاب کرد:

اگر آنها به درستی انتخاب شوند، شاخص های میانگین آنها و شاخص های جمعیت عمومی با در نظر گرفتن قابلیت اطمینان پذیرفته شده، از نظر میزان خطای نمایندگی کمی با یکدیگر متفاوت هستند.

اگر آنها از جمعیت های مختلف انتخاب شوند، تفاوت بین آنها قابل توجه است. آمار همه چیز در مورد مقایسه نمونه ها است.

اگر به طور ناچیز، غیراصولی، ناچیز تفاوت داشته باشند، یعنی در واقع به یک جامعه عمومی تعلق داشته باشند، تفاوت بین آنها از نظر آماری غیر قابل اعتماد نامیده می شود.

از نظر آماری قابل اعتماد تفاوت نمونه، نمونه ای است که تفاوت معنی داری و اساسی دارد، یعنی به جمعیت های عمومی مختلف تعلق دارد.

در FCC، ارزیابی اهمیت آماری تفاوت‌های نمونه به معنای حل بسیاری از مسائل عملی است. به عنوان مثال، معرفی روش‌های آموزشی، برنامه‌ها، مجموعه تمرین‌ها، تست‌ها، تمرین‌های کنترلی جدید با آزمون آزمایشی آنها همراه است که باید نشان دهد که گروه آزمایشی تفاوت اساسی با گروه کنترل دارد. بنابراین برای تشخیص وجود یا عدم وجود تفاوت آماری معنی دار بین نمونه ها از روش های آماری خاصی که معیارهای معناداری آماری نامیده می شوند استفاده می شود.

همه معیارها به دو گروه پارامتری و ناپارامتریک تقسیم می شوند. معیارهای پارامتری مستلزم وجود یک قانون توزیع نرمال است، به عنوان مثال. این به معنای تعیین اجباری شاخص های اصلی قانون عادی است - میانگین حسابی و انحراف استاندارد s. معیارهای پارامتریک دقیق ترین و صحیح ترین هستند. آزمون های ناپارامتریک بر اساس تفاوت های رتبه ای (ترتیبی) بین عناصر نمونه است.

در اینجا معیارهای اصلی برای اهمیت آماری مورد استفاده در عمل FCC آمده است: آزمون دانشجویی و آزمون فیشر.

آزمون تی دانشجوییبه نام دانشمند انگلیسی K. Gosset (دانشجو - نام مستعار) که این روش را کشف کرد. آزمون دانشجو پارامتریک است و برای مقایسه مقادیر مطلق نمونه ها استفاده می شود. اندازه نمونه ها ممکن است متفاوت باشد.

آزمون تی دانشجویی اینگونه تعریف شده است

1. آزمون t Student را با استفاده از فرمول زیر پیدا کنید:


میانگین های حسابی نمونه های مقایسه شده کجا هستند. t 1، t 2 - خطاهای نمایندگی شناسایی شده بر اساس شاخص های نمونه های مقایسه شده.

2. تمرین در FCC نشان داده است که برای کارهای ورزشی کافی است که قابلیت اطمینان حساب P = 0.95 را بپذیرید.

برای قابلیت اطمینان شمارش: P = 0.95 (a = 0.05)، با تعداد درجه آزادی

k = n 1 + n 2 - 2 از جدول ضمیمه 4 مقدار مقدار حدی معیار را پیدا می کنیم ( تی گرم).

3. بر اساس ویژگی های قانون توزیع نرمال، معیار Student t و t gr را مقایسه می کند.

ما نتیجه گیری می کنیم:

اگر t t gr، تفاوت بین نمونه های مقایسه شده از نظر آماری معنی دار است.

اگر t t gr باشد، این تفاوت از نظر آماری ناچیز است.

برای محققان در زمینه FCS، ارزیابی اهمیت آماری اولین گام در حل یک مشکل خاص است: آیا نمونه های مقایسه شده به طور اساسی یا غیر اساسی با یکدیگر متفاوت هستند. مرحله بعدی ارزیابی این تفاوت از دیدگاه آموزشی است که با توجه به شرایط کار تعیین می شود.

بیایید کاربرد آزمون Student را با استفاده از یک مثال خاص در نظر بگیریم.

مثال 2.14. یک گروه 18 نفره از نظر ضربان قلب (bpm) قبل از x i و بعد از آن بررسی شدند y مندست گرمی بازی کردن.

اثربخشی گرم کردن را بر اساس ضربان قلب ارزیابی کنید. داده های اولیه و محاسبات در جدول ارائه شده است. 2.30 و 2.31.

جدول 2.30

پردازش نشانگرهای ضربان قلب قبل از گرم کردن


خطاها برای هر دو گروه همزمان بود، زیرا اندازه نمونه برابر بود (همان گروه تحت شرایط مختلف مورد مطالعه قرار گرفت)، و انحراف استاندارد s x = s y = 3 ضربه / دقیقه بود. بیایید به تعریف آزمون دانش آموز برویم:

ما قابلیت اطمینان حساب را تنظیم می کنیم: P = 0.95.

تعداد درجات آزادی k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. از جدول ضمیمه 4 پیدا می کنیم تی گرم= 2,02.

استنباط آماری. از آنجایی که t = 11.62، و مرز t gr = 2.02، پس 11.62 > 2.02، یعنی. t > t gr، بنابراین تفاوت بین نمونه ها از نظر آماری معنی دار است.

نتیجه گیری آموزشی. مشخص شد که از نظر ضربان قلب، تفاوت بین وضعیت گروه قبل و بعد از گرم کردن از نظر آماری معنی‌دار است، یعنی. مهم، اساسی بنابراین، بر اساس شاخص ضربان قلب، می توان نتیجه گرفت که گرم کردن موثر است.

معیار فیشرپارامتریک است هنگام مقایسه نرخ پراکندگی نمونه استفاده می شود. این، به عنوان یک قاعده، به معنای مقایسه از نظر ثبات کار ورزشی یا ثبات شاخص های عملکردی و فنی در تمرین فرهنگ بدنی و ورزش است. نمونه ها می توانند در اندازه های مختلف باشند.

معیار فیشر به ترتیب زیر تعریف می شود.

1. با استفاده از فرمول، معیار فیشر F را پیدا کنید


که در آن، واریانس نمونه های مقایسه شده است.

شرایط معیار فیشر تصریح می کند که در صورت شمار از فرمول اف پراکندگی زیادی وجود دارد، یعنی عدد F همیشه بزرگتر از یک است.

ما قابلیت اطمینان محاسبه را تنظیم می کنیم: P = 0.95 - و تعداد درجه آزادی را برای هر دو نمونه تعیین می کنیم: k 1 = n 1 - 1، k 2 = n 2 - 1.

با استفاده از جدول ضمیمه 4، مقدار حدی معیار F را پیدا می کنیم گرم.

مقایسه معیارهای F و F گرمبه ما امکان می دهد نتیجه گیری کنیم:

اگر F > F gr، آنگاه تفاوت بین نمونه ها از نظر آماری معنی دار است.

اگر اف< F гр, то различие между выборками статически недо­стоверно.

بیایید یک مثال خاص بزنیم.

مثال 2.15. بیایید دو گروه از بازیکنان هندبال را تجزیه و تحلیل کنیم: x i (n 1= 16 نفر) و y i (p 2 = 18 نفر). این گروه از ورزشکاران برای زمان برخاستن (های) هنگام پرتاب توپ به سمت دروازه مورد مطالعه قرار گرفتند.

آیا نشانگرهای دافعه از یک نوع هستند؟

داده های اولیه و محاسبات اولیه در جدول ارائه شده است. 2.32 و 2.33.

جدول 2.32

پردازش شاخص های دافعه هندبالیست های دسته اول


اجازه دهید معیار فیشر را تعریف کنیم:





با توجه به داده های ارائه شده در جدول پیوست 6، Fgr را پیدا می کنیم: Fgr = 2.4

اجازه دهید به این واقعیت توجه کنیم که در جدول پیوست 6، فهرست اعداد درجات آزادی پراکندگی بزرگتر و کوچکتر با نزدیک شدن به اعداد بزرگتر درشت تر می شود. بنابراین، تعداد درجات آزادی پراکندگی بزرگتر به ترتیب زیر است: 8، 9، 10، 11، 12، 14، 16، 20، 24، و غیره، و کوچکتر - 28، 29، 30، 40. ، 50 و غیره د.

این با این واقعیت توضیح داده می شود که با افزایش حجم نمونه، تفاوت در آزمون F کاهش می یابد و می توان از مقادیر جدولی نزدیک به داده های اصلی استفاده کرد. بنابراین، در مثال 2.15 = 17 وجود ندارد و می توانیم مقدار k = 16 را به آن نزدیک کنیم که از آن Fgr = 2.4 به دست می آید.

استنباط آماری. از آنجایی که آزمون فیشر F= 2.5 > F= 2.4، نمونه ها از نظر آماری قابل تشخیص هستند.

نتیجه گیری آموزشی. مقادیر زمان (های) برخاست هنگام پرتاب توپ به درون دروازه برای بازیکنان هندبال هر دو گروه به طور قابل توجهی متفاوت است. این گروه ها را باید متفاوت در نظر گرفت.

تحقیقات بیشتر باید دلیل این تفاوت را آشکار کند.

مثال 2.20.(بر پایایی آماری نمونه ). اگر زمان (زمان‌ها) از دادن علامت تا ضربه زدن به توپ در ابتدای تمرین x i و در پایان y i باشد، آیا شرایط بازیکن فوتبال بهبود یافته است؟

داده های اولیه و محاسبات اولیه در جدول آورده شده است. 2.40 و 2.41.

جدول 2.40

نشانگرهای زمان پردازش از دادن سیگنال تا ضربه زدن به توپ در ابتدای تمرین


اجازه دهید تفاوت بین گروه های شاخص را با استفاده از معیار Student تعیین کنیم:

با قابلیت اطمینان 0.95 = P و درجه آزادی k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42، با استفاده از جدول ضمیمه 4 دریافتیم تی گرم= 2.02. از آنجایی که t = 8.3 > تی گرم= 2.02 - تفاوت از نظر آماری معنی دار است.

اجازه دهید تفاوت بین گروه های شاخص را با استفاده از معیار فیشر تعیین کنیم:


مطابق جدول پیوست 2، با قابلیت اطمینان 0.95 = P و درجه آزادی k = 22-1 = 21، مقدار F gr = 21. از آنجایی که F = 1.53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

استنباط آماری. با توجه به میانگین حسابی، تفاوت بین گروه های شاخص از نظر آماری معنی دار است. از نظر پراکندگی (پراکندگی)، تفاوت بین گروه های شاخص از نظر آماری غیر قابل اعتماد است.

نتیجه گیری آموزشی.صلاحیت های این بازیکن فوتبال به میزان قابل توجهی ارتقا یافته است، اما باید به پایداری شهادت او توجه شود.

آماده شدن برای کار

قبل از انجام این کار آزمایشگاهی در رشته «مترولوژی ورزشی» همه دانش آموزان در گروه مطالعه باید تیم های کاری 3-4 دانش آموز تشکیل دهند، به طور مشترک تکلیف کاری کلیه کارهای آزمایشگاهی را تکمیل کنند.

در آماده سازی برای کار خود را با بخش های مربوطه از ادبیات توصیه شده (به بخش 6 این دستورالعمل ها مراجعه کنید) و یادداشت های سخنرانی آشنا کنید. بخش های 1 و 2 را برای این کار آزمایشگاهی و همچنین تکلیف کاری آن را مطالعه کنید (بخش 4).

فرم گزارش تهیه کنیدروی ورق های استاندارد کاغذ تحریر سایز A4 و آن را با مواد لازم برای کار پر کنید.

گزارش باید حاوی :

صفحه عنوان شامل گروه آموزشی (UC و TR)، گروه تحصیلی، نام خانوادگی، نام، نام خانوادگی دانشجو، شماره و عنوان کار آزمایشگاهی، تاریخ اتمام آن و همچنین نام خانوادگی، مدرک تحصیلی، عنوان علمی و سمت معلمی که کار را می پذیرد.

هدف کار؛

فرمول هایی با مقادیر عددی که نتایج میانی و نهایی محاسبات را توضیح می دهد.

جداول مقادیر اندازه گیری و محاسبه شده؛

مواد گرافیکی مورد نیاز تکالیف؛

نتیجه گیری مختصر در مورد نتایج هر مرحله از تکلیف کاری و به طور کلی در مورد کار انجام شده.

تمام نمودارها و جداول با استفاده از ابزار ترسیم با دقت ترسیم می شوند. نمادهای گرافیکی و حروف متعارف باید با GOST مطابقت داشته باشند. تهیه گزارش با استفاده از فناوری رایانه مجاز است.

تکلیف کاری

قبل از انجام تمام اندازه گیری ها، هر یک از اعضای تیم باید قوانین استفاده از بازی ورزشی دارت را که در پیوست 7 برای انجام مراحل تحقیقاتی زیر ضروری است، مطالعه کنند.

مرحله اول تحقیق«بررسی نتایج ضربه زدن به هدف بازی ورزشی دارت توسط هر یک از اعضای تیم برای رعایت قانون توزیع عادی بر اساس معیار χ 2پیرسون و معیار سه سیگما"

1. سرعت (شخصی) و هماهنگی اقدامات خود را اندازه گیری (آزمایش) کنید، با پرتاب دارت 30-40 بار به سمت هدف دایره ای در بازی ورزشی دارت.

2. نتایج اندازه گیری ها (آزمون ها) x i(در لیوان) به شکل یک سری تغییرات قالب بندی شده و وارد جدول 4.1 (ستون ها، انجام کلیه محاسبات لازم، پر کردن جداول لازم و نتیجه گیری مناسب در مورد انطباق توزیع تجربی حاصل با قانون توزیع نرمال، توسط قیاس با محاسبات، جداول و نتایج مشابه 2.12، که در بخش 2 این دستورالعمل در صفحات 7 تا 10 آورده شده است.

جدول 4.1

مطابقت سرعت و هماهنگی اقدامات آزمودنی ها با قانون توزیع عادی

خیر گرد شده
جمع

دوم - مرحله تحقیق

«ارزیابی میانگین شاخص‌های جمعیت عمومی ضربات به هدف بازی ورزشی دارت همه دانش‌آموزان گروه مورد مطالعه بر اساس نتایج اندازه‌گیری اعضای یک تیم»

ارزیابی میانگین شاخص‌های سرعت و هماهنگی اقدامات همه دانش‌آموزان گروه مطالعه (طبق فهرست گروه مطالعه در مجله کلاس) بر اساس نتایج ضربه زدن به هدف بازی ورزشی دارت همه اعضای تیم، به‌دست‌آمده. در مرحله اول تحقیق این کار آزمایشگاهی.

1. نتایج اندازه گیری سرعت و هماهنگی اقدامات را مستند کنید هنگام پرتاب دارت به سمت یک هدف دایره ای در بازی ورزشی دارت همه اعضای تیم شما (2 تا 4 نفر) که نمونه ای از نتایج اندازه گیری را از جمعیت عمومی نشان می دهند (نتایج اندازه گیری همه دانش آموزان در یک گروه مطالعه - به عنوان مثال، 15 نفر)، وارد کردن آنها در ستون دوم و سوم جدول 4.2.

جدول 4.2

پردازش شاخص های سرعت و هماهنگی اقدامات

اعضای تیپ

خیر
جمع

در جدول 4.2 زیر باید درک شود , میانگین امتیاز منطبق (نتایج محاسبه را در جدول 4.1 ببینید) اعضای تیم شما ( , در مرحله اول تحقیق به دست آمد. لازم به ذکر است که، معمولا، جدول 4.2 شامل مقدار میانگین محاسبه شده نتایج اندازه گیری به دست آمده توسط یکی از اعضای تیم در مرحله اول تحقیق است. ، از آنجایی که احتمال همزمانی نتایج اندازه گیری اعضای مختلف تیم بسیار کم است. سپس، به عنوان یک قاعده، ارزش ها در ستون جدول 4.2 برای هر ردیف - برابر با 1، آ در خط «کل " ستون " "، نوشته شده است تعداد اعضای تیم شما

2. تمام محاسبات لازم را برای پر کردن جدول 4.2 و همچنین سایر محاسبات و نتیجه گیری های مشابه با محاسبات و نتیجه گیری های مثال 2.13 در بخش دوم این توسعه روش شناختی در صفحات 13-14 انجام دهید. هنگام محاسبه خطای نمایندگی باید در نظر داشت "م" لازم است از فرمول 2.4 ارائه شده در صفحه 13 این توسعه روش‌شناختی استفاده شود، زیرا نمونه کوچک است (n و تعداد عناصر جمعیت عمومی N مشخص است و برابر با تعداد دانش‌آموزان گروه مورد مطالعه است. با توجه به لیست مجله گروه مطالعه.

III - مرحله تحقیق

ارزیابی اثربخشی گرم کردن با توجه به شاخص "سرعت و هماهنگی اقدامات" توسط هر یک از اعضای تیم با استفاده از آزمون تی دانشجویی

ارزیابی اثربخشی گرم کردن برای پرتاب دارت به سمت هدف بازی ورزشی "دارت" که در مرحله اول تحقیق این کار آزمایشگاهی توسط هر یک از اعضای تیم با توجه به شاخص "سرعت و هماهنگی اقدامات» با استفاده از معیار دانشجویی - یک معیار پارامتریک برای پایایی آماری قانون توزیع تجربی به قانون توزیع نرمال.

… جمع

2. واریانس ها و RMS ، نتایج اندازه گیری شاخص "سرعت و هماهنگی اقدامات" بر اساس نتایج گرم کردن، در جدول 4.3 آورده شده است، (محاسبات مشابه بلافاصله پس از جدول 2.30 از مثال 2.14 در صفحه 16 این توسعه روش شناختی ارائه شده را ببینید).

3. هر یک از اعضای تیم کاری اندازه گیری (آزمایش) سرعت (شخصی) و هماهنگی اقدامات خود پس از گرم کردن،

… جمع

5. انجام محاسبات میانگین واریانس ها و RMS ,نتایج اندازه گیری شاخص "سرعت و هماهنگی اقدامات" پس از گرم کردن، ارائه شده در جدول 4.4، نتیجه کلی اندازه گیری را بر اساس نتایج گرم کردن یادداشت کنید (محاسبات مشابه بلافاصله پس از جدول 2.31 از مثال 2.14 در صفحه 17 این توسعه روش شناختی ارائه شده را ببینید).

6. تمام محاسبات و نتیجه گیری های لازم را مشابه محاسبات و نتیجه گیری های مثال 2.14 ارائه شده در بخش دوم این توسعه روش شناختی در صفحات 16-17 انجام دهید. هنگام محاسبه خطای نمایندگی باید در نظر داشت "م" لازم است از فرمول 2.1 ارائه شده در صفحه 12 این توسعه روش شناختی استفاده شود، زیرا نمونه n است و تعداد عناصر در جمعیت N ناشناخته است.

IV - مرحله تحقیق

ارزیابی یکنواختی (پایداری) شاخص های "سرعت و هماهنگی اقدامات" دو عضو تیم با استفاده از معیار فیشر

ارزیابی یکنواختی (پایداری) شاخص های "سرعت و هماهنگی اقدامات" دو عضو تیم با استفاده از معیار فیشر، بر اساس نتایج اندازه گیری به دست آمده در مرحله سوم تحقیق در این کار آزمایشگاهی.

برای این کار باید موارد زیر را انجام دهید.

با استفاده از داده های جداول 4.3 و 4.4، نتایج محاسبه واریانس از این جداول در مرحله سوم تحقیق و همچنین روش محاسبه و بکارگیری معیار فیشر برای ارزیابی یکنواختی (پایداری) شاخص های ورزشی ارائه شده است. به عنوان مثال 2.15 در صفحات 18-19 این توسعه روش شناختی، نتایج آماری و آموزشی مناسب را به دست آورید.

پنجم - مرحله تحقیق

ارزیابی گروه های شاخص "سرعت و هماهنگی اقدامات" یک عضو تیم قبل و بعد از گرم کردن

پایایی آماری

- انگلیسیاعتبار/روایی، آماری; آلمانیاعتبار، آمار. سازگاری، عینیت و عدم ابهام در یک آزمون آماری یا در یک q.l. مجموعه ای از اندازه گیری ها D.s. می توان با تکرار همان آزمون (یا پرسشنامه) در مورد یک موضوع آزمایش کرد تا ببیند آیا نتایج یکسانی به دست می آید یا خیر. یا با مقایسه قسمت های مختلف یک آزمون که قرار است یک شی را اندازه گیری کنند.

آنتی نازی دایره المعارف جامعه شناسی, 2009

ببینید «پایایی آماری» در فرهنگ‌های دیگر چیست:

    پایایی آماری- انگلیسی اعتبار/روایی، آماری; آلمانی اعتبار، آمار. سازگاری، عینیت و عدم ابهام در یک آزمون آماری یا در یک q.l. مجموعه ای از اندازه گیری ها D.s. می توان با تکرار همان تست (یا... فرهنگ توضیحی جامعه شناسی

    در آمار، در صورتی که احتمال وقوع آن به صورت تصادفی یا حتی مقادیر شدیدتر کم باشد، یک مقدار از نظر آماری معنی دار نامیده می شود. در اینجا منظور از افراطی میزان انحراف آمار آزمون از فرضیه صفر است. تفاوت نامیده می شود... ... ویکی پدیا

    پدیده فیزیکی پایداری آماری این است که با افزایش حجم نمونه، فراوانی یک رویداد تصادفی یا مقدار متوسط ​​یک کمیت فیزیکی به عدد ثابتی گرایش پیدا می‌کند. پدیده آماری... ... ویکی پدیا

    قابلیت اطمینان تفاوت ها (شباهت ها)- روش آماری تحلیلی برای تعیین سطح معنی داری تفاوت یا شباهت بین نمونه ها با توجه به شاخص های (متغیرهای) مورد مطالعه ... فرآیند آموزشی مدرن: مفاهیم و اصطلاحات اساسی

    گزارشی، آماری فرهنگ لغت بزرگ حسابداری

    گزارشی، آماری- شکلی از مشاهده آماری دولتی که در آن مقامات مربوطه اطلاعات مورد نیاز خود را در قالب اسناد گزارشگری قانونی (گزارش های آماری) از شرکت ها (سازمان ها و موسسات) دریافت می کنند. فرهنگ لغت بزرگ اقتصادی

    علمی که روش‌های مشاهده سیستماتیک پدیده‌های توده‌ای در زندگی اجتماعی انسان، تدوین توصیف‌های عددی آنها و پردازش علمی این توصیف‌ها را مطالعه می‌کند. بنابراین، آمار نظری یک علم است... ... فرهنگ لغت دایره المعارف F.A. بروکهاوس و I.A. افرون

    ضریب همبستگی- (ضریب همبستگی) ضریب همبستگی نشانگر آماری وابستگی دو متغیر تصادفی تعریف ضریب همبستگی، انواع ضرایب همبستگی، خواص ضریب همبستگی، محاسبه و کاربرد... دایره المعارف سرمایه گذار

    آمار- (آمار) آمار یک علم نظری عمومی است که به بررسی تغییرات کمی در پدیده ها و فرآیندها می پردازد. آمار دولتی، خدمات آماری، Rosstat (Goskomstat)، داده های آماری، آمار پرس و جو، آمار فروش،... ... دایره المعارف سرمایه گذار

    همبستگی- (همبستگی) همبستگی یک رابطه آماری بین دو یا چند متغیر تصادفی است. دایره المعارف سرمایه گذار

کتاب ها

  • تحقیق در ریاضیات و ریاضیات در تحقیق: مجموعه روش‌شناسی فعالیت‌های پژوهشی دانش‌آموز، Borzenko V.I.. مجموعه تحولات روش‌شناختی قابل اجرا در سازمان‌دهی فعالیت‌های پژوهشی دانش‌آموز را ارائه می‌کند. بخش اول این مجموعه به کاربرد رویکرد پژوهشی در...

فرضیه ها با استفاده از تجزیه و تحلیل آماری آزمایش می شوند. اهمیت آماری با استفاده از P-value پیدا می‌شود، که مربوط به احتمال یک رویداد معین با فرض درستی یک گزاره خاص (فرضیه صفر) است. اگر P-value کمتر از سطح معینی از اهمیت آماری باشد (معمولاً 0.05)، آزمایش‌گر می‌تواند با خیال راحت نتیجه‌گیری کند که فرضیه صفر نادرست است و به بررسی فرضیه جایگزین ادامه دهد. با استفاده از آزمون t Student، می توانید مقدار P را محاسبه کنید و اهمیت را برای دو مجموعه داده تعیین کنید.

مراحل

قسمت 1

راه اندازی آزمایش

    فرضیه خود را تعریف کنید.اولین گام در ارزیابی اهمیت آماری این است که سؤالی را که می‌خواهید به آن پاسخ دهید انتخاب کنید و یک فرضیه را تدوین کنید. فرضیه عبارتی است درباره داده های تجربی، توزیع و ویژگی های آنها. برای هر آزمایشی، هم یک فرضیه صفر و هم یک فرضیه جایگزین وجود دارد. به طور کلی، شما باید دو مجموعه از داده ها را با هم مقایسه کنید تا مشخص کنید که آنها مشابه یا متفاوت هستند.

    • فرضیه صفر (H 0) معمولاً بیان می کند که هیچ تفاوتی بین دو مجموعه داده وجود ندارد. به عنوان مثال: آن دسته از دانش آموزانی که مطالب را قبل از کلاس مطالعه می کنند، نمره بالاتری دریافت نمی کنند.
    • فرضیه جایگزین (H a) برعکس فرضیه صفر است و عبارتی است که باید توسط داده های تجربی پشتیبانی شود. به عنوان مثال: آن دسته از دانش آموزانی که مطالب را قبل از کلاس مطالعه می کنند، نمرات بالاتری می گیرند.
  1. سطح معناداری را برای تعیین میزان تفاوت توزیع داده با نرمال تنظیم کنید تا نتیجه قابل توجهی در نظر گرفته شود. سطح اهمیت (همچنین نامیده می شود α (\displaystyle \alpha)-level) آستانه ای است که برای اهمیت آماری تعریف می کنید. اگر مقدار P کمتر یا مساوی با سطح معنی داری باشد، داده ها از نظر آماری معنی دار در نظر گرفته می شوند.

    • به عنوان یک قاعده، سطح اهمیت (ارزش α (\displaystyle \alpha)) 0.05 در نظر گرفته می شود که در این صورت احتمال تشخیص اختلاف تصادفی بین مجموعه داده های مختلف تنها 5 درصد است.
    • هرچه سطح معنی داری بالاتر باشد (و بر این اساس، مقدار P کمتر باشد)، نتایج قابل اعتمادتر هستند.
    • اگر می خواهید نتایج قابل اعتمادتری داشته باشید، مقدار P را به 0.01 کاهش دهید. به طور معمول، زمانی که نیاز به شناسایی عیوب در محصولات باشد، از مقادیر P کمتر در تولید استفاده می شود. در این مورد، اطمینان بالا مورد نیاز است تا اطمینان حاصل شود که تمام قطعات همانطور که انتظار می رود کار می کنند.
    • برای اکثر آزمایشات فرضیه، سطح معنی داری 0.05 کافی است.
  2. تصمیم بگیرید که از کدام معیار استفاده کنید:یک طرفه یا دو طرفه. یکی از فرضیات در آزمون Student t این است که داده ها به طور معمول توزیع شده اند. توزیع نرمال یک منحنی زنگی شکل است که حداکثر تعداد نتایج در وسط منحنی است. آزمون تی دانشجویی یک روش ریاضی برای آزمایش داده ها است که به شما امکان می دهد تعیین کنید که آیا داده ها خارج از توزیع نرمال قرار می گیرند (بیشتر، کمتر یا در "دم" منحنی).

    • اگر مطمئن نیستید که داده‌ها بالاتر یا پایین‌تر از مقادیر گروه کنترل هستند، از آزمون دو دنباله استفاده کنید. این به شما امکان می دهد اهمیت را در هر دو جهت تعیین کنید.
    • اگر می دانید در کدام جهت داده ها ممکن است خارج از توزیع نرمال قرار گیرند، از آزمون یک دنباله استفاده کنید. در مثال بالا، انتظار داریم نمرات دانش آموزان افزایش یابد، بنابراین می توان از آزمون یک طرفه استفاده کرد.
  3. اندازه نمونه را با استفاده از توان آماری تعیین کنید.قدرت آماری یک مطالعه احتمال این است که با توجه به حجم نمونه، نتیجه مورد انتظار به دست آید. یک آستانه توان مشترک (یا β) 80٪ است. تجزیه و تحلیل قدرت آماری بدون هیچ داده قبلی می تواند چالش برانگیز باشد زیرا به اطلاعاتی در مورد میانگین های مورد انتظار در هر گروه از داده ها و انحرافات استاندارد آنها نیاز دارد. برای تعیین اندازه نمونه بهینه برای داده های خود از یک ماشین حساب آنالیز توان آنلاین استفاده کنید.

    • به طور معمول، محققان یک مطالعه آزمایشی کوچک انجام می دهند که داده هایی را برای تجزیه و تحلیل توان آماری ارائه می دهد و اندازه نمونه مورد نیاز برای یک مطالعه بزرگتر و کامل تر را تعیین می کند.
    • اگر قادر به انجام یک مطالعه آزمایشی نیستید، سعی کنید میانگین های ممکن را بر اساس ادبیات و نتایج افراد دیگر تخمین بزنید. این ممکن است به شما در تعیین حجم نمونه بهینه کمک کند.

    قسمت 2

    محاسبه انحراف استاندارد
    1. فرمول انحراف معیار را بنویسید.انحراف معیار نشان می دهد که چه مقدار پراکندگی در داده ها وجود دارد. این به شما امکان می دهد نتیجه بگیرید که داده های به دست آمده از یک نمونه خاص چقدر نزدیک هستند. در نگاه اول، فرمول کاملاً پیچیده به نظر می رسد، اما توضیحات زیر به شما در درک آن کمک می کند. فرمول به شرح زیر است: s = √∑ ((x i - µ) 2 / (N - 1)).

      • s - انحراف استاندارد؛
      • علامت ∑ نشان می دهد که تمام داده های به دست آمده از نمونه باید اضافه شوند.
      • x i مربوط به مقدار i است، یعنی یک نتیجه جداگانه به دست آمده است.
      • μ مقدار متوسط ​​برای یک گروه معین است.
      • N تعداد کل داده های نمونه است.
    2. میانگین هر گروه را بیابید.برای محاسبه انحراف معیار، ابتدا باید میانگین هر گروه مطالعه را بیابید. مقدار متوسط ​​با حرف یونانی μ (mu) نشان داده می شود. برای یافتن میانگین، به سادگی تمام مقادیر به دست آمده را جمع کرده و آنها را بر مقدار داده (اندازه نمونه) تقسیم کنید.

      • به عنوان مثال، برای یافتن میانگین نمرات گروهی از دانش آموزانی که قبل از کلاس درس می خوانند، مجموعه داده های کوچکی را در نظر بگیرید. برای سادگی، از مجموعه ای از پنج نقطه استفاده می کنیم: 90، 91، 85، 83 و 94.
      • بیایید همه مقادیر را با هم اضافه کنیم: 90 + 91 + 85 + 83 + 94 = 443.
      • بیایید مجموع را بر تعداد مقادیر تقسیم کنیم، N = 5: 443/5 = 88.6.
      • بنابراین میانگین این گروه 88.6 است.
    3. هر مقدار به دست آمده را از میانگین کم کنید.مرحله بعدی محاسبه تفاوت (x i – μ) است. برای انجام این کار، هر مقدار به دست آمده را از مقدار میانگین یافت شده کم کنید. در مثال ما، باید پنج تفاوت را پیدا کنیم:

      • (90 – 88.6)، (91 – 88.6)، (85 – 88.6)، (83 – 88.6) و (94 – 88.6).
      • در نتیجه، مقادیر زیر را دریافت می کنیم: 1.4، 2.4، -3.6، -5.6 و 5.4.
    4. هر مقدار بدست آمده را مربع کنید و با هم جمع کنید.هر یک از مقادیری که تازه پیدا شده است باید مجذور شود. این مرحله تمام مقادیر منفی را حذف می کند. اگر بعد از این مرحله همچنان اعداد منفی دارید، فراموش کرده اید آنها را مربع کنید.

      • برای مثال ما، 1.96، 5.76، 12.96، 31.36 و 29.16 را دریافت می کنیم.
      • مقادیر حاصل را جمع می کنیم: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2.
    5. تقسیم بر حجم نمونه منهای 1.در فرمول، به دلیل اینکه جمعیت عمومی را در نظر نمی گیریم، اما از همه دانش آموزان برای ارزشیابی نمونه برداری می کنیم، حاصل بر N – 1 تقسیم می شود.

      • تفریق: N – 1 = 5 – 1 = 4
      • تقسیم: 81.2/4 = 20.3
    6. جذر را بگیرید.پس از تقسیم مجموع بر حجم نمونه منهای یک، جذر مقدار پیدا شده را بگیرید. این آخرین مرحله در محاسبه انحراف معیار است. برنامه های آماری وجود دارند که پس از وارد کردن داده های اولیه، تمامی محاسبات لازم را انجام می دهند.

      • در مثال ما، انحراف معیار نمرات آن دسته از دانش آموزانی که مطالب را قبل از کلاس خوانده اند، s =√20.3 = 4.51 است.

      قسمت 3

      اهمیت را تعیین کنید
      1. واریانس بین دو گروه داده را محاسبه کنید.قبل از این مرحله، ما به یک مثال برای تنها یک گروه از داده ها نگاه کردیم. اگر می خواهید دو گروه را با هم مقایسه کنید، بدیهی است که باید از هر دو گروه داده بگیرید. انحراف معیار برای گروه دوم داده ها را محاسبه کنید و سپس واریانس بین دو گروه آزمایشی را بیابید. واریانس با استفاده از فرمول زیر محاسبه می شود: s d = √((s 1 /N 1) + (s 2 /N 2)).