روش تعیین حجم نمونه در پروپوزال

در پژوهش‌های بالینی، برای دستیابی به برآورد دقیق و قابل اعتماد حجم نمونه، لازمه در چارچوب طراحی تحقیق، آزمون آماری مناسبی برای فرضیات مورد نظر به کار گرفته بشه. فرضیه مورد آزمون باید بیانگر اهداف مورد مطالعه باشه. گاهی در عمل مغایرت‌هایی بین اهداف مطالعه (فرضیه ها)، طرح مطالعه، تحلیل آماری (آماره آزمون) و محاسبه حجم نمونه دیده میشه. مسلما این مغایرت‌ها در محاسبه حجم نمونه مناسب در پژوهش‌های بالینی موثر خواهد بود. اگه می خواید یبار برای همیشه خیلی خودمونی یاد بگیرید چجوری باید حجم نمونه پروپوزال تون رو حساب کنید در این چند دقیقه با ما در این مطلب همراه باشید. اما اگه نیاز دارید که تیم متخصص آمار مدیتورها که از همکاران متخصص آمار زیستی و اپیدمیولوژی تشکیل شده، داده های شما رو بررسی و تجزیه و تحلیل کنه؛ سفارشت رو در پنل مدیتورها در قسمت آنالیز و تحلیل آماری ثبت کن!

تعریف حجم نمونه (Sample Size)

حجم نمونه اصطلاحیه که در تحقیقات برای تعیین تعداد افراد در یه اندازه از نمونه استفاده میشه. با اندازه نمونه، ما یه مشت [نمونه] از خروار [جمعیت] انتخاب می کنیم و برای مطالعه مون اون ها رو بعنوان نماینده جمعیت واقعی در نظر می گیریم. به عنوان مثال، اگر می خوایم پیش بینی کنیم که جمعیت یه گروه سنی خاص چجوری نسبت به یه محصول جدید واکنش نشان میدن، می تونیم ابتدا اون رو بر روی یه نمونه که نماینده جمعیت مورد نظر هست، آزمایش کنیم اما قبل از اون باید تعیین کنیم که چه تعداد افراد کافیه تا نتایج مطالعمون درست دربیاد.

اگه حجم نمونه یه مطالعه مناسب نباشه چی میشه؟

در صورتی که اندازه نمونه کوچیک باشه نتایج حاصل ممکنه از اعتبار کافی برای تعمیم دادن در بالین برخوردار نباشه و مورد اعتماد نیست. از طرف دیگه بیش از حد نیاز بودن اندازه نمونه همیشه نقطه قوت مطالعه به شمار نمیاد چراکه باعث از دست دادن منابع مالی، صرف وقت بیش از اندازه و غیره میشه که این خودش با اخلاق پژوهشی مغایرت داره.

حجم نمونه باید در زمان تدوین پیشنهاد طرح (پروپوزال)، محاسبه بشه که حجم کار برای انجام تحقیق، مواد مصرفی، تجهیزات و امکانات موردنیاز و نیز طول مدت پژوهش با استناد به آن پیش‌بینی بشه. در محاسبه حجم نمونه لازمه اهداف و فرضیات تحقیق و روش کار اون به دقت بررسی بشن و تعداد نمونه طوری تعیین بشه که با استفاده از اون بتوانیم به سوالات تحقیق پاسخ معتبر و علمی بدیم و فرضیه‌های مطرح شده رو به درستی مورد بررسی قرار بدیم.

بنابراین در تعیین حجم نمونه برای هر تحقیق لازمه از اصول علمی استفاده بشه و از افراط و تفریط در این زمینه خودداری گردد.

عوامل موثر بر تعیین حجم نمونه

هدف مطالعه

اولین مرحله در تعیین حجم نمونه، مشخص نمودن هدف مطالعه هست. نوع مطالعه باید مشخص باشه. آیا مطالعه شما توصیفی هست، مشاهده اي یا تحلیلی هست؟ درمطالعات توصیفی، قصد محقق برآورد شیوع یا بروز یک بیماري یا یکی از عوامل خطر هست و محقق به دنبال مقایسه گروه ها با یکدیگر نیست. در نتیجه در این نوع مطالعات، توان مطالعه (قدرت مطالعه درکشف تفاوت ها یا ارتباط ها) مطرح نیست.

جهت مطالعه

در مرحله دوم، باید مشخص بشه که جهت مطالعه چیه؟ البته تعیین جهت مطالعه براي مطالعه توصیفی کاربردی نداره چون قرار نیست مقایسه اي صورت بگیره ولی ممکنه یکی از اهداف ثانویه مطالعه، مقایسه شیوع یه بیماري یا یکی از عوامل خطر براي بیماري با یه عدد شناخته شده و یا جمعیت دیگر باشه. آیا محقق از قبل فرضیه برتريِ یک روش درمانی رو در ذهن خودش داره یا نه؟ مشخص نمودن این موضوع نیز در تعیین حجم نمونه امري ضروري هست.

نحوه اندازه گیري پیامدهاي اصلی

مرحله سوم، تعیین این موضوع هست که محقق چگونه می خواد پیامدهاي اصلی رو اندازه گیري کنه؟ آیا اندازه گیري پیامد به صورت دو وجهی هست یا این که رتبه اي و یا به صورت متغیرهاي پیوسته با توزیع نرمال؟ مشخص نمودن این موضوع نیز از اهمیت زیادي برخوردار هست، چون وقتی پیامدهایی که قراره اندازه گیري بشه، دو وجهی باشه در این صورت نسبت ها، برآورد شده و یا مقایسه میشن و به طبع فرمول هاي حجم نمونه (یا جداول مرتبط) بر اساس نسبت ها ارائه یا تنظیم میشن و اگه پیامدهاي مورد بررسی به صورت داده هاي پیوسته باشن، میانگین ها و شاخص هاي پراکندگی مرتبط با اون (مانند واریانس ها) اهمیت پیدا می کنن.

تعیین اندازه تاثیر

این مرحله نیز از مراحل مهم تعیین حجم نمونه است. حداقل چه میزان از تغییرات، یا تفاوت از نظر بالینی می نونه اهمیت داشته باشه؟ این موضوع را محقق باید در زمان طراحی مطالعه مشخص کنه، چون بر تعیین حجم نمونه در مطالعاتی که به دنبال تعیین تفاوت ها یا به خصوص میزان تاثیر یک مداخله باشن، تاثیر مستقیم داره. هرچه این عدد بزرگتر باشه، به حجم نمونه پایین تري نیاز خواهیم داشت و برعکس. فرض کنید محققی می خواد تاثیر یه داروي ضد کلسترول را بر میزان کلسترول خون مشخص کنه. اگه او حداقل تغییر در کلسترول که اهمیت بالینی داره رو 5 میلیگرم دردسی لیتر فرض کنه به حجم نمونه بیشتري نیاز داره تا این که حداقل تغییر را برابر 10 میلی گرم در دسی لیتر در نظر بگیره. براي آشکار کردن تفاوت هاي کوچیکتر نیاز داریم که بر روي نمونه هاي بیشتري کار کنیم تا بتونیم تفاوت ها و تغییرات رو کشف کنیم.

واریانس

مرحله بعدي، تعیین واریانس جمعیتی هست که شما می خواید مطالعه روی اون انجام بشه. هر چه واریانس متغیري که می خواید اندازه گیري بشه، بیشتر باشه، نیاز به حجم نمونه بیشتری براي اندازه گیري و برآورد دقیقتر متغیر دارید چون در آن صورت پراکندگی داده هاتون بیشتر بوده و در نتیجه به حجم نمونه بالاتري براي برآورد دقیق تر پیامدها و یا کشف تفاوت (یا ارتباط) در بین آنها نیاز هست. برآورد واریانس رو می تونیم به صورت گوناگون انجام بدیم یا از مطالعات گذشته که بر روي جمعیت هاي مشابه کار کردن تعیین کنیم یا این که اگه همچین مطالعه ای پیدا نشد ممکنه نیاز باشه مطالعه اي پایلوت ترتیب داده بشه و با استفاده از برآوردي که از آن بدست میاد، حجم نمونه تعیین بشه.

خطاي نوع اول

این خطا موقعی رخ میده که ما فرضیه صفر رو علی رغم صحت اون رد کنیم. حجم نمونه بالاتر کمک میکنه که خطاي نوع اول کم بشه. در نتیجه با در نظر گرفتن یک خطاي آلفاي پایینتر، حجم نمونه مورد نیاز براي هدایت مطالعه افزایش پیدا می کنه. معمولا در مطالعات پزشکی خطاي آلفا (یا خطاي نوع یک) رو 1 یا 5 درصد در نظر می گیرن. اگه این خطا رو 1 درصد در نظر بگیریم به حجم نمونه بالاتري نسبت به زمانی که این خطا رو 5 درصد در نظر بگیریم، نیاز داریم. توجه کنید تعیین نقاط برش 1 یا 5 درصد، یه موضوع قراردادیه.

خطاي نوع دوم

این خطا موقعی رخ میده که علیرغم اشتباه بودن فرضیه صفر ما اون رو رد نمی کنیم. این نوع خطا با بتا نشان میدیم. جایی که 1-β نشون دهنده توان مطالعه باشه یعنی توان یا قدرت مطالعه در کشف یک تفاوت معنی دار. هر چه حجم نمونه بالاتر باشه این توان افزایش پیدا می کنه. پس اگر بخوایم خطاي نوع دوم رو در مطالعه خودمون کاهش بدیم (یا قدرت مطالعه رو بالا ببریم) به حجم نمونه بالاتري نیاز داریم. پس عامل مهم دیگه ای که بر حجم نمونه تاثیر میذاره، توان مطالعه هست.

خطاي معیار

انحراف معیار این موضوع رو براي ما روشن میکنه که یه میانگین چقدر می تونه معرف داده هاي یه نمونه از جمعیت باشه. ما معمولا داده ها رو به صورت یه نمونه از جمعیت جمع آوري میکنیم به این علت که به کل جمعیت دسترسی نداریم. حالا فرض کنید که چندین نمونه از یه جمعیت بگیریم در این صورت نمونه ها باهم متفاوت میشن. بنابراین این موضوع براي ما اهمیت داره که یه نمونه ویژه، چقدر می تونه نمایشی از یه جمعیت باشه. اینجاست که خطاي معیار به کمک ما میاد.

توی ذهنتون یه جمعیت رو فرض کنید. شما ممکنه یه نمونه گیري از این جمعیت انجام بدید. این نمونه یکی از بسیار نمونه هایی هست که میشه از یه جمعیت گرفت. هر یک از این نمونه ها میانگین خودش رو داره و میانگین این نمونه ها با هم متفاوته. به انحراف معیار میانگین هاي این نمونه ها، میگن خطاي معیار.

حالا این سئوال مطرح میشه که آیا نی تونیم دهها، صدها یا هزاران نمونه بگیریم و میانگین هرکدوم از اونا رو محاسبه و بعد میانگین هر کدوم از این نمونه ها رو از میانگین کل کم کرده و به توان 2 رسونده و بر تعداد نمونه ها تقسیم کنیم (و البته بعد از آن جذر گرفت)؟ مسلما ممکنه اما خیلی سخته

براي این موضوع متخصصین آمار راه حل دادن و به این نتیجه رسیدن وقتی که تعداد نمونه هاي یه جمعیت بالاست در این صورت توزیع نمونه گیري نرمال شده و میانگین اون برابر میانگین جمعیت و انحراف معیار آن برابره با:

فرمول آماری

حجم نمونه و هزینه ها
اغلب یه مطالعه بودجه محدودي در اختیار داره. در نتیجه حجم نمونه باید بالاترین دقت رو تا جایی که هزینه ها اجازه میده، بدست بیاره. یکسری از همکاران پژوهشگر در جهت تحقق این موضوع تلاش میکنن.

فرمول های آماری مناسب برای تعیین حجم نمونه

در این مطلب فقط به براورد یک میانگین یا نسبت می پردازیم؛ البته براورد دو یا چند میانگین هم وجود داره که از حوصله خارجه و بنابراین به همین که وایرال هم هست! بسنده می کنیم.

حجم نمونه برای براورد یه نسبت از رابطه زیر تبعیت می کنه:

فرمول اماری تعیین حجم نمونه

توی این فرمول ρ براورد نسبت توی جامعه ست. این براورد یا از مطالعات قبلی بدست میاد یا اینکه پژوهشگر در یه مطالعه پایلوت براوردی از اون رو بدست میاره. اگه از این دو راه ممکن نبود هم اون رو 50 درصد فرض می کنیم ( متوسط تخمینی از صفر تا 100).

در این رابطه d دقت هست. دقت این سوال رو مطرح می کنه که در براورد نسبت چقدر اشتباه جایز هست؟ یا پژوهشگر چند درصد اشتباه در بیان شیوع رو قبول داره؟ و اونو محقق تعیین می کنه. بصورت غیر رسمی d رو یک دهم ρ در نظر می گیریم.

یه مثال بخونیم باهم:

محققی می خواد برآورد کنه که احتمال یه خطر 10 ساله بیماري قلبی عروقی ≥10 % در بین مردان 40 تا 79 ساله بر اساس مدل فرامینگهام در شمال ایران چقدره؟ در مطالعه اي در سال 2009 که نتایج اون در سال 2015 منتشر شده این شیوع برابر 48/9 درصد برآورد شده. این محقق، به چند نمونه نیاز داره؟ (خطاي نوع اول هم 5 درصد در نظر می گیریم).

نمونه ای از تعیین حجم نمونه

خب اینا رو میذاریم توی فرمول و جواب نهایی 401.27 بدست میاد و ما 402 درنظر می گیریم.

حجم نمونه برای براورد یه میانگین از رابطه زیر تبعیت می کنه:

حجم نمونه پروپوزال

σ: واریانس

واریانس جامعه ايه که مطالعه قراره در آن هدایت بشه. برآوردي از این واریانس، یا از مطالعات گذشته بر روي همون جامعه یا جمعیت هاي مشابه حاصل میشه و یا این که در یه مطالعه پایلوت بدست میاد.

δ: دقت

یعنی تا چه حد اشتباه، جایز هست و از نظر بالینی تاثیرگذار نیست. به عنوان مثال در اندازه گیري فشار خون، چقدر تفاوت رو میتوانیم نادیده بگیریم و اهمیتی ندارد؟ اگه یه میلیمتر جیوه فشار خون بالاتر یا پایینتر برآورد بشه، میتواند بر پیامد بیماري تاثیري بذاره؟ در واقع حداقل
تفاوتی که می تونه از نظر بالینی با اهمیت تلقی بشه (و نباید در برآوردها، اشتباه بیشتر از آن باشه) رو دقت یا همان δ میگن و اینو پژوهشگر تعیین می کنه.

یه مثال حل کنیم!

محققی می خواد میانگین فشار خون سیستولیک زنان 18 سال و بالاتر رو در شمال ایران تخمین بزنه. بر اساس مطالعه اي که در گذشته برروي همین جمعیت صورت گرفته برآورد فشار خون برابر 115.42 ± 17.60 بدست اومده. براي هدایت این مطالعه محقق به چند نمونه نیاز داره؟ اگر دقت را در این مطالعه 2 میلیمتر جیوه در نظر بگیریم. (با خطاي آلفاي یک درصد).

جواب میشه: 512

یه نمونه برای تعیین حجم نمونه

خب امیدوارم حالا خودتون بتونید حجم نمونه پژوهشتون رو بدست بیارید اما اگه به هرعلت نتونستید این کار رو انجام بدید اصلا نگران نباشید. چون کارهای آماری واقعا سختن و نیاز به یه متخصص آمار احساس میشه. موسسه مدیتورها این کار برای همه همکاران آسان تر کرده. شما می تونید با ثبت سفارش آنالیز و تحلیل آماری ، علاوه بر مشاوره درمورد هر مشکل آماری که برای طرح تحقیقاتی شما بوجود اومده ، وارد کردن دیتا به نرم افزار اماری و تجزیه و تحلیل آماری اون رو هم به متخصص های آمار زیستی و اپیدمیولوژی مدیتورها بسپارید که سالیان سال با این موضوعات زندگی کردن و حل این مشکل ها براشون خیلی راحته!

 

تجزیه و تحلیل آماری

برای نگارش این مطلب ارزشمند از کتاب حجم نمونه در تحقیقات پزشکی رویکردی کاربردی (دکتر نیما معتمد | دکتر فرهاد زمانی) استفاده شد.

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا