بدون دیدگاه

داده کاوی در مراقبت های بهداشتی برای تأثیر پیش آگهی و درک عمیق تر از داده های پزشکی از اهمیت بالایی برخوردار است. داده کاوی بهداشت و درمان تلاش می کند مشکلات بهداشت جهانی را در تشخیص و درمان بیماری ها حل کند [13]. محققان از روشهای داده کاوی برای تشخیص پزشکی چندین بیماری مانند دیابت [14] ، سکته مغزی [15] ، سرطان [16] و بیماری های قلبی استفاده می کنند. چندین تکنیک داده کاوی برای تشخیص بیماری های قلبی استفاده می شود که میزان مختلفی از دقت را نشان می دهد.

اخیراً Paris  و همکاران. طبقه‌بندیهای منفرد را مورد بررسی قرار داده و از طریق رأی گیری ، طبقه بندی های مختلفی را با هم ترکیب کرده و نشان داد که رأی گیری نسبت به سایر طبقه بندیهای منفرد عملکرد بهتری دارد. در این مقاله با استفاده از KNN در تشخیص بیماری های قلبی در مجموعه داده ها، امکان مقایسه با سایر تکنیک های داده کاوی مورد استفاده در همان مجموعه داده فراهم شده است. همچنین تحقیق می کند که آیا تلفیق رای دادن با KNN می تواند دقت آن را در تشخیص بیماران قلبی افزایش دهد. بقیه مقاله به شرح زیر تقسیم می شوند: بخش پیش زمینه با استفاده از تکنیک های داده کاوی در تشخیص بیماری قلبی ، بخش روش شناسی KNN را توضیح می دهد و رای گیری با آن در تشخیص بیماران مبتلا به بیماری های قلبی ، بخش داده های بیماری قلبی داده های مورد استفاده را توضیح می دهد. ، بخش نتایج ، نتایج KNN و رأی دهی را ارائه می دهد ، و در ادامه بخش خلاصه آمده است.

متخصصان بهداشت ، مقادیر قابل توجهی از داده های بیماران را که می توانند برای استخراج دانش مفید استفاده شوند ، ذخیره می کنند. محققان در مورد استفاده از تکنیک های آماری و داده کاوی برای کمک به متخصصان بهداشت و درمان در تشخیص بیماری قلبی تحقیق کرده اند. تجزیه و تحلیل آماری عوامل خطر مرتبط با بیماری های قلبی را سن ، فشار خون ، عادت به سیگار کشیدن [20] ، کلسترول کل [21] ، دیابت [22] ، فشار خون بالا ، سابقه خانوادگی بیماری های قلبی [23] ، چاقی و کمبود عنوان کرده است. فعالیت بدنی [24]. آگاهی از عوامل خطر مرتبط با بیماری های قلبی به متخصصان مراقبت های بهداشتی کمک می کند تا بیماران در معرض خطر بالای بیماری قلبی را شناسایی کنند

محققان از روشهای مختلف داده کاوی مانند درخت تصمیم گیری ، naïve bayes ، شبکه عصبی ، bagging ، kernel  density و ماشین بردار پشتیبانی از مجموعه داده های مختلف بیماریهای قلبی استفاده کرده اند تا به متخصصان مراقبت های بهداشتی در تشخیص بیماری های قلبی کمک کنند [17] ، [25] ] – [30].

 

نتایج حاصل از تحقیقات مختلف داده کاوی را نمی توان مقایسه کرد زیرا از مجموعه داده های مختلف استفاده کرده اند. با این حال ، با گذشت زمان ، یک مجموعه داده معیار در ادبیات پدید آمده است: مجموعه داده های بیماری کلیولند (CHDD). نتایج آزمایشات این مجموعه داده اجازه مقایسه را می دهد. جدول 1 نمونه ای از تکنیک های داده کاوی مورد استفاده در CHDD در تشخیص بیماران قلبی را نشان می دهد که رتبه مختلفی از دقت را نشان می دهد که بین 81 تا 89 درصد است. Polat ، Sahan و همکاران ، از KNN به عنوان یک مرحله قبل از پردازش به خصوصیات وزن استفاده میکرد  قبل از اینکه از سیستم تشخیص ایمنی مصنوعی استفاده کند ، اما از KNN به عنوان یک روش طبقه بندی استفاده نمی کرد [31].

K- نزدیکترین-همسایه یکی از پرکاربردترین تکنیک های داده کاوی در مشکلات طبقه بندی است [18]. سادگی و سرعت همگرایی نسبتاً زیاد آن را به یک انتخاب محبوب تبدیل کرده است. با این حال ، یک نقطه ضعف اصلی طبقه بندی کننده KNN ، حافظه بزرگ مورد نیاز برای ذخیره کل نمونه است. وقتی نمونه بزرگ است ، زمان پاسخگویی در رایانه متوالی نیز بزرگ است [33]. با وجود مسئله نیاز حافظه  عملکرد خوبی در مشکلات طبقه بندی مجموعه های داده های مختلف نشان می دهد [34]

به تازگی ، محققان پیشنهاد می کنند که اعمال رأی گیری می تواند از سایر طبقه بندی های منفرد فراتر رود [19]. تقسیم داده های آموزش به زیر مجموعه های کوچکتر و ایجاد یک مدل برای هر زیر مجموعه و سپس استفاده از رأی گیری برای طبقه بندی داده های آزمایش ، می تواند عملکرد طبقه بندیگر را ارتقا بخشد [35]. اخیراً ، ما تحقیقاتی را در مورد کاربرد درخت تصمیم گیری انجام دادیم و بررسی کردیم که آیا تلفیق رای گیری با آن می تواند صحت آن را در تشخیص بیماران قلبی افزایش دهد. نتایج نشان داد که تلفیق رأی دادن با درخت تصمیم گیری می تواند دقت آن را در تشخیص بیماران قلبی افزایش دهد. این مقاله با استفاده از KNN برای کمک به متخصصان بهداشت و درمان در تشخیص بیماری های قلبی مورد بررسی قرار می گیرد. همچنین تحقیق می کند که آیا تلفیق رای دادن با KNN می تواند دقت آن را در تشخیص بیماران قلبی افزایش دهد.

داده های مورد استفاده در این مطالعه معیار   Cleveland Clinic مجموعه داده های بیماری قلبی است که در http://archive.ics.uci.edu/ml/datasets/Heart+Disease موجود است. مجموعه داده ها دارای 76 ویژگی خام است. با این حال ، تمام آزمایش های منتشر شده فقط به 13 مورد آنها اشاره دارد. مجموعه داده شامل مجموعه داده ها حاوی 303 ردیف است که 297 نمونه کامل است. شش ردیف حاوی مقادیر گمشده بوده و از آزمایش خارج می شوند.

. در این مقاله تحقیقاتی را نشان می دهیم که از KNN در یک مجموعه داده معیار استفاده می کند تا کارایی آن در تشخیص بیماری های قلبی بررسی شود. ما همچنین بررسی کردیم که آیا ادغام رأی دادن با KNN می تواند دقت آن را حتی بیشتر کند. نتایج ما نشان می دهد که استفاده از KNN به دقت 4/97 درصد رسیده است که بالاتر از سایر یافته های منتشر شده در این مجموعه داده معیار است. نتایج همچنین نشان می دهد که استفاده از رای گیری نمی تواند باعث افزایش دقت KNN در تشخیص بیماری های قلبی شود. البته ، در حالی که KNN نتایج عالی به دست آورده است ، کار باید در برابر سایر مجموعه های داده بزرگتر تأیید شود. کار که ادامه دارد

 

 

 

نوشته‌های پیشین
پیش بینی بیماری قلبی موثر با استفاده از تکنیک های یادگیری ماشین ترکیبی
نوشته‌ی بعدی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Fill out this field
Fill out this field
لطفاً یک نشانی ایمیل معتبر بنویسید.
شما برای ادامه باید با شرایط موافقت کنید

فهرست