هدف ما استخراج قوانین از داده های بیولوژیکی با استفاده از الگوریتم ژنتیک موازی
در این مقاله سعی شده است یک روش استخراج قانون از یک مجموعه داده ارائه شود که بر اساس الگوریتم ژنتیک می باشد. منظور از استخراج قانون بیرون آوردن رابطه بین ویژگی های موجود در یک مجموعه داده می باشد. این قوانین دارای شکل کلی می باشند که در آنها X و Y دو زیرمجموعه از ویژگی ها می باشند که دارای اشتراک تهی هستند.
یکی از روش های مهم و پایه در این زمینه روش Apriori نام دارد که روش ارائه شده در این مقاله بر پایه این روش می باشد. این روش دارای دو پارامتر می باشد که باید توسط کاربر مشخص شوند و الگوریتم به این دو پارامتر حساس می باشد.
این دو پارامتر به ترتیب minimum support و minimum confidence نام دارند. Supportیک قانون نشان دهنده این است که قانون مورد نظر چقدر در مجموعه داده گسترده است و می تواند موثر واقع شود و minimum support یک مقدار آستانه برای این مقدار می باشد.
میزان confidence یک قانون نیز نشان دهنده این مساله است که قانون مورد نظر در چند درصد مواقع با برقراری طرف اول رابطه طرف دوم را بدرستی پیش بینی می کند. پارامتر minimum confidence یک مقدار آستانه برای این مقدار می باشد. همانطور که اشاره شد اشکال روش پایه مجبور بودن کاربر برای تعیین دو پارامتر تعریف شده می باشد. این مقاله این روش را طوری بهبود داده است که نیازی به این پارامترها نمی باشد.
روش پیشنهادی
این روش بر اساس الگوریتم ژنتیک است که در عمل بصورت موازی اجرا می شود که در ادامه قسمت های مختلف آن اجرا می شود قسمت محاسبه تابع fitness می تواند بصورت موازی انجام شود زیرا این بخش برای هر فرد موجود در جمعیت مستقل از افراد دیگر می باشد.
استخراج قوانین از داده های بیولوژیکی با استفاده از الگوریتم ژنتیک موازی
Discovering Interesting Rules from Biological Data Using Parallel Genetic Algorithm