سیستم تشخیص سرقت ادبی توسط الگوریتم خوشه بندی فازی c-means
ارسال شده توسط:Papersimتاریخ ارسال: 2018/01/06در دیدگاهها برای سیستم تشخیص سرقت ادبی توسط الگوریتم خوشه بندی فازی c-means بسته هستند
هدف ما سیستم تشخیص سرقت ادبی توسط الگوریتم خوشه بندی فازی c-means
هر مجموعه داده بصورت دو دسته از اسناد در نظر گرفته می شود. دسته اول اسناد suspicious (مشکوک) می باشد که در محتوای انها ممکن است از محتوای دسته دیگر اسناد به نام source استفاده شده باشد. هدف این است که تشخیص داده شود که هر سند مشکوک از کدام اسناد منبع استفاده یا به عبارت دیگر دزدیده است.
یک سند سرقتی (plagiarized document) شامل محتوایی از یک یا چندین منبع موجود در وب (web) می باشد که تشخیص ان بصورت دستی در میان انبوهی از اسناد در محیط وب غیرممکن است. در ادامه برای تشخیص دزدی علمی (plagiarism) روشی ارائه می شود که برای بازیابی کاندیدها از خوشه بندی c-means فازی استفاده می کند. برای بررسی و ارزیابی الگوریتم از مجموعه داده های PAN 2013 استفاده می شود. کارایی الگوریتم توسط فاکتورهای استاندارد recall و precision مقایسه می شود.
الگورتم ارائه شده از رویکرد بازیابی کاندید موجود(Existing Candidate Retrieval Approaches) استفاده می کند. یکی از روش هایی که در رویکرد بازیابی کاندید موجود استفاده می شود رویکرد k means می باشد. مساله اصلی در روش هایی که برمبنای k means می باشند، تعین مقدار k یعنی تعداد خوشه ها و مقدار اولیه مراکز خوشه ها می باشد. در روش ارائه شده تعداد خوشه ها برابر با تعداد اسناد suspiciousو خود اسناد suspiciouc به عنوان مقدار اولیه مرکز خوشه ها در نظر گرفته می شود.
سیستم تشخیص سرقت ادبی توسط الگوریتم خوشه بندی فازی c-means
Exploration of Fuzzy C Means Clustering Algorithm in External
Plagiarism Detection System
Published in: Intelligent Systems Technologies and Applications
Date of Publication: Springer , Switzerland 2016
برای مشاهده مقاله ؛ تصویر فوق را کلیک کنید تا دانلودشود