طراحی سیستم خبره فازی برای اندازه گیری میزان سئو
حدود یک سال و نیم پیش بود که یک سیستم خبره برای اندازه گیری سئو سایت ها طراحی کردم. برای بدست آوردن بهترین حالت اعداد فازی و منطق تصمیم گیری آزمایش های زیادی انجام دادم و در نهایت در یک حالت به نتیجه رسیدم. جالب اینجا بود که نتایج آزمایشات انجام شده بعد از چند ماه به واقعیت پیوست و آثار آن در نتایج گوگل نمایان شد.
ماه گذشته این مسئله به ذهنم رسید که می توانم از همین سیستم برای شناسایی میزان فریب آمیز بودن صفحات استفاده کنم، در آن زمان مشغول تکمیل نتایج بدست آمده روی پیاده سازی موتور جستجوی فارسی وب بودم. موضوعی که خیلی ذهنم را مشغول کرده این هست که مطمئنا گوگل هم نتایج را بر اساس یک سیستم خبره فازی رتبه بندی میکنه و به صورت ضرب یک مجموعه پارامتر و وزن عمل نمیکنه.
برای افرادی که خیلی با سیستم فازی و منطق فازی آشنا نیستند چند جمله در اینجا می نویسم:
منطق فازی توسط یک ایرانی ساکن کشور آذربایجان که بعدها به آمریکا رفت ابداع شد. ما برای اندازه گیری کمیت ها از اعداد استفاده می کنیم، مثلا میگوییم دمای هوا 20 درجه سانتی گراد است. این نوع مقیاس گذاری برای کامپیوتر کاملا قابل اندازه گیری است و دقیق است. اما در زندگی روزمره ممکن است افراد اینگونه عمل نکنند و مثلا یک فرد بگوید هوا گرم است یا هوا خنک است. آیا میتوان یک اندازه مشخص برای گرمای هوا مشخص کرد؟ ممکن است گرمای هوا از دید افراد مختلف متفاوت باشد و حتی در برخی از دماها (مثلا بین 20 تا 30 درجه) دمای هوا هم گرم باشد و هم معتدل و این دو با هم همپوشانی داشته باشند. تعریف این محدوده ها را با اعداد فازی مشخص می کنیم.
اعداد فازی می توانند یکی از حالت های زیر باشند:
- مثلثی
- ذوزنقه ای
- گوسی
بسیاری از دستگاه های امروزی برای تصمیم گیری از منطق فازی استفاده می کنند. به عنوان مثال تمام ماشین های ظرفشوئی از این منطق برای تشخیص تمیز بودن ظروف استفاده می کنند. مراحل یک سیستم خبره فازی به صورت زیر است:
- فازی سازی
- تصمیم گیری فازی بر اساس قوانین تعریف شده در سیستم
- غیر فازی سازی (برش لامدا و...)
قوانین سیستم خبره فازی بر اساس یک مجموعه اگر آنگاه که بر روی اعداد فازی تعریف میشود انجام میشود.
در حال حاضر در حال بررسی بیشتر این سیستم خبره فازی و نتایج آن برای تشخیص فریب آمیز بودن صفحات هستم و به نظر می رسد که نتایج کار مناسب باشد و دقت بالایی داشته باشد.