تبلیغات
دانش ما - کامپیوتر

کنکور و نمونه سوال



 

آشنایی با CPU (ریزپردازنده یا میكرو پروسسور)
طبقه بندی : کامپیوتر-مقالات
ریزپردازنده واحد پردازش مركزی یا مغز رایانه می باشد. این بخش مدار الكترونیكی بسیار گسترده و پیچیده ای می باشد كه دستورات برنامه های ذخیره شده را انجام می دهد. جنس این قطعه كوچك (تراشه) نیمه رسانا است. CPU شامل مدارهای فشرده می باشد و تمامی عملیات یك میكرو رایانه را كنترل می كند. تمام رایانه ها (شخصی، دستی و...) دارای ریزپردازنده می باشند. نوع ریزپردازنده در یك رایانه می تواند متفاوت باشد اما تمام آنها عملیات یكسانی انجام می دهند.
تاریخچه ریزپردازنده
ریزپردازنده پتانسیل های لازم برای انجام محاسبات و عملیات مورد نظر یك رایانه را فراهم می سازد. در واقع ریزپردازنده از لحاظ فیزیكی یك تراشه است. اولین ریزپردازنده در سال ۱۹۷۱ با نام Intel ۴۰۰۴ به بازار عرضه شد. این ریزپردازنده قدرت زیادی نداشت و تنها قادر به انجام عملیات جمع و تفریق ۴ بیتی بود. تنها نكته مثبت این پردازنده استفاده از یك تراشه بود، زیرا تا قبل از آن از چندین تراشه برای تولید رایانه استفاده می شد. اولین نوع ریزپردازنده كه بر روی كامپیوتر خانگی نصب شد. ۸۰۸۰ بود. این پردازنده ۸ بیتی بود و بر روی یك تراشه قرار داشت و در سال ۱۹۷۴ به بازار عرضه گردید. پس از آن پردازنده ای كه تحول عظیمی در دنیای رایانه بوجود آورد ۸۰۸۸ بود. این پردازنده در سال ۱۹۷۹ توسط شركت IBM طراحی و در سال ۱۹۸۲ عرضه گردید. بدین صورت تولید ریزپردازنده ها توسط شركت های تولیدكننده به سرعت رشد یافت و به مدل های ۸۰۲۸۶، ۸۰۳۸۶، ۸۰۴۸۶، پنتیوم ۲، پنتیوم ۳، پنتیوم ۴ منتهی شد.
این پردازنده ها توسط شركت intel و سایر شركت ها طراحی و به بازار عرضه شد. طبیعتاً پنتیوم های ۴ جدید در مقایسه با پردازنده ۸۰۸۸ بسیار قوی تر می باشند زیرا كه از نظر سرعت به میزان ۵۰۰۰ بار عملیات را سریعتر انجام می دهند. جدیدترین پردازنده ها اگر چه سریعتر هستند گران تر هم می باشند. كارآیی رایانه ها بوسیله پردازنده آن شناخته می شود. ولی این كیفیت فقط سرعت پروسسور را نشان می دهد نه كارآیی كل رایانه را. به طور مثال اگر یك رایانه در حال اجرای چند نرم افزار حجیم و سنگین است و پروسسور پنتیوم ۴ آن ۲۴۰۰ كیگاهرتز است، ممكن است اطلاعات را خیلی سریع پردازش كند. اما این سرعت بستگی به هارددیسك نیز دارد. یعنی این كه پروسسور جهت انتقال اطلاعات زمان زیادی را در انتظار می گذراند.
پروسسورهای امروزی ساخت شركت Intel، پنتیوم ۴ و سلرون هستند. پروسسورها با سرعت های مختلفی برحسب گیگاهرتز (معادل یك میلیارد هرتز با یك میلیارد سیكل در ثانیه است) برای پنتیوم ۴ از ۴/۱ گیگاهرتز تا ۵۳/۲ متغیر است و برای پروسسور سرعت از ۸۵/۰ گیگاهرتز تا ۸/۱ گیگاهرتز است. یك سلرون همه كارهایی را كه یك پنتیوم ۴ انجام می دهد را می تواند انجام دهد اما نه به آن سرعت.
پردازنده دو عمل مهم انجام می دهد:
۱- كنترل تمام محاسبات و عملیات
۲- كنترل قسمت های مختلف
پردازنده در رایانه های شخصی به شكل یك قطعه نسبتاً تخت و كوچك به اندازه ۸ یا ۱۰ سانتی متر مربع كه نوعی ماده، مانند پلاستیك یا سرامیك روی آن را پوشانده است تشكیل شده در واقع فرآیند بوجود آمدن این مغز الكترونیكی به این گونه می باشد كه از سیلیكان به علت خصوصیات خاصی كه دارد جهت ایجاد تراشه استفاده می شود. بدین گونه كه آن را به صورت ورقه های بسیار نازك و ظریف برش می دهند و این تراشه ها را در درون مخلوطی از گاز حرارت می دهند تا گازها با آنها تركیب شوند و بدین صورت طبق این فرآیند شیمیایی سیلیكان كه از جنس ماسه می باشد به فلز و بلور تبدیل می شود كه امكان ضبط و پردازش اطلاعات را در بردارد. این قطعه كار میلیونها ترانزیستور را انجام می دهد.
پردازنده وظایف اصلی زیر را برای رایانه انجام می دهد:
۱- دریافت داده ها از دستگاه های ورودی
۲- انجام عملیات و محاسبات و كنترل و نظارت بر آنها
۳- ارسال نتایج عملیات با دستگاه های خروجی
پردازنده مانند قلب رایانه است و از طریق كابلهای موجود با واحدهای دیگر مرتبط می شوند.
در واقع از نظر فنی عملكرد پردازنده با دو ویژگی تعیین می شود:
۱- طول كلید- تعداد بیت هایی كه یك پردازنده در هر لحظه پردازش می كند و طول این كلمات معمولاً ۴ و ۸ و ۱۶ و ۳۲ و یا ۶۴ بیتی می باشد.
۲- تعداد ضربان الكترونیكی كه در یك ثانیه تولید شده است و با واحد مگاهرتز سنجیده می شود.
محل قرارگیری پردازنده ها بر روی مادربرد می باشد. بنابراین بایستی هماهنگی لازم بین مادربرد و پردازنده وجود داشته باشد. این هماهنگی باعث بالا رفتن عملیات رایانه می شود. در غیر این صورت نتیجه خوبی بدست نمی آید.
نكته: بر روی پردازنده حروف و ارقامی دیده می شود كه در واقع نشان دهنده شماره سریال ها ،سرعت، ولتاژ، مدل، نسل و نام سازنده آن می باشد. با توجه به نوع دستورالعمل ها یك ریزپردازنده با استفاده از واحد منطبق و حساب خود (ALU) قادر به انجام عملیات محاسباتی مانند جمع و تفریق و ضرب و تقسیم است. البته پردازنده های جدید اختصاصی برای انجام عملیات مربوط به اعداد اعشاری نیز می باشند. ریزپردازنده قادر به انتقال داده ها از یك محل حافظه به محل دیگر می باشند و می توانند تصمیم گیری نمایند و از یك محل به محل دیگر پرش داشته باشد تا دستورالعمل های مربوط به تصمیم اتخاذ شده را انجام دهد.
منبع :

rkrayaneh.blogfa.com

تاریخ انتشار : پنجشنبه 22 مهر 1389 - 10:15


آینده حافظه ها در دستان SSD

طبقه بندی : کامپیوتر - مقالات

از زمانی که هارد دیسک های چند کیلوبایتی به بازار آمدند تا امروز که می توان یک هارد دیسک یک ترابایتی را با قیمتی خیلی ارزان خرید کاربران همیشه به دنبال حافظه هایی با ظرفیت های بیشتر و بیشتر بوده اند. اما ظرفیت بالا فقط یک بعد ماجرا است. حالا که عطش رسیدن به ظرفیت های بالا تا حدی رفع شده است وقت آن رسیده که بقیه مشکلات حافظه های کامپیوتری هم حل بشود.

از اینجا بود که نوع جدیدی از حافظه به وجود آمد که SSD نام دارد. و به زودی متوجه خواهید شد که وقت آن فرا رسیده که با هارد دیسک ها خداحافظی کنیم و طی چند سال آینده از لغت SSD به جای هارد دیسک استفاده کنیم.
Solid State Drive یا همان SSD به نوعی حافظه گفته می شود که فاقد اجزای متحرک است. و به دو نوع مبتنی بر فلش و DRAM تقسیم می شود. تکنولوژی این نوع حافظه بسیار مشابه تکنولوژی است که در حافظه های RAM به کار رفته است و اطلاعات توسط جریان الکتریسیته قابلیت نوشتن و یا پاک شدن را دارند. این امکان سرعت دسترسی اطلاعات بسیار بالایی را برای آنها فراهم می کند.
SSD ها مزایای متعددی نسبت به هارد دیسک ها دارند. که در این مطلب با آنها آشنا می شوید.

۱۰۰ برابر سریع تر
حافظه های SSD دارای زمان دسترسی اطلاعات بین ۳۵ تا ۱۰۰ میکرو ثانیه هستند. این عدد برای هارد دیسک ها حدود ۵۰۰۰ تا ۱۰۰۰۰ میکرو ثانیه است. و این به این معنی است که حافظه های SSD حدود ۱۰۰ برابر سریع تر از هارد دیسک های فعلی هستند. از طرف دیگر در SSD ها چون هد برای خواندن اطلاعات وجود ندارد اطلاعات در هر لحظه از هر مکان حافظه قابل خواندن هستند بنابراین این موضوع هم سرعت دسترسی به اطلاعات را افزایش می دهد. در مورد سرعت SSD ها می توانید این مطلب نارنجی را بخوانید.

عمر طولانی:
هارد دیسک ها از صفحات متحرک و بازوهایی که اطلاعات را از روی دیسک می خواند تشکیل شده اند. اجزای متحرک که تمام مدت در حال کار کردن هستند باعث فرسودگی یک هارد دیسک می شود. به طور معمول یک هارد دیسک حدود سه سال عمر می کند و بعد از آن دیگر نمی توان به آن اعتماد کرد. چرا که هر لحظه ممکن است غزل خداحافظی را بخواند. حافظه های مبتنی بر فلش اوضاع متفاوتی دارند به دلیل نداشتن اجزای متحرک و سیکل نوشتن اطلاعات طولانی تر می توانید سال های سال به SSD خود اعتماد کنید بدون آنکه نگران از دست رفتن اطلاعات خود باشید. برای مثال شرکت سامسونگ ادعا کرده است که SSD های ساخت این شرکت دارای ۱۰۰ سال عمر مفید هستند.

خاموش شو! ای هارد دیسک:
سکوت مطلق در مقابل کامپیوتر یکی از آرزوهای شخصی من است. و SSD ما را یک قدم به تحقق این آرزو نزدیک می کند. به دلیل اینکه هیچ قطعه متحرکی در SSD ها وجود ندارد بنابراین این حافظه های جدید بدون صدا هستند و می توانید امیدوار باشید که به زودی از دست صدای خش خش هارد دیسک تان راحت خواهید شد.

SSD مقاوم تر در مقابل ضربه
یکی از مشکلات مهم هارد دیسک ها ضعف آنها در مقابل ضربه های فیزیکی است. SSD ها در مقابل هارد دیسک ها هرکول محسوب می شوند برای باور این موضوع می توانید به این صفحه مراجعه کنید

CODE
http://www.gizmodo.com.au/2008/09/samsung_ssd_falls_three_stories_still_boots_up_windows.html
و ویدیویی از یک SSD ساخت سامسونگ ببینید که توسط یک نفر از طبقه سوم یک ساختمان به پایین پرتاب می شود. سپس درون لپ تاپ گذاشته می شود و بدون هیچ مشکلی بالا آمدن ویندوز را از روی آن مشاهده می کنید.
در صورت تمایل میتوانید ویدیو را با حجم حدود ۲ مگابایت از اینجا دانلود کنید.

CODE
http://www.mavricmedia.com/ssi/albums/userpics/10051/Drop_Test_4_3-Samsung_SSD_Drop_Test.wmv
ضمنا SSD ها بر خلاف هارد دیسک ها تحت تاثیر شبکه های مغناطیسی قوی اطلاعات خود را از دست نمی دهند. و در شرایط متفاوت دمایی بین منفی ۶۰ درجه تا مثبت ۹۵ درجه سانتیگراد قادر به کار کردن هستند.

مصرف برق کمتر و گرمای کمتر:
حافظه های SSD با وجود سرعت بیشتر مصرف انرژی کمتری نسبت به هارد دیسک ها دارند. و این در لپ تاپ ها به معنی طول عمر باطری بیشتر خواهد بود. از طرف دیگر SSD گرمای کمتری تولید می کند. گرمای کمتر به معنای نیاز کمتر به قرار دادن فن های خنک کننده درون لپ تاپ ها است و این باعث کوچک تر شدن و سبک تر شدن لپ تاپ ها خواهد شد.
مشکلات:
همه چیز که گل و بلبل نمی شود. بزرگ ترین مشکل SSD ها این است که فعلا گران هستند. البته قیمت آنها به سرعت در حال کاهش است. برای مثال در ماه اول سال ۲۰۰۸ یک SSD 64 گیگابایتی حدود ۱۰۰۰ دلار قیمت داشت. اما هنوز یازده ماه نگذشته که می توان SSD های ۳۲ گیگابایتی را با قیمتی حدود ۱۰۰ دلار خرید. البته هنوز هم گران محسوب می شوند اما داشتن یک SSD تا یک سال پیش بیشتر شبیه یک رویا بود. اما هم اکنون با کمی هزینه بیشتر می توان به جای هارد دیسک یک SSD سریع و ساکت خرید. بسیاری از تولید کنند های لپ تاپ هم در حال جایگزین کردن SSD ها با هارد دیسک های قدیمی هستند و می توان امیدوار بود که به زودی شاهد کاهش چشمگیر قیمت SSD ها و افزایش فروش آنها خواهیم بود.
شما هم اگر در فکر خرید لپ تاپ جدید هستید گزینه SSD را فراموش نکنید.

منبع :

ramehr.com

تاریخ انتشار : یکشنبه 13 بهمن 1387 - 11:46


ارتقا کارایی هارددیسک‌ها با تکنولوژی NCQ
طبقه بندی : کامپیوتر - مقالات

در خرید قطعه مهمی مانند هارددیسک کمتر به نوع تکنولوژی مورد استفاده توجه می‌شود و خریدار محترم بیشتر بر سرعت گردش و میزان بافر آن ‌تمرکز می‌کند. سرعت گردش محور مرکزی و ظرفیت بافر، دو پارامتر مهم در افزایش کارایی هارددیسک‌ها محسوب می‌شوند، اما چیزهای دیگری نیز وجود دارند که در ظاهر امر به چشم نمی‌آیند، اما اثربخشی آن‌ها غیرقابل انکار است. در این نوبت و به قدر فرصتی که در اختیار دارم در این‌باره صحبت خواهم کرد.

● تکنولوژی NCQ
اگر نظرسنجی دقیقی شکل گیرد، حتم دارم کمتر از پنج درصد کاربران بازار با تکنولوژی NCQ آشنایی دارند. البته اهالی حرفه‌ای مدت‌هاست که با تکنولوژی اصیل‌تری با نام TCQ آشنایی دارند و به‌همین دلیل می‌توانند حدس‌هایی درباره NCQ مطرح کنند.
تکنولوژی NCQ در واقع یکی از فرزندان خلف تکنولوژی TCQ است و فقط در هارددیسک‌های SATA عرضه می‌شود و شرایطی را فراهم می‌کند تا دسترسی به محل‌های ذخیره‌سازی داده‌ها به شیوه‌ای هوشمندانه انجام شود. اصطلاح NCQ مخفف Native Command Queuing است و همچنان که گفتم از فرزندان TCQ که در سال ۱۹۹۴ برای استفاده در هارددیسک‌های SCSI۲ ارایه شده بود.
● مفهوم NCQ
همچنان که می‌دانید بخش کنترل‌گر هارددیسک براساس درخواست‌هایی که توسط چیپ ست‌های اصلی مادربرد ارسال می‌شود فعالیت می‌کند. این درخواست‌ها شامل نوشتن و خواندن‌ داده‌ها هستند. از این‌رو اگر هارددیسک را مجموعه‌ای از منطقه‌های ذخیره‌سازی (سلول‌های حافظه) فرض کنیم،‌ هد خواندن و نوشتن برای انجام دستورات بخش کنترلی، لازم است که بین سلول‌های توزیع شده روی دیسک مدور جابه‌جا شود و دستورات مشخص را یک به یک انجام دهد.
با یک مثال ساده توصیف بهتری از عملکرد هد خواندن و نوشتن ارایه می‌کنیم. فرض کنید که دستورات بخش کنترلی هارددیسک این چنین باشد که:
۱) داده X را از سلول حافظه ۸ بخوان،
۲) داده Y را در سلول حافظه ۴ ثبت کن،
۳) داده Z را از سلول حافظه ۷ بخوان،
۴) داده W را در سلول حافظه ۱ ثبت کن.
هد خواندن و نوشتن برای انجام این امور باید از موقعیت سکون خود (سلول حافظه صفر) حرکت کند و پس از گذر از سلول‌های ۱ تا ۷، خود را به سلول شماره ۸ برساند. سپس باید به از ۳ سلول عبور کند و خود را به سلول ۴ برساند. آنگاه نوبت به سلول ۷ می‌رسد که با عبور از سلول‌های حافظه ۵ و ۶ قابل دسترسی خواهد بود و در پایان هد خواندن و نوشتن باید که به سلول ۱ بازگردد و دستور چهارم را انجام دهد. هد خواندن و نوشتن برای انجام این چهار دستور مختصر لازم است که از روی حداقل ۲۱ سلول حافظه عبور کند.
استفاده از تکنولوژی NCQ شرایط دیگری را رقم خواهد زد. به این صورت که بخش کنترلی پیش از ارسال دستورات برای هد خواندن و نوشتن قدری فکر می‌کند و سعی دارد که مسیرهای تکراری را حذف کند. اگر دستورات چهارگانه ذکر شده را با استفاده از تکنولوژی NCQ انجام دهیم این‌چنین می‌شود که هد خواندن و نوشتن اول دستور‌العمل چهارم را به انجام می‌رساند و به سلول حافظه یک منتقل می‌شود، سپس دستورالعمل دوم را به انجام می‌رساند و پس از آن نوبت به انجام دستورالعمل سوم در موقعیت ۷ می‌رسد. در پایان دستورالعمل اول را در سلول ۸ به پایان می‌رساند. مشهود است که موارد چهارگانه فوق فقط با ۸ جابه‌جایی انجام می‌شود، در صورتی که این دستورات بدون استفاده از این تکنولوژی در ۲۱ جابه‌جایی انجام می‌گرفت.
البته هر چه شرایط پیچیده‌تر شود، میزان اثرگذاری تکنولوژی NCQ کاهش خواهد یافت، اما در همان حالت حداقلی نیز تفاوت مشهود است.
● مزایای تکنولوژی NCQ
اصل‌ترین استفاده از تکنولوژی NCQ، در کاربردهای چندگانه است. به‌ بیان دیگر این تکنولوژی برای افزایش کارایی سرورهایی طراحی شده است که درخواست‌های متنوع چندین کاربر به‌صورت همزمان برای هارددیسک ارسال می‌کند. نکته جالب این است که بیشتر کاربران کنونی کامپیوترها از چندین برنامه به صورت همزمان استفاده می‌کنند و به‌همین دلیل این تکنولوژی کارساز خواهد بود.
علاوه بر افزایش کارایی هارددیسک در دسترسی به داده‌ها، چند مزیت دیگر را نیز می‌توان عنوان کرد.
۱) هد خواندن و نوشتن کمتر جابه‌جا می‌شود و عمر مفید آن افزایش خواهد یافت.
۲) استفاده بلندمدت از تکنولوژی NCQ موجب کاهش مصرف‌انرژی خواهد شد.
۳) هر چه تماس هد خواندن و نوشتن با سطح هارددیسک کمتر باشد، احتمال بروز خطا در ثبت و خوانش داده‌ها کاهش خواهد یافت. دیگر اینکه، کاهش تماس هد یا سطح هارددیسک احتمال برخورد فیزیکی این دو موجود و بروز صدمات غیرقابل جبران فیزیکی هارددیسک را کاهش خواهد داد. به‌ بیان دیگر امر ذخیره‌سازی داده‌ها با درصد خطای کمتری انجام می‌شود و داده‌ها با امنیت بیشتری نگهداری می‌شوند.
۴) زمان انتظار انجام دستورات بعدی کاهش خواهد یافت و حافظه بافر با سرعت بالاتری خالی می شود و پذیرای داده‌ها و دستورالعمل‌های جدید خواهد شد. نتیجه اینکه با این اقدام شاهد وقفه‌های طولانی برای ثبت یا دریافت داده‌ها نخواهیم بود.
● آخر اینکه
بیشتر هارددیسک‌هایی که از رابط SATA استفاده می‌کنند همراه با تکنولوژی NCQ عرضه می‌شوند، اما برخی مدل‌ها همچنان بدون این تکنولوژی تولید شده و خریدار از همه جا بی‌خبر نیز بدون اطلاع قبلی آن را می‌خرد. به‌طور معمول قیمت اضافه‌ای به‌دلیل ارایه امکان استفاده از این تکنولوژی دریافت نمی‌شود!
دیگر اینکه، استفاده از تکنولوژی NCQ علاوه بر افزایش کارایی کلی هارددیسک، احتمال بروز خطا یا خرابی (MTBF) را نیز کاهش می‌دهد. اگر از آن دسته کاربرانی هستید که به‌ صورت همزمان از چند نرم‌افزار استفاده می‌کنید لازم است که هارددیسک شما مجهز به تکنولوژی NCQ باشد.
این را هم بگویم و خلاص که ترکیب تکنولوژی‌های NCQ و RAID در سیستم‌هایی که از چندین هارددیسک استفاده می‌کنند فوق‌العاده است.

منبع :

هفته‌نامه بزرگراه فناوری

تاریخ انتشار : یکشنبه 13 بهمن 1387 - 11:28


موتور جستجو چگونه کار می کند؟
طبقه بندی : کامپیوتر - مقالات
وقتی جستجویی در یک موتور جستجوگر انجام و نتایج جستجو ارایه می شود، كاربران در واقع نتیجه كار بخش های متفاوت موتور جستجوگر را می بینند. موتور جستجوگر قبلا" پایگاه داده اش را آماده كرده است و این گونه نیست كه درست در همان لحظه جستجو، تمام وب را بگردد. بسیاری از خود می پرسند كه چگونه ممکن است گوگل در كمتر از یك ثانیه تمام سایت های وب را بگردد و میلیون ها صفحه را در نتایج جستجوی خود ارایه كند؟
گوگل و هیچ موتور جستجوگر دیگری توانایی انجام این كار را ندارند. همه آنها در زمان پاسخ گویی به جستجوهای كاربران، تنها در پایگاه داده ای كه در اختیار دارند به جستجو می پردازند و نه در وب! موتور جستجوگر به كمك بخش های متفاوت خود، اطلاعات مورد نیاز را قبلا" جمع آوری، تجزیه و تحلیل می كند، آنرا در پایگاه داده اش ذخیره می نماید و به هنگام جستجوی کاربر تنها در همین پایگاه داده می گردد. بخش های مجزای یك موتور جستجوگر عبارتند از:
• Spider یا عنکبوت
• Crawler یا خزنده
• Indexer یا بایگانی کننده
• Database یا پایگاه داده
• Ranker یا سیستم رتبه بندی
الف Spider- (عنکبوت)
اسپایدر یا روبوت (Robot)، نرم افزاری است كه كار جمع آوری اطلاعات مورد نیاز یك موتور جستجوگر را بر عهده دارد. اسپایدر به صفحات مختلف سر می زند، محتوای آنها را می خواند، لینکها را دنبال می کند، اطلاعات مورد نیاز را جمع آوری می كند و آنرا در اختیار سایر بخش های موتور جستجوگر قرار می دهد. كار یك اسپایدر، بسیار شبیه كار كاربران وب است. همانطور كه كاربران، صفحات مختلف را بازدید می كنند، اسپایدر هم درست این كار را انجام می دهد با این تفاوت كه اسپایدر كدهای HTML صفحات را می بیند اما كاربران نتیجه حاصل از كنار هم قرار گرفتن این كدها را. index.html صفحه ای است كه كاربران آنرا به صورت شكل (1) می بینند:
                                                                                                           شكل 1- نمونه ای از صفحات وب كه توسط مرورگرها نشان داده می شود.
اما یک اسپایدر آنرا چگونه می بیند؟
برای این كه شما هم بتوانید دنیای وب را از دیدگاه یك اسپایدر ببینید، كافی است كه كدهای HTML صفحات را مشاهده کنید. برای این كار در مرورگر مورد استفاده خود، مسیر نشان داده شده در شكل (2) دنبال کنید.
                                                                                                                         شكل 2- روش مشاهده كدهای HTML یک صفحه وب
با انجام این کار فایل متنی شكل (3) به شما نشان داده می شود:
شكل 3- كدهای HTML سازنده یك صفحه وب
آیا این دنیای متنی برای شما جذاب است؟
اسپایدر، به هنگام مشاهده صفحات، بر روی سرورها رد پا برجای می گذارد. شما اگر اجازه دسترسی به آمار دید و بازدیدهای صورت گرفته از یک سایت و اتفاقات انجام شده در آن را داشته باشید، می توانید مشخص كنید كه اسپایدر كدام یک از موتورهای جستجوگر صفحات سایت را مورد بازدید قرار داده است. یکی از فعالیتهای اصلی که در SEM انجام می شود تحلیل آمار همین دید و بازدیدها است.
اسپایدرها كاربردهای دیگری نیز دارند، به عنوان مثال عده ای از آنها به سایت های مختلف مراجعه می كنند و فقط به بررسی فعال بودن لینك های آنها می پردازند و یا به دنبال آدرس ایمیل (Email) می گردند.
ب- Crawler (خزنده)
كراولر، نرم افزاری است كه به عنوان یك فرمانده برای اسپایدر عمل می كند. آن مشخص می كند که اسپایدر كدام صفحات را مورد بازدید قرار دهد. در واقع کراولر تصمیم می گیرد كه كدام یك از لینك های صفحه ای كه اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. ممكن است همه آنها را دنبال كند، بعضی ها را دنبال كند و یا هیچ كدام را دنبال نكند.
کراولر، ممكن است قبلا" برنامه ریزی شده باشد که آدرس های خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آنها دیدن کند. دنبال كردن لینك های یک صفحه به این بستگی دارد كه موتور جستجوگر چه حجمی از اطلاعات یک سایت را می تواند (می خواهد) در پایگاه داده اش ذخیره كند. همچنین ممكن است اجازه دسترسی به بعضی از صفحات به موتورهای جستجوگر داده نشده باشد.
شما به عنوان دارنده سایت، همان طور كه دوست دارید موتورهای جستجوگر اطلاعات سایت شما را با خود ببرند، می توانید آنها را از بعضی صفحات سایت تان دور كنید و اجازه دسترسی به محتوای آن صفحات را به آنها ندهید. موتور جستجو اگر مودب باشد قبل از ورود به هر سایتی ابتدا قوانین دسترسی به محتوای سایت را (در صورت وجود) در فایلی خاص بررسی می کند و از حقوق دسترسی خود اطلاع می یابد. تنظیم میزان دسترسی موتورهای جستجوگر به محتوای یک سایت توسط پروتكل Robots انجام می شود. به عمل کراولر ، خزش (Crawling) می گویند.
ج- Indexer (بایگانی كننده)
تمام اطلاعات جمع آوری شده توسط اسپایدر در اختیار ایندکسر قرار می گیرد. در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار می گیرند و به بخش های متفاوتی تقسیم می شوند. تجزیه و تحلیل بدین معنی است كه مشخص می شود اطلاعات از كدام صفحه ارسال شده است، چه حجمی دارد، كلمات موجود در آن كدامند، کلمات چندبار تكرار شده اند، كلمات در كجای صفحه قرار دارند و ... .
در حقیقت ایندکسر، صفحه را به پارامترهای آن خرد می کند و تمام این پارامترها را به یک مقیاس عددی تبدیل می کند تا سیستم رتبه بندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند. در زمان تجزیه و تحلیل اطلاعات، ایندکسر برای كاهش حجم داده ها از بعضی كلمات كه بسیار رایج هستند صرفنظر می کند. كلماتی نظیر a ، an ، the ، www ، is و ... . از این گونه كلمات هستند.
د - DataBase (پایگاه داده)
تمام داده های تجزیه و تحلیل شده در ایندکسر، به پایگاه داده ارسال می گردد. در این بخش داده ها گروه بندی، كدگذاری و ذخیره می شود. همچنین داده ها قبل از آنكه ذخیره شوند، طبق تکنیکهای خاصی فشرده می شوند تا حجم كمی از پایگاه داده را اشغال كنند. یك موتور جستجوگر باید پایگاده داده عظیمی داشته باشد و به طور مداوم حجم محتوای آنرا گسترش دهد و البته اطلاعات قدیمی را هم به روز رسانی نماید. بزرگی و به روز بودن پایگاه داده یك موتور جستجوگر برای آن امتیاز محسوب می گردد. یكی از تفاوتهای اصلی موتورهای جستجوگر در حجم پایگاه داده آنها و همچنین روش ذخیره سازی داده ها در پایگاه داده است.
و- Ranker (سیستم رتبه بندی)
بعد از آنكه تمام مراحل قبل انجام شد، موتور جستجوگر آماده پاسخ گویی به سوالات كاربران است. كاربران چند كلمه را در جعبه جستجوی (Search Box) آن وارد می كنند و سپس با فشردن Enter منتظر پــاسخ می مانند. برای پاسخگویی به درخواست کاربر، ابتدا تمام صفحات موجود در پایگاه داده كه به موضوع جستجو شده، مرتبط هستند، مشخص می شوند. پس از آن سیستم رتبه بندی وارد عمل شده، آنها را از بیشترین ارتباط تا كمترین ارتباط مرتب می كند و به عنوان نتایج جستجو به كاربر نمایش می دهد.
حتی اگر موتور جستجوگر بهترین و كامل ترین پایگاه داده را داشته باشد اما نتواند پاسخ های مرتبطی را ارایه كند، یك موتور جستجوگر ضعیف خواهد بود. در حقیقت سیستم رتبه بندی قلب تپنده یك موتور جستجوگر است و تفاوت اصلی موتورهای جستجوگر در این بخش قرار دارد. سیستم رتبه بندی برای پاسخ گویی به سوالات كاربران، پارامترهای بسیاری را در نظر می گیرد تا بتواند بهترین پاسخ ها را در اختیار آنها قرار دارد.
حرفه ای های دنیای SEM به طور خلاصه از آن به Algo ( الگوریتم) یاد می كنند. الگوریتم، مجموعه ای از دستورالعمل ها است كه موتور جستجوگر با اعمال آنها بر پارامترهای صفحات موجود در پایگاه داده اش، تصمیم می گیرد که صفحات مرتبط را چگونه در نتایج جستجو مرتب كند. در حال حاضر قدرتمندترین سیستم رتبه بندی را گوگل در اختیار دارد.
می توان با ادغام کردن اسپایدر با کراولر و همچنین ایندکسر با پایگاه داده، موتور جستجوگر را شامل سه بخش زیر دانست که این گونه تقسیم بندی هم درست می باشد:
• کراولر
• بایگانی
• سیستم رتبه بندی
تذکر- برای سهولت در بیان مطالب بعدی هر گاه صحبت از بایگانی کردن (شدن) به میان می آید، مقصود این است که صفحه تجزیه و تحلیل شده و به پایگاه داده موتور جستجوگر وارد می شود.
برای آنكه تصور درستی از نحوه كار یك موتور جستجوگر داشته باشید داستان نامتعارف زیر را با هم بررسی می كنیم. داستان ما یک شکارچی دارد. او تصمیم به شكار می گیرد:
- کار کراولر:
او قصد دارد برای شكار به منطقه حفاظت شده ابیورد، واقع در شهرستان درگز (شمالی ترین شهر خراسان بزرگ) برود.
- پروتكل Robots :
ابتدا تمام محدودیت های موجود برای شكار در این منطقه را بررسی می كند:
• آیا در این منطقه می توان به شکار پرداخت؟
• کدام حیوانات را می توان شکار کرد؟
• حداکثر تعداد شکار چه میزانی است؟
• و ... .
فرض می کنیم او مجوز شكار یک اوریال (نوعی آهو) را از شكاربانی منطقه دریافت می كند.
- کار اسپایدر
او اوریالی رعنا را شكار می كند و سپس آنرا با خود به منزل می برد.
- کار ایندکسر
شكار را تكه تكه كرده، گوشت، استخوان، دل و قلوه، كله پاچه و ... آنرا بسته بندی می كند و بخش های زاید شکار را دور می ریزد.
- کار پایگاه داده
بسته های حاصل را درون فریزر قرار داده، ذخیره می کند.
- کار سیستم رتبه بندی
مهمانان سراغ او می آیند و همسرش بسته به ذائقه مهمانان برای آنها غذا طبخ می كند. ممكن است عده ای كله پاچه، عده ای آبگوشت، عده ای ... دوست داشته باشند. پخت غذا طبق سلیقه مهمانان کار سختی است. ممكن است همه آنها آبگوشت بخواهند اما آنها مسلما" بامزه ترین آبگوشت را می خواهند!
نکته ها:
• شکارچی می توانست برای شکار کبک یا اوریال و یا هر دو به آن منطقه برود همانطور که موتور جستجوگر می تواند از سرور سایت شما انواع فایل (عکس، فایل متنی، فایل اجرایی و ...) درخواست کند.
• شکارچی می تواند شب به شکار برود یا روز. موتور جستجوگر هم ممکن است شب به سایت شما مراجعه کند یا روز. بنابراین همواره مطمئن باشید که سایت شما آپ است و موتور جستجوگر می تواند در آن به شکار فایلها بپردازد.
• غذای خوشمزه را می توانید با نتایج جستجوی دقیق و مرتبط مقایسه کنید. اگر شکارچی بهترین شکار را با خود به منزل ببرد اما غذایی خوشمزه و مطابق سلیقه مهمانان طبخ نگردد، تمام زحمات هدر رفته است.
• به عنوان آخرین نکته این بخش یاد آوری می کنم که به شکار اوریالی رعنا آن هم در منطقه حفاظت شده ابیورد (پارک ملی تندوره) اصلا فکر نکنید. اما توصیه می شود که حتما از طبیعت بکر آن دیدن فرمایید (بدون اسلحه!).
منبع :

iranseo.com
articles.ir

تاریخ انتشار : دوشنبه 8 مهر 1387 - 0:1



فیلترها چگونه کار می کند؟
طبقه بندی : کامپیوتر - مقالات

همه روزه کاربران پست الکترونیک ،Inbox خود را مملو از پیامهائی می بینند که از سوی اشخاص ناشناس و تحت عناوین و موضوعات مختلف و پیشنهادی، برای چیزهائی که نمی خواهند و نیازی به آنها ندارند ارسال شده است. این پیام های ناخواسته یا Spam،باعث می شود که کاربران پست الکترونیک ،همه روزه زمان زیادی را برای حذف این پست های بی ارزش از Inbox خود هدر دهند.
● فیلترها چگونه کار می کنند
همه روزه کاربران پست الکترونیک ،Inbox خود را مملو از پیامهائی می بینند که از سوی اشخاص ناشناس و تحت عناوین و موضوعات مختلف و پیشنهادی، برای چیزهائی که نمی خواهند و نیازی به آنها ندارند ارسال شده است.
این پیام های ناخواسته یا Spam،باعث می شود که کاربران پست الکترونیک ،همه روزه زمان زیادی را برای حذف این پست های بی ارزش از Inbox خود هدر دهند.
گزارش زیر مربوط به مشکلات این هرزنامه ها است.
از طرفی گاهی اوقات، پست های مهم بدلیل پرشدن ظرفیت Inbox پستی افراد توسط این پیام های ناخواسته از بین می روند.
اگرچه کاربران پست الکترونیک از فرستندگان این پیام های ناخواسته درخواست می کنند که از ارسال مجدد این پیام ها خودداری کنند اما بعضی از Spamها بصورت ارادی و از طرف شخصی خاص، ارسال نمی شود که بتوان آنها را ردیابی کرد و تحت پیگرد قرار داد.
خبر خوب این است که می توان با Spamها مبارزه کرد. چندین تکنیک معتبر و در دسترس برای دفاع از حجوم این نامه های ناخواسته به درون Inbox پست الکترونیکی وجود دارد ،که از آنجمله می توان به بستن و مسدود کردن آدرس ها و ردیابی کلمات کلیدی گنجانده شده در این هرزنامه ها اشاره کرد.همچنین تکنیکی وجود دارد که هرزنامه ها را بصورت خودکار فیلتر کرده و از این طریق از Inbox پست الکترونیکی محافظت می کند.در ادامه به بررسی برخی از تکنیک های موجود در این زمینه می پردازیم:
● لیست سیاه و سفید
در این روش ،کاربر علاوه بر مسدود کردن آدرس های معروف Spam ،لیستی از آدرس های قابل اطمینان را به عنوان لیست سفید(لیست سایت های معتبر) سازماندهی می کند که آدرس های موجود در این لیست میتوانند مستقیما وارد Inbox کاربران شوند و در مقابل این امکان برای کاربر وجود دارد که آدرس هائی که پیام های ناخواسته ارسال می کنند را تحت عنوان لیست سیاه مسدود، و مستقیم به فولدر پیام های زائد(Spam folder) هدایت کند.
● Fingerprint
در این تکنیک،یک الگوریتم به تمام کاراکترهای موجود در پست الکترونیک یک ارزش عددی اختصاص می دهد که برای محاسبه کد نمایندگی همان آدرس پستی استفاده می شود. این کد با پایگاه داده ای از کدهای هرزنامه های شناخته شده چک شده و در صورت مطابقت مسدود می شود. در واقع این الگوریتم ،تکنیک مناسبی به منظور مبارزه با پیام های ناخواسته می باشد.
● Bayesian Filtering
کلمات ویژه و خاص ،احتمالات خاصی هستند که ممکن است هم در هرزنامه ها و هم در پستهای الکترونیک عادی دیده شوند. برای مثال ،اغلب کاربران پست الکترونیکی ،بارها با کلمه "کاهش وزن" در هرزنامه ها روبرو شده اند ،اما به ندرت این کلمه را در پست های عادی نیز مشاهده کرده اند. مکانیزم فیلترینگ به این احتمالات آگاه نبوده و توانائی پیشبرد عملیات فیلترینگ را ندارد و ناگزیر ،ابتدا باید هدایت شود. برای هدایت مکانیزم فیلتر ،کاربر باید بصورت دستی نشان دهد که پست جدید دریافت شده ،هرزنامه است یا خیر. مکانیزم فیلتر در پایگاه داده خود برای تمام کلمات موجود در پست الکترونیک هدایت شده توسط کاربر (هرزنامه و یا پست عادی) ،یک احتمال درنظر می گیرد. البته این مکانیزم فیلترینگ بطور نمونه به شمار بسیاری از کلمات احتمالی هرزنامه ها آگاه است ،با این وجود شمار بسیار کمی از کلمات احتمالی هرزنامه ها ممکن است در پستهای الکترونیک عادی نیز دیده شوند.
● سخن پایانی
معمولا ،نمی توان جلوی تمام هرزنامه ها را گرفت ،اما با بهره برداری از Spamفیلترها ،می توان باعث کاهش حجم بسیاری از پیام های ناخواسته ای شد که همه روزه در Inbox پستی خود دریافت می کنید. بنابراین ،تنها راه برای مبارزه با هرزنامه ها ،فعال کردن فیلترینگ پست الکترونیکی به منظور مراقبت و بررسی مداوم پست های وارده و یافتن پیام های ناخواسته در میان این پست ها با جستجو در مضامین و مفاهیم آنها و کمک به پاک ماندن Inbox پست الکترونیکی می باشد.

منبع :

بانک مقالات
krcom.blogfa.com

تاریخ انتشار : چهارشنبه 4 دی 1387 - 11:9





Admin Logo
themebox Logo