IPS الغرض من أنظمة استرجاع المعلومات ووظائفها
IPS الغرض من أنظمة استرجاع المعلومات ووظائفها

فيديو: IPS الغرض من أنظمة استرجاع المعلومات ووظائفها

فيديو: IPS الغرض من أنظمة استرجاع المعلومات ووظائفها
فيديو: BST افضل المحركات لمختلف اليات الحفر شركة 2024, شهر نوفمبر
Anonim

يصعب على الشخص العصري تخيل الحياة بدون الإنترنت والوصول الفوري إلى مصادر المعلومات. نادرًا ما يفكر المستخدم في كيفية إجراء البحث عن المحتوى المطلوب على الشبكة. لكن هذا مثير جدا للاهتمام

نظام استرجاع المعلومات (IPS) هو نظام برمجيات وأجهزة معقد يختار المعلومات بناءً على طلب المستخدم. يتم تخزين المعلومات على خوادم في شكل رقمي ، مثل الكتب التي كانت موضوعة على أرفف المكتبات. يتكون النظام من عدة أنظمة فرعية. تؤدي كل واحدة مهمتها في عملية معالجة طلب المستخدم وتزويده بالمعلومات في شكل نصي أو صوتي. إن تعدد المهام المراد حلها يحدد مدى تعقيد بنية أنظمة استرجاع المعلومات الحديثة (اختصار لنظام استرجاع المعلومات). نوع من "الصندوق الأسود": عند الإدخال - نص الطلب ، ما بداخله - غير معروف ، عند الإخراج - معلومات شاملة.

ملف البطاقة في الحياة الحقيقية
ملف البطاقة في الحياة الحقيقية

تدفقات الإدخال

طلبات الحصول على المعلومات التي يشكلها الشخص في شكل نصي على شاشة أداته ،تشكل جزءًا صغيرًا من الطلبات التي تتم معالجتها بواسطة محرك البحث. تتكون المصفوفات الرئيسية لاستعلامات البحث من الروبوتات التي تقبل طلبًا بشريًا وتجري بحثًا متعدد الخطوات وتعليقات مع المستخدم. تشمل أنظمة استرجاع المعلومات Google و Yandex المعروفة وغيرهما ، وتعالج ملايين الطلبات يوميًا.

كائنات البحث عن المصدر

مجموعة الكائنات الأولية التي تهم البحث هي المستندات والسجلات ومقاطع الفيديو والصور والمزيد. تم إنشاؤها خارج IPS. يجب أن يحتوي نظام تخزين واسترجاع المعلومات العامة على نظام ببليوغرافي مدمج - وهو نوع من الكتالوج يسمح لك بالبحث عن أي نوع من الكائنات.

تصبح الكائنات أو تحويلاتها الرقمية "مورد دخول" إلى IPS. ومن بينها تحديد المعلومات التي يحتاجها المستخدم

ابحث عن معلومات
ابحث عن معلومات

مصادر خارجية

تستخدم طريقة عرض تحديد المعلومات مصادر المعرفة الخارجية. هذه هي المعلومات التي يبحث عنها المستخدم. عنوان الفيلم ، اقتباس من الكتاب ، والمزيد. لبحث الكمبيوتر ، يجب ترجمة هذه المعلومات إلى استعلام بلغة خوارزمية. في IPS ، يتم ذلك باستخدام الكتلة لإنشاء الاستعلامات وفهرستها وتطويرها.

من الناحية المثالية ، يجب أن تعتمد هذه العمليات الثلاث - التمثيل والفهرسة وتطوير الاستعلام - على مصادر معرفة متطابقة ، ولكن من الناحية العملية ، لا يمكن تحقيق ذلك.

يجب مراجعة وتحديث مصادر المعرفة باستمرار ، ويجب أن يكون التحديث متطابقًا ومتزامن. ومصدر خارجي للمعرفة يسبق دائمًا استخدامه في محركات البحث لاستعلام ما ، أحيانًا بعدة سنوات.

نظام استرجاع المعلومات
نظام استرجاع المعلومات

عروض

تمثيلات الكائنات الأصلية تتكون من بيانات الإدخال في بعض المجموعات أو يتم تحويلها وفقًا لقواعد وخوارزميات نظام استرجاع معلومات معين.

المشاهدات هي نسخ محولة أكثر أو أقل من كائن البحث الأصلي. في مجموعة النصوص الكاملة غير المحررة ، كل نص هو تمثيله الخاص. في مجموعة كائنات معروضات المتحف والتحف ، يمكن أن يكون التمثيل عبارة عن وصف محوّل للكائن بصورته. في بعض الحالات ، قد يكون التمثيل مشتقًا جزئيًا من الكائن الأصلي وجزئيًا من الوصف: في محركات البحث الببليوغرافية ، يتم اشتقاق التمثيلات من الكائن - على سبيل المثال ، العنوان ، سيتم دمج اسم المؤلف مع التعليق التوضيحي للعمل.

إيجاد ما تحتاجه
إيجاد ما تحتاجه

فهرس قابل للبحث

بما أن المعلومات في أنظمة استرجاع المعلومات مخزنة في شكل تمثيل ، فمن المنطقي أن نفترض أن البحث يتم وفقًا للتمثيل ، وبعد التحديد ، يتم إعطاؤه للمستخدم. في الواقع، ليست هذه هي القضية. على سبيل المثال ، تحصر كتالوجات المكتبات الحالية عبر الإنترنت عمليات البحث في بعض الحقول: المؤلف والعنوان والعناوين الفرعية في طريقة عرض تحتوي على حقول أخرى لم يتم البحث فيها. هذا سبب كاف لضرورة التمييزطريقة عرض وفهرس قابل للبحث فيه ، وهو جزء البحث في طريقة العرض. يحدد كل شيء يجب أن يكون قابلاً للبحث. يمكن تقسيم الفهرس القابل للبحث ، مثل طريقة العرض وكائن المصدر ، إلى فهارس فرعية منفصلة لتوفير عمليات بحث أكثر دقة واستهدافًا

تحتوي محركات البحث عادةً على بنية تركيبية داخليًا لمطابقة نتائج البحث الصالحة. هذه البنية هي المكون الثاني من الفهرس القابل للبحث.

من الناحية الإجرائية ، يمكن تنفيذ عملية الفهرسة بطرق مختلفة: يمكن الحصول على فهرس قابل للبحث عن طريق:

  • نسخ تمثيل قابل للبحث حرفيًا ؛
  • بنسخ تفاصيل العرض. قد يكون هذا جزءًا أو كل المشاهدات الموجودة فعليًا فقط كأجزاء ، موزعة وفقًا لقواعد إنشاء فهرس للبحث ، والذي سيتم جمعه عند الضرورة.
إدارة البحث
إدارة البحث

طلب قواعد التصميم والطلبات الرسمية

هندسة الاستعلام هي وظيفة تتوسط بين استعلام المستخدم والاستعلام الرسمي. يقوم بتحويل استعلام المستخدم ، ومطابقته مع قواميس أمر الاسترجاع ، ومواصفات الفهرس ، والفهرس قبل الاسترجاع. في فجر تطوير IPS ، تم إسناد هذا الدور تقليديًا إلى متخصصي تكنولوجيا المعلومات المؤهلين.

تطوير استعلامات الكمبيوتر التي يمكن أن تطابق استعلامات القاموس في نظام فهرس قابل للبحث يشار إليه عادة باسم وحدة "إدخال القاموس".أتمتة هذه الوظيفة واعدة وتوفر فرصًا لطرق البحث الخبيرة والاحتمالية.

يصبح الطلب الرسمي طلبًا رسميًا بعد تحويل طلب المستخدم. ومن الأمثلة على هذه التحولات الشكلية الاقتطاع والاستبدال والتطبيع والتوجيه والتحويلات الأخرى للتمثيل "الخارجي" إلى التمثيلات "الداخلية" للكمبيوتر IPS (فك التشفير - نظام استرجاع المعلومات).

مجموعات ارتباط المستند المستخرج

المجموعة الناتجة من مصادر المعلومات هي منطقياً مجموعة فرعية من طرق العرض التي تم إنشاؤها بواسطة قواعد المطابقة المطبقة على الاستعلام الرسمي بواسطة فهرس قابل للبحث.

عادة ، ولكن ليس بالضرورة ، هناك عملية فرز منفصلة لمجموعة المعلومات المستردة. عادةً ما تعيد كتالوجات المكتبات عبر الإنترنت ترتيب المجموعات المستلمة أبجديًا بواسطة المؤلف قبل عرضها. في أنظمة استرجاع المعلومات التي تنتج تصنيفات صارمة ، يسبق ترتيب الترتيب أي إعادة ترتيب.

تحليل البيانات
تحليل البيانات

إخراج تدفقات

يتم إخراج نتائج البحث بشكل تقليدي على الشاشة ، وفي كثير من الأحيان في شكل دفق من الكائنات لاستخدامها في مكان آخر أو لغرض آخر ، يكمل حلقة البحث الرئيسية. يمكن إرسال مثل هذه التدفقات إلى أجهزة التصور ، التخزين لمزيد من المعالجة ، أو استخدامها كتدفقات الإدخال إلى خدمات التحديد الأخرى.

تسمح أنظمة استرجاع المعلومات بالتغذية الراجعة منناتج أي عملية اختيار. يمكن أن يكون ناتج أي عملية تغذية مرتدة لعمليات أخرى. يمكن أن توفر الملاحظات الأساس لتقدير الخبراء في أي مرحلة.

موصى به: