שני, 07 מרס 2011 00:00

ניסוחי שאילתות במערכות לאיחזור מידע לצרכים אקדמיים- שלי חן-ארידור

מזה כעשר שנים, אני עובדת כספרנית יעץ במחלקת היעץ של אוניברסיטת חיפה. לאחרונהdsc 0015 סיימתי עבודת מחקר שערכתי בנושא: ניסוחי שאילתות במערכות לאיחזור מידע לצרכים אקדמיים בהדרכתה של פרופסור יהודית בר-אילן מהמחלקה ללימודי מידע של אוניברסיטת בר-אילן, במסגרת לימודים לתואר שני.

מטבע הדברים, המחקר עסק בנושא הקרוב לליבי ובדק חיפושי מידע לצרכים אקדמיים בקרב סטודנטים לתארים מתקדמים.
חיפוש מידע הוא תהליך מורכב למרות היותו חלק משגרת היומיום. המחקרים מראים שחיפוש מוצלח תלוי במספר מרכיבים, ביניהם:
מבנה המידע (כגון: טקסט מלא, thin metadata, thick metadata), מערכת חיפוש המידע ומחפש המידע (המשתמש).

עבודות מחקר קודמות הצביעו על הצלחה מוגבלת של חפוש מידע (על-פי הגדרות שונות) בתחומים שונים הן בווב, והן במאגרי מידע ביבליוגרפיים ובקטלוגים של ספריות. בהתאמה, מחקרים רבים בתחום חיפושי המידע מציעים שיטות וטכניקות לשפור מערכות חיפוש המידע הן באופן ביצוע החיפוש על ידי המערכת (למשל, אלגוריתמים או אפשרויות חיפוש מתקדמות וייחודיות) והן ברמת עיצוב מנשק המשתמש (למשל גישה ברורה ונוחה לאינדקסים).

יש להניח כי מערכות חיפוש המידע ימשיכו להשתכלל ולאפשר חיפושים יעילים בעתיד ואף חיפושים המתבססים על משמעות מונחי החיפוש ועל הקשרים אסוציאטיביים. אך ככל הנראה, בטווח הנראה לעין, המשתמש ימשיך להיות גורם מרכזי בתהליך חיפושי המידע באמצעות מערכות אלו. רק הוא יהיה מסוגל להגדיר את צורכי המידע שלו ולהעריך את התוצאות (רלוונטיות, סמכות, כיסוי וכו').

שימוש מושכל במערכות המידע (כגון: ניסוח נכון של צורך המידע, בהתאמה למערכת איחזור המידע, שימוש באופציות חיפוש ייחודיות ואו מתקדמות, שימוש בטקטיקות חיפוש יעילות) יכול להביא לשיפור מימדי הצלחה של תהליך החיפוש (כגון: רלוונטיות התוצאות, הזמן המוקדש לחיפוש). לכן ישנה חשיבות רבה למחקרים הבודקים את מרכיב המשתמש בתהליך חיפוש המידע בכלל ובהצלחת החיפושים מהיבט המשתמש בפרט.

עבודת מחקר זו שייכת לקבוצת המחקרים בתחום התנהגות חיפוש המידע, העוסקת בניתוח שאילתות החיפוש ורלוונטיות התוצאות, מנקודת מבטו של המשתמש.

מחקר זה בדק ניסוחי שאילתות בשלוש מערכות לאיחזור מידע בסביבה אקדמית, עבור אותו נושא על ידי אותו משתמש. למחקר זה נבחרה השיטה האיכותנית המאפשרת לבחון, לנתח ולגלות את הקשר בין כוונת המחפש, נושא המחקר, שאילתות החיפוש ותוצאותיו.
המאגרים עבורם נערך המחקר היו: קטלוג הספריה של אוניברסיטת בר-אילן, גוגל-סקולר ומאגרי פרוקווסט.

השוואה זו איפשרה להעריך את השפעת המנשק ואפשרויות החיפוש הייחודיות של כל מאגר על הצלחת החיפוש.
נערכו השוואות תוך נבדקיות ובין נבדקיות של השאילתות ובחינת האבולוציה שהן עוברות במערכות השונות במטרה למצוא תבניות חיפוש אצל המרואיינים, אסטרטגיות חיפוש המקדמות את החיפוש ושיטות חיפוש המעכבות את התקדמות החיפוש או אפילו תבניות חיפוש שגויות ולאפיין את התייחסות המשתמשים למאגרים השונים, מהיבט ניסוח השאילתות.

במסגרת המחקר, נבחנו השאלות הבאות: האם יש מאפיינים ייחודיים לשאילתות שנכשלו; מהי האבולוציה ששאילתות עוברות במהלך החיפוש; האם יש הבדלים בהתייחסות המשתמשים למאגרים השונים.

בהתייחס לשאלת המחקר הראשונה, נמצאו מספר גורמים לשאילתות שנכשלו:
שליטה לא מספקת באנגלית.
קשיים בניווט עד למציאת הטקסט המלא של פריטי המידע המבוקשים.
חוסר מיומנות בשימוש בפונקציות חיפוש יחודיות של מנשקים.
קושי בתרגום נושא המחקר ושאלת המחקר למונחי חיפוש מתאימים וקושי במציאת מונחים נרדפים, צרים, רחבים, המבטאים את ההיבטים הנושאיים השונים של שאלת המחקר.
היעדר אסטרטגיית חיפוש שיטתית (למשל חזרה על שאילתות, אי-שימוש במטאדטה). ביצוע חיפושים ללא תכנון מראש, מבלי ללמוד מתוצאות החיפושים (השאילתות) הקודמים.

לשאלה האם ישנה תבנית ברורה של התפתחות שאילתות במהלך חיפוש, ממצאי המחקר לא הניבו תבניות ברורות. נהפוך הוא, בנוסף לבעיות טכניות (כגון: שפה, הבנת המנשקים) אובחן בבירור היעדר אסטרטגית חיפוש שיטתית, היעדר שימוש במשוב משאילתות קודמות המבוססת על תוצאות. בנוסף, התופעה אינה ייחודית למאגר מידע ספציפי.

בהשוואת התייחסות המשתמשים למאגרים השונים, נמצאו ההבדלים הבאים:
שביעות הרצון מתוצאות החיפוש במאגרים: שביעות הרצון בקטלוג היתה נמוכה לעומת שאר המאגרים.
זמן: השקעת הזמן בקטלוג היא קטנה בהשוואה לזמן שהושקע בחיפושים בגוגל-סקולר ובמאגרי פרוקווסט. קשה לקבוע אם השקעת הזמן הקצרה היא אחת הסיבות לחוסר שביעות הרצון מהתוצאות או ההיפך.
שפת החיפוש: הסטודנטים נטו לערוך חיפושים בעברית (שפת אם) במאגרים בעלי מנשק בעברית. למרות נוחות החיפוש בשפת-האם, במרבית המקרים, חיפושים אלו היו פחות מוצלחים.

שאילתות ואסטרטגיות חיפוש:
לביצוע שאילתות חיפוש בקטלוג יש מאפיינים המבחינים מאגר זה מהשניים האחרים: 1. שימוש במטאדטה בשאילתות הראשונות. 2. חיפוש היבט נושאי אחד בשאילתה הראשונה. 3. אחוזי הצלחת שאילתות הנמוכים פי שלושה מגוגל-סקולר.

ממצאי המחקר לעיל מעידים על קיומם של מספר מכשולים בתהליך חיפוש. בהמשך, המחקר מעלה רעיונות ודרכי פעולה לייעול תהליך החפוש.

תכלית שיפור חיפושי המידע היא לאפשר למשתמש לערוך חיפושי מידע באופן עצמאי ומקצועי כך שיתקבלו פריטי מידע רלוונטיים, איכותיים, ממוקדים לנושא החיפוש שלהם וכל זאת בפרק זמן הקצר האפשרי ובאחוזים גבוהים של שאילתות מוצלחות.

במאמרם מ- 1988 כתבו סרצביץ וקנטור (Saracevic & Kantor, 1988) כי חיפוש מידע רחוק מלהיות מדע, הוא בגדר אוֹמנות מאוד לא מדוייקת. כיום הצטברו עדויות אמפיריות המראות כי חיפוש מידע הוא תחום מקצועי המתבסס על ידע ייחודי, התמחות ואף הכרה אקדמית בבסיס ידע. את מקצוע חיפוש המידע או את אוּמנות חיפוש המידע (כפי שהיא נעשית על ידי בעלי המקצוע), גם אם מהווה תהליך מורכב, יש להנחיל לכלל.