פרק 15. עיין ערך בוט: מויקיפדיה לויקידאטה עם שני אבנשטיין סיגלוב

להאזנה לפרק לחצו פליי כאן, יש לגלול מטה על מנת לקרוא את התמלול

בינה מלאכותית ורשתות נוירונים, אנחנו היום מאמנים אותם על בסיס הנתונים שנמצאים בתוך ויקידאטה. זה רגע מאד מרגש של רתימת הטכנולוגיה עבור הציבור הרחב, עבור האנושות

שני אבנשטיין סיגלוב

אנחנו כבר בשנת 2021 ובשבוע הבא ויקיפדיה חוגגת 20 שנה להיווסדה. מדובר במיזם שמימש כנגד כל הסיכויים את החזון האוטופי של האינטרנט כנחלת הכלל, ובפרק הזה ננסה לברר את סוד ההצלחה שלו: איך האידאליזם של תוכן חופשי שורד, ואפילו משגשג, בעידן הפלטפורמות המבוססות על קפיטליזם המעקב? נכיר גם את ויקידאטה, מאגר הביג דאטה מבית ויקיפדיה שממדל את עולמנו, לוקח אותנו לדור הבא של הרשת – ווב 3.0 והרשת הסמנטית – ומבוסס על שיתוף פעולה ייחודי בין חכמת ההמונים לבינות מלאכותיות. לשם כך, אני מארחת היום את שני אבנשטיין סיגלוב, פעילת תוכן חופשי ותיקה, חוקרת טכנולוגיה, חינוך וידע חופשי באוניברסיטת תל אביב, והישראלית הראשונה והיחידה שמכהנת כדירקטורית בחבר הנאמנים של קרן ויקימדיה העולמית

כולם מכירים את ויקיפדיה. אבל כמה אתם באמת מכירים את ויקיפדיה? הנה עשר עובדות שאולי לא ידעתם על ויקיפדיה ואולי אפילו יפתיעו אתכם מאד

ראשית, צריך לדעת שויקיפדיה היום היא אחד מהעשרת האתרים הגדולים בעולם עם מעל 15 מיליארד צפיות בחודש, ובערך 6000 צפיות כל שניה. והיא הראשונה הלא מסחרית ברשימה הזו, אחרי אתרים כמו גוגל, כמו יוטיוב, כמו אמזון וכו’. בוויקיפדיה אנחנו שואפים לניטרליות, זה אחד מחמשת עמודי התווך של הכתיבה בוויקיפדיה, אבל לא כולם יודעים שיש הטיה מובנית וחמורה, שאנחנו יודעים עליה. ראשית, יש לנו אתגר מגדרי. יש לנו נכון להיום רוב גברי לבן שכותב את ויקיפדיה, משפיע בעצם על מה נכתב, מה נשאר, מה מכוסה. ופערי ידע עצומים, לא רק מגדרית, אלא בכל מה שקשור לעולם המתפתח, אז יש בכלל פערי ידע

דבר שני זה שיש לנו אתגר מקורות מאד רציני. ההיסטוריה החברתית שלנו היא פטריארכלית, נשים הרבה פעמים הודרו ולא כתבו עליהן גם כשהייתה חשיבות אנציקלופדית, ולכן יש לנו בעיה רצינית של על מה אנחנו מבססים את המידע. בין אם יודעים או לא, אנחנו משתדלים מאד שכל מה שאנחנו כותבים בויקיפדיה יהיה מבוסס ושניתן יהיה לאמת אותו. ערך טוב הוא ערך שיש בו מקור כמעט לכל משפט שכתוב. אז היכולת הזו לאמת, אם אין לנו מקורות, זה ממשיך את הגלגל הזה של הטיה מגדרית וזה אחד האתגרים שיש לנו. שלא נדבר על חברות שבאופן מסורתי לא תיעדו בכתב

עוד חשוב להגיד שיש מקומות בעולם שבהם יש שלטון טוטליטרי וחוסמים את ויקיפדיה לציבור ואנחנו עדיין מנסים להנגיש מידע גם בשפות האלו. אחד מהם למשל זה סין, ועד לא מזמן טורקיה, שסגרה את הגישה לויקיפדיה והצלחנו לפתוח מחדש את הגישה. וכמו שאמרת, כולם מכירים את ויקיפדיה, אבל בעצם הרבה יותר נכון לדבר על תנועת ויקימדיה, שיש לה שלושה רכיבים עיקריים: הראשון זה ויקיפדיה וכל מיזמי האחות שלה. יש עוד מיזמים כמו ויקי-קומונס, שהוא מאגר המדיה שלנו, יש בו מעל 50 מיליון פריטים חופשיים לציבור, וויקידאטה, שעוד נדבר עליו בהמשך, שהוא מאגר של נתונים, ביג דאטה, מה שנקרא, אבל להמונים

הרכיב השני של התנועה זו קרן ויקימדיה העולמית. זו קרן ללא מטרות רווח שמנהלת את הפעילות של המיזמים, ומחזיקה את השרתים של ויקיפדיה למשל, עושה את גיוס הכספים, שבדירקטוריון שלה אני נמצאת. והחלק השלישי של התנועה הוא כל השלוחות, בערך 150 סניפים מקומיים או תמטיים, שתומכים בפעילות המיזמים האלה. וכל שלושת אלו ביחד הם מה שנקרא תנועת ויקימדיה. יש לנו בערך 1.5 מיליארד כניסות ממכשירים יחודיים לכלל מיזמי ויקימדיה בכל חודש, ואת זה מאפשרים בערך 250,000 עורכות ועורכים שתורמים בהתנדבות. כמעט הכול קורה בהתנדבות, כמו שהזכרנו, וממומן לחלוטין על ידי הציבור וגם מנוהל על ידו

עשר עובדות שאולי לא ידעתן על ויקיפדיה ואולי אפילו יפתיעו אתכן מאד, אנחנו במספר שמונה

דמיינו לעצמכם עולם שבו לכל אדם יש גישה לכלל הידע האנושי, בשפה שלו או שלה. זה החזון שלנו, זו ההתחייבות שלנו וזה מה שאנחנו עושים, ואני מוסיפה – בעולם המקוון והלא מקוון. אני אתחיל בזה שחצי מהעולם לא מחובר לאינטרנט. זו נקודה מאד משמעותית כי אחד הדברים שמעסיקים אותנו, אם אנחנו רוצים להנגיש את כלל הידע האנושי לכל אדם בשפה שלו, זה איך אנחנו מגיעים לחצי מהעולם הזה שלא מחובר, ואיך אנחנו קודם כל מתעדים את הידע האנושי והתרבותי שלו ומביאים גם ידע אליהם. לכן אנחנו עובדים על כל מני יוזמות, בין היתר על “ויקיפדיה אופליין” ועל דברים כמו “אינטרנט בקופסא“, שזו קופסא קטנה שמכילה למשל את כל המידע הרפואי של ויקיפדיה, הופכת להיות הוטספוט ל30 אנשים ומאפשרת להם להתחבר למידע הרפואי בויקיפדיה. דמייני לעצמך, אנחנו שולחים את זה לכל מני מקומות שבהם יש אסונות טבע, מלחמות, או שפשוט אין תשתיות אינטרנט, והידע הזה יכול להציל חיים

עוד נקודה מעניינת, מעל עשור אנחנו משתפים פעולה עם מוסדות חינוך, אקדמיה, עם מוסדות תרבות, מה שאנחנו קוראים לו גלא״ם, ראשי תיבות (באנגלית) של גלריות, ספריות, ארכיבים ומוזיאונים, ועם מוסדות ממשל. בעצם כל המוסדות האלו שבעבר היו אוצרים מידע אצלם, ושיתופי הפעולה האלו עוזרים להנגיש מידע שהיה אצור בתוך המוסדות האלו ואנחנו עוסקים בהנגשה הזו יחד איתם, עוזרים להביא את המומחים לתוך ויקיפדיה, ועוסקים גם בלובינג, בשינוי חקיקה כדי לעזור ולהנגיש עוד ועוד ידע לציבור. והייתי אומרת שלטכנולוגיה יש תפקיד מכריע  פה. אנחנו ממש מנסים לרתום אותה לטובת הכלל ומנסים שהיא תסייע לנו להתגבר על חלק מהאתגרים האלו שתיארתי

למשל, יש לנו בוטים שכבר היום מסייעים לנו לאתר השחתות של האתר, כל מני אנשים שנכנסים ומשנים או מוחקים או ממש משחיתים. או בוטים שעוזרים לנו לייצר תכנים באופן חצי אוטומטי, מוריד את הצורך הזה ממתנדבים לעשות את זה ועוזר להם להתמקד בדברים שמכונות עדיין לא יכולות לעשות. וכמובן יש לנו בינה מלאכותית שעוזרת לנו לדרג איכות של ערכים, עוזרת לנו לדרג איכות של עריכות, ואנחנו אפילו עובדים על בוטים שיעזרו לנו לאתר הטרדות ובריונות, שזה חלק ממאמץ יותר רחב שלנו להפוך למרחב יותר בטוח ומכיל וידידותי עבור המשתמשים והמשתמשות

מציאות שבה אין דין ואין דיין נשמעת לרובנו דבר נורא ואיום: אלימות, אנרכיה, כאוס. בספר לווייתן מהמאה ה17, תומאס הובס כתב שזה מצב הטבע שלנו, וככה זה נראה כשכל אדם פועל לפי האינטרס האישי שלו. אבל מה אם הנחת טבע האדם של הובס לא מדויקת? פרופ’ למשפטים בן זמננו, יוחאי בנקלר מאוניברסיטת הרווארד, חושב שהאדם הוא דווקא יותר כמו הפינגווין, חיה חברתית שתמיד תעדיף שיתוף פעולה על פני אנוכיות. ולא סתם הפינגווין הוא סמלה של מערכת ההפעלה המצליחה לינוקס, שמבוססת על קוד פתוח. פרויקט ויקיפדיה הוא אחת הדוגמאות המרכזיות של בנקלר לטענה שאנחנו טובים יותר ממה שחשבנו. אפשר לראות בקרן ויקימדיה דוגמא לסוג חדש של ארגון – גלובלי, ציבורי, ללא מטרת רווח, ארגון מהסוג שדרוש לנו על מנת להתמודד עם אתגרי העתיד. אז מהו סוד ההצלחה של ארגון כזה? איך הוא שורד לצד, ובסדר הגודל, של כרישים כמו גוגל, פייסבוק, אמאזון ואפל

קודם כל אגיד שהמצב אצלנו לא מושלם וזה חשוב להבין, אנחנו זה כמו אסימפטוטה שתמיד שואפת לאיזה מקום שהיא בחיים לא תגיע אליו, אבל אנחנו שואפים, אנחנו בדרך הזאת וסימנו את זה בתור עקרון יסוד, ואנחנו ממשיכים ונמשיך לחתור למקום הזה. את רוצה את מתכון הקסם, ואין ספק שאנחנו יצור יוצא דופן, בטח בנוף ההייטק. הקרן יושבת בסן פרנסיסקו, אז כשחושבים על עמק הסיליקון, אין ספק שאנחנו יוצאי דופן בנוף הזה. לשאלתך, אני לא חושבת שיש מתכון אחד ברור להצלחה. זה סוג של קסם שקרה, הצטרפות של כל מני גורמים שגרמו לזה לעבוד ברגע מסוים בזמן, וזה כמובן למרות כל התחזיות השליליות וכל המצקצקים שאמרו שאין סיכוי שויקיפדיה תחזיק מעמד. אני יכולה לדבר על כמה עקרונות שאני חושבת שהם עקרונות-על שאפשרו לנו להישאר נקיים יחסית

הראשון בהם זה שקיפות, שקיפות, שקיפות ועוד פעם שקיפות. שקיפות היא כל כך קריטית לא רק כי היא מאפשרת לנו לראות באמת מה קורה, אלא כי היא באמת מובילה לאחריות ארגונית, לנטילת אחריות. זה עקרון יסוד שבלעדיו, בעיני, לא היינו יכולים להיות איפה שאנחנו היום. הדבר השני שמאד מייחד אותנו ומאד משמעותי, זה העיקרון הזה של ריבוי הקולות, המאבק האמיתי הזה ובאמת העיקש והלא פשוט למגוון אנושי. במיוחד שבו העולם המערבי, וספציפית הקרן יושבת בארה”ב אז נורא קל להיגרר לשיח שמאד מבוסס על ארה”ב, אז לאנשים כמוני במיוחד יש תפקיד חשוב בלתת את ריבוי הקולות האלו בחבר הנאמנים ובכלל. וההתעקשות הזו שלנו לכלול את כולם, לא להגיד “טוב זה מה שיש, זה מי שבא”. זה אגב קולות שאפשר למצוא גם אצלנו בקהילה, יש כאלה שאומרים “כל אחד מוזמן ואם הם לא מחזיקים מעמד אז שלא יבואו”. כמה נוח, נכון? וכמו כל תנועה גדולה בהיסטוריה, יש בה הרבה פעמים קולות שהם מנוגדים זה לזה, וזה בסדר, אנחנו רוצים את ריבוי הקולות הזה

הדבר השלישי שעוזר לנו בכל התהליך הזה, זה העובדה שויקיפדיה היא סוג של מריטוקרטיה (וכשאני אומרת ויקיפדיה אני מתייחסת לכלל המיזמים). מריטוקרטיה, היינו, מי שנמצא שם מצביע ומשפיע. אז בעצם כל אחד יכול להצליח להתקדם. כל מי שיעבוד קשה ויעשה את זה לפי ההנחיות של המיזמים, ויש הרבה הנחיות שצריך להכיר. אבל כל עוד עובדים לפי החוקים, לא חשוב הטייטל, לא חשוב המראה, לא חשובה הדרגה האקדמית, לא חשוב הרקע הסוציו-אקונומי. כל הדברים האלה נעלמים כשאתה הופך להיות ישות וירטואלית שפועלת ברשת. וכל עוד עושים את זה נכון ועובדים לפי הכללים ומתמידים, אפשר להצליח ואפשר להתקדם

אז הזכרנו כבר, הנה, אני האישה הישראלית הראשונה שנבחרה לדירקטוריון של הקרן, אמנם ממדינה מיניאטורית על הגלובוס ומשפה מאד קטנה, אבל הנה אני שם. אני חושבת שזו דוגמא טובה לאיך אנשים מכל מני מקומות שהם פחות מיוצגים, יש להם מקום, והקרן וגם הבורד וגם התנועה בכלל, מחפשת את הקולות האלה. הדבר האחרון, הייתי אומרת, שנותן לנו את הכוח לעשות את מה שאנחנו עושים זה קנה המידה שבו אנחנו עובדים. העובדה שאנחנו גלובליים, העובדה שאני בלחיצת כפתור יכולה להגיע לאנשים כמעט מכל מדינה, יש לי רשת של ויקיפדים שאני יכולה להיעזר בה בכל העולם – נותנת לנו עוצמה, נותנת לנו כוח, ונותנת לנו אפשרות לעבוד באופן יחסית מתואם, להוביל את אותה אג’נדה

בעידן קפיטליזם-המעקב שבו מידע הוא הנפט החדש, האם מי ששולחים לכל דורש חביות נפט בחינם הם פראיירים נאיבים או גיבורים מתוחכמים

תנועת ויקימדיה זה סוג של מהפכה שקרתה. אני רואה אותה כמהפכה של הדור שלנו, את כל מהפכת המידע, ובכלל הנגשת ידע כסוג של אקט פוליטי, חברתי, חינוכי, מרדני, וכמובן אידיאולוגי. האנשים שעושים את זה בהתנדבות, באים מקשת מאוד רחבה של האוכלוסייה, של דעות ונקודות מבט, אבל יש להם דבר אחד משותף: רובם ככולם מאמינים אמונה עמוקה שמידע חייב להיות וצריך להיות חופשי ונגיש לכל. יש מתח תמידי בין אלה שמבקשים תמיד להסתיר מידע, לנכס אותו, לאצור אותו, לסגור אותו, לבין אלה שכמונו רוצים להנגיש אותו, לפתוח אותו ולשתף אותו. וחשוב להגיד מהבחינה הזו שויקימדיה היא לא היחידה, היא חלק (אמנם חשוב ומשמעותי, אבל עדיין חלק) מתנועה, שהתחילה אגב עם קוד פתוח, אז תמיד היה לנו קשר עמוק כזה לטכנולוגיה. והיום אנחנו דוגלים בחינוך פתוח, מדע פתוח ונתונים פתוחים

זה משהו שמוביל אותנו גם כשאנחנו מגייסים כסף. ואגב, גוגל ופייסבוק ואמאזון וכל הגדולים האלה תורמים כמובן לויקיפדיה, בין היתר כי הם משתמשים בה הרבה, אז למה לא? אבל חלק ממה שאנחנו עושים בקרן זה, למשל, לוודא שכשאנחנו מקבלים תרומה אין לה תנאים ומחויבויות נוספות, שיכולים לגרום בצורה כזו או אחרת להשפיע על התוכן, שתמיד מי שמוביל אותו, אגב, זה לא הקרן ולא השלוחות, זה המתנדבים שמחזיקים את המיזם. אז חד משמעית כן, ההישארות שלנו ציבורים ופתוחים וניטרליים ושקופים, היא מה שעוזרת לנו להישאר נקיים בין היתר

אבל כדי להבין מה גוגל ואמאזון למשל מרוויחות מויקיפדיה, אנחנו צריכים להכיר את האחות החדשה והסקסית שלה, ויקידאטה, שמצעידה את ויקיפדיה ואת כולנו אל העידן הפוסט אנושי ברשת. אז מה זה בדיוק ויקידאטה ולמה צריך את זה

ויקידאטה, או בשמו העברי ויקי-נתונים, זה מאגר בינלאומי, רב לשוני, כלומר ממש יש בו ריבוי שפות של נתונים מובנים ומקושרים. זה קצת כמו ביג-דאטה אבל פתוח, וחשוב להגיד שזה חלק מהחזון של טים ברנרס-לי, שכבר ב-94 מתאר את מה שהוא קורא לו ״הרשת הסמנטית״. יש לזה עוד שמות כמו ווב 3.0, או דאטה מובנה ומקושר, דאטה פתוח מקושר, אבל כולם מדברים על אותו הדבר: אם בווב 2.0 היו לנו אתרים שיכולנו פתאום לתרום להם, לשתף מידע, לא רק להיות צרכנים, לא רק לקרוא תוכן, אלא ממש לייצר אותו בעצמנו ולשתף; טים ברנרס-לי מדבר על משהו חדש שקורה, על עוד סוג של אבולוציה של הרשת. הדרך הכי קלה שאני מכירה לדמיין מה זה, זה בעצם לדמיין שמעל הרשת כמו שאנחנו מכירים אותה, יש עוד סוג של שכבה, שכבה של נתונים. ולא סתם נתונים, אלא נתונים שבנויים בצורה כזו שאנחנו יכולים לגשת אליהם, לתשאל אותם, ולקבל תשובות מדויקות. והשוס הגדול: לא רק שזה קורה ואנשים יכולים לעשות את זה, אלא גם מכונות יכולות לעשות את זה. כלומר, להבנות את המידע בצורה כזו שהוא יהיה נגיש גם לבני אנוש וגם למכונות

דוגמה טובה לזה ולהבדל בין ווב 2.0 לווב 3.0 היא באמת מה שהוביל לצורך הזה לפתוח את המיזם. זה היה רצון לענות על שאלה מאד פשוטה: תני לי עכשיו רשימה, של עשר ראשות העיר בערים הכי גדולות בעולם, מסודרות לפי סדר גודל העיר. נשמע נורא פשוט, נכון? אבל אם היינו מחפשות את זה בגוגל היינו מקבלים עשרות אלפי תוצאות שמזכירות את המילים האלה, אבל לא היינו מקבלים רשימה אחת ספציפית עם מה שאנחנו מחפשות. אז בעצם ויקידאטה זו אחת הדרכים של האנושות להצליח להשתלט על הררי המידע האלה שקיימים בחוץ. אנחנו חיים בעולם של היצף מידע ומה שויקידאטה עוזר לנו לעשות, זה להשתמש במידע הזה לטובתנו, להצליח להגיע למה שאנחנו רוצים בזמן אמת. זה מה שדאטה מובנה ומקושר עושה. למשל, לא מזמן נפטרה השופטת האגדית רות ביידר גינסבורג, וכשהיא נפטרה פתאום נאלצנו לתקן את שנת המוות שלה בתוך ויקיפדיה, כמו שקורה כשכל סלבריטי נפטר. רק שהיום זה כבר לא צריך לקרות ב300 שפות שונות ע”י 300 מתנדבים שונים בצורה כזו מבוזרת, אלא אנחנו נעדכן את זה פעם אחת במאגר המרכזי הזה של ויקידאטה, ומה שנקרא “אוטומאג’יקלי” זה יעודכן בשפות באופן אוטומטי

ויקידאטה היא הדור הבא של הרשת שמבוססת על שיתוף פעולה בין חכמת ההמונים לבינות מלאכותיות, ואפשר לחשוב עליה כעל תרגום של ויקיפדיה ומידול של העולם לשפת מכונות, על מנת שהמכונות יאפשרו לנו צורות חדשות של ידע ולמידה

למשל דמייני לך עכשיו שאנחנו רוצות לדעת מי כל הנשים הפיזיקאיות שהיו בהיסטוריה ושקיימות בעולם. עכשיו בעזרת ויקידאטה לא רק שנוכל לקבל את התשובה לזה, אלא נוכל פתאום להציג את זה על ציר זמן או על מפה, והוויזואליזציה של המידע היא קריטית, כיוון שהיא עוזרת לנו לספר את הסיפור של הנתונים בצורות לגמרי חדשות ועוזרת לנו גם להבין דברים על הנתונים באופן מאד מעניין. למשל, כשאת רואה פתאום את הפיזיקאיות על מפה, את יכולה לראות פתאום שיש הרבה נשים, יחסית תראי הרבה נקודות מרוכזות באירופה וארה”ב והרבה פחות במקומות אחרים בעולם. זה עוזר לך להתחיל לחשוב: רגע, אז באמת לא היו נשים פיזיקאיות באוזבקיסטן? או שאולי הן לא נכנסו עדיין לויקיאטה, ואם באמת יש כאלה פערים מאיפה הם מגיעים? הוויזואליזציה עוזרת בלחיצת כפתור לראות לא רק מה שם, אלא גם מה לא שם, ופתאום לדבר על שלמות: עד כמה המידע הזה שלם, עד כמה המידע הזה מהימן, מה הוא מכיל או לא מכיל

זה עוזר לנו גם לגלות קשרים שאולי לא ידענו שהם שם. אחד הסיפורים החמודים שאני יכולה לספר על זה מגיע מהמטרופוליטן, שמשתף אתנו פעולה ויש לנו שם ויקיפד-בית, האמת כמה, שיושבים ועושים עבודה מדהימה עם האוצרים של המוזיאון כדי להנגיש את הידע. ואחד הדברים שהמט עשה חוץ מלתרום תמונות ברישיון חופשי של מיצגים שנמצאים במוזיאון שלו, זה לתרום את המטא-דאטה, את הפרטים על הפרטים. והנתונים הללו נכנסו בצורה מובנת לויקידאטה ופתאום בעזרת שאילתה קטנה, הצלחנו לחשוף פרטים שלא היו ידועים לאוצרים עצמם. דוגמא חמודה של זה, זה ציור מאד מפורסם שנמצא במט ונקרא הפורטרט של מאדאם איקס. ברגע שהזינו את הפרטים עליו והריצו שאילתה, חשפו קשר שגילה שהציור הזה נתן השראה ליצירה של שמלה, שנלבשה על ידי שחקנית הוליוודית מאד מפורסמת, ריטה הייוורת’, בסרט גילדה. הפרט הקטן הזה לא היה ידוע לאוצרים, ומי שמכיר אוצרים במוזיאון יודע שהם יודעים כל דבר ועוד קצת על הפריטים באוסף. אבל זה היופי כשיש לנו דאטה מקושר ומובנה – דברים מתקשרים לדברים באופן שלא צפינו, ואנחנו חושפים דברים שלא ידענו קודם

הדבר האחרון שאני רוצה להזכיר בהקשר הזה, זה היכולת שלנו לקבץ מידע שלא קובץ באף מקום קודם. דוגמא טובה לזה יכולה להיות המוזיאון בברזיל שנשרף. ב2018 התרבות הברזילאית חטפה מכה חזקה מאד, המוזיאון הלאומי שלהם נשרף, מעל 3 מיליון פריטים, מוזיאון מדהים. ולמרבה הצער, כיוון שזה עולם מתפתח וכיוון שאין שם תשתיות ואין לממשל כסף להשקיע בתרבות, לא היה גיבוי דיגיטלי, מיפוי דיגיטלי של הדברים האלה, ומה שכן היה נשרף בתוך הבניין של המוזיאון. מכה מטורפת לתרבות. אז מה שעשו ח’ברה מהקהילה הויקיפדית, הם עשו פרויקט מיקור-המונים מאד יפה. הם ביקשו מהציבור לשלוח תמונות, ובעזרת ויקידאטה הם עשו תהליך שאנחנו קוראים לו “ארכאולוגיה של דאטה”, לשחזר חדרים במוזיאון, להוסיף עליהם פריטים בכל מני שפות – זה משהו שבחיים לא היה מתאפשר לפני שהיה לנו את ויקידאטה בכזו קלות

כמובן זה לא רק במוזיאונים, זה כמעט בכל תחום אקדמי שתחשבי עליו, כמעט בכל דיסציפלינה, הרבה מחקר אקדמי שנעשה ואין מי שימשיך לתחזק שרתים או מאגרי מידע שנוצרו בתוך האקדמיה, פתאום כשמעבירים את הנתונים האלה לויקידאטה אפשר לא רק לתת להם חיים חדשים, אלא גם לגרום למידע חדש להמשיך להיאסף על הדברים האלה, שהולך מעבר למה שעשו במחקר האקדמי. דוגמא מהממת של זה הוא פרויקט ציד המכשפות של אוניברסיטת אדינבורו. היה מאגר כזה באיכות מאד גבוהה, הם אספו פרטים על ציד המכשפות בסקוטלנד במאות ה16 וה17. המאגר הזה לא היה כסף להחזיק אותו, הוא עמד פשוט להיעלם, ואז בפרויקט יפה של ויקידאטה הם הזינו את כל הנתונים לויקידאטה, והיום יש אתר מקסים שאפשר לנווט בו ולראות, הוא כל כך אינטראקטיבי וכל כך כיף, אז הוא ממש עזר להנגיש את ההיסטוריה, את התרבות המקומית, וכל זה קרה כי פתחנו את הנתונים, כי שמנו אותם במקום מרכזי שזמין לכולם וכל אחד פתאום יכול היה להוסיף

נתתי הרבה דוגמאות מעולם האמנות אבל גם בתחום הגנטיקה, יש לנו מכון מחקר מאד ידוע בקיימברידג’ שעוסק בגנטיקה, ובאיזשהו שלב, עד כמה הזוי שזה נשמע, קיימברידג’ וזה, לא היה להם משאבים, מימון להמשיך לתחזק את המאגר הגנטי שהם החזיקו והוא כמעט הלך פייפן. מזל שעובד שם איזה ויקיפד שהזין את כל הנתונים לויקידאטה ובעצם היום המאגר שלהם מתוחזק באופן פתוח בתוך ויקידאטה, והחברה עצמה, בעצם מה שמוצג שם, נמשך מתוך ויקידאטה, כלומר שואבים את הנתונים בלייב מתוך ויקידאטה. כבר לא מחזיקים מאגר פנימי נפרד אלא מתחזקים אותו באופן פתוח ושקוף, וכך גם כל שאר העולם האקדמי יכול לתרום ולעבות את הנתונים

היום לויקיפדיה ובכלל לויקידאטה יש תפקיד קריטי בלהצליח להציג לציבור מידע אמין. יש כל כך הרבה פייק ניוז סביב הקורונה והקהילה שלנו מצליחה לעשות סוג של אוצרות מידע שהוא כמעט חסר תקדים. קשה מאד להילחם, תחשבי כמה מקורות של מידע שקרי, כמה ניסיונות לתת מידע שקרי סביב הקורונה קיימים ברשת, בכמה שפות. והקהילה שלנו בגלל שהיא רב לשונית ובגלל שהיא גלובלית ובגלל שהיא כל כך הולכת על הסיפור הזה של מקורות מהימנים ולהביא רפרנס לכל דבר, מצליחה לאצור את המידע על הקורונה עבור הציבור, ובאמת בתקופת הקורונה קיבלנו הרבה מאד טפיחות על השכם, שאנחנו סוג של אור בעולם דיגיטלי די חשוך

ויקידאטה הוא קריטי כי הוא עוזר לנו למשל להציג טבלאות, שאגב גם בחיפוש בגוגל רואים אותן בצד. גוגל מציג בצד כל מני דברים וחלק מהנתונים שאתם רואים שם מגיעים מויקידאטה באופן אוטומטי עבור הציבור, ונאספים ומוצגים בטבלאות שמעודכנות באופן אוטומטי. ויקיפדים מעדכנים נתון אבל פתאום אנחנו יכולים לראות טבלאות שמתעדכנות ברגע אחד בלחיצת כפתור בכל העולם, שמראות למשל את כמות המקרים על פי ארצות. יש טבלה מאד יפה כזו שרואים את הדגלים, המדינות השונות, המקרים, מקרי המוות וכמה מקורות יש לכל דבר. ומהבחינה הזו ויקידאטה ממש משנה את יחסי הגומלין בין האדם לבין הידע ומאפשרת ללמידה מסוג חדש לקרות, למידה שלא הייתה אפשרית לפני זה. זה נותר המאגר הסמנטי הגדול ביותר שהאנושות יצרה, שמתחיל לממש הלכה למעשה את החזון של טים ברנרס לי, וזה גם משהו שאני עוסקת בו בדוקטורט שלי

העניין עם הרבה פרויקט ווב 3.0 של שת”פ אדם-מכונה, הוא שהם מותאמים קצת יותר למכונות מאשר למשתמש הקצה הסביר. גם השימוש בויקידאטה נגיש יותר כרגע לבוט הממוצע מאשר לאדם הפשוט, אבל בקרן ויקימדיה חושבים על דרכים להפוך אותה לפשוטה ושימושית לא פחות מויקיפדיה

המפגש הזה בין האדם הפשוט המשתמש ברשת לבין ויקידאטה, עדיין רחוק מלהיות נוח. אז היום כדי לשאול שאילתות באמת ולכתוב אותן בעצמנו, אנחנו עדיין צריכים לדעת ספרקל (שפת תכנות), זה לא טריוויאלי למרבית האנשים אבל זה גם לא נורא מסובך. אני בעצמי אינני תכנתת ואני למדתי את זה ואני מלמדת את זה היום באוניברסיטה את הסטודנטיות והסטודנטים שלי, אז זה לא בשמיים, אפשר ללמוד את זה. אנחנו באמת בתחילת הדרך, אנחנו בהתחלה של להבין את הפוטנציאל של הדבר הזה, לפתח אפליקציות שמשתמשות בויקידאטה. כמו למשל היסטורפידיה, שהיא אפליקציה שפיתחו על ויקידאטה שמאפשרת ליצור צירי זמן נורא ויזואליים ויפים, שנורא כיף לשוטט בהם וללמוד דרכם. שם קל לעבוד, שם את נכנסת למשל ועושה חיפוש פשוט, למשל, של אמנים איטלקיים, ואת מקבלת ציר זמן יפיפה שמופק לך באופן אוטומטי מאחורי הקלעים

אבל בינתיים לפחות כן אפשר באמצעים קלים יחסית לתרום, והרבה פעמים באמצעים של משחקיות, תוך כדי משחק. את נכנסת למשחק שבו את רואה למשל תמונה, את לא יודעת מאיפה היא מגיעה אבל היא מגיעה ממוזיאון המטרופוליטן שמשתף איתנו פעולה ותרם לנו הרבה תמונות. ובמשחק הזה, המבוסס על בינה מלאכותית, שואלים אותך: תגידי, האם את רואה סוס? את צריכה לבחור רק בחירה פשוטה וקטנה של כן או לא. יש לך גם אפשרות לדלג אם את לא בטוחה אם זה סוס או לא. ברגע שלחצת “כן”, מאחורי הקלעים נוצרת עריכה בשמך שאומרת שיש סוס בתמונה הזו. הנתון הקטן הזה עוזר למפות עכשיו את התמונה בצורה טובה ויותר, ותעזור לנו בשלבים מאוחרים יותר לשאול שאלות על כל התמונות. למשל: תני לי עכשיו את כל התמונות שיש בהן סוס שחור וצוירו בין שנים מאד ספציפיות בפראג. ברגע שהציבור יעזור לנו בכל מני תרומות קטנות כאלה (זה אגב סופר ממכר, המשחק הזה קיים והוא סופר ממכר) אנחנו נשתף יותר אנשים בלייצר את הידע החופשי הזה ולהיות שותפים פעילים בהבניית הידע בעולם

אנחנו קצת מתחילים לממש את הרעיון של ה”באבל פיש” של דאגלס אדמס, של מכונות שיכולות לתרגם לנו בזמן אמת את השפה האנושית. אז אנחנו עוד לא שם, אבל מה שאנחנו עושים היום בויקידאטה בסופו של דבר יעזור למכונות להגיע לרגע הזה שבו הן תוכלנה להבין שפה אנושית טוב יותר, בזכות זה שאנחנו מתרגמים משפה לשפה, לכן זה יעלה בסופו של דבר על כל מה שגוגל טרנסלייט עושה. יש לנו היום הרבה מאד סוכנים חכמים ברשת, כמו אלכסה וכמו סירי שהציבור מכיר, כל מני סוכנים חכמים שמסתובבים ברשת ונותנים תשובות אוטומטיות. התשובות האלו מגיעות הרבה פעמים מויקידאטה. בינה מלאכותית ורשתות נוירונים, אנחנו היום מאמנים אותם על בסיס הנתונים שנמצאים בתוך ויקידאטה

בשנה שעברה התפרסמו בתקשורת כמה סיפורי זוועות על דברים בלתי הולמים שאלכסה, העוזרת האישית הבייתית של אמאזון, אמרה לילדים. אלכסה הקריאה מתוך טקסטים בויקיפדיה שהוכנסו לערכים כפעולת ונדליזם ולא נמחקו בזמן

למעשה אחד הדברים שאנחנו חושבים עליהם עכשיו זה איך ליצר צליל מיוחד למיזמים שלנו, כזה שכשמישהו למשל מקבל תשובה מסירי או אלכסה הוא יוכל לדעת מאיפה זה בא. ויקיפדיה היום, אמורים לקרוא אותה – לפחות הסטודנטים שלי קוראים אותה – קריאה ביקורתית. כי לא כל דבר מושלם שם, לא כל דבר נכון

המצב שבו בינות מלאכותיות מסחריות שואבות מויקיפדיה באמצעות ויקידאטה מעצים עוד יותר את האימפקט של הידע הקולקטיבי הזה, וגם מעורר את השאלה האם האידאל של חכמת ההמונים אכן משרת את ההמונים, את הציבור, או ששעות העבודה שמושקעות בזה מנוצלות ומנוכסות על ידי תאגידים מסחריים לאופטימיזציה של האלגוריתמים שלהם? שני לא רואה את זה ככה

זה לא שלא אכפת לנו אבל זה חלק מהיופי של מידע פתוח. גם היום ויקיפדיה, יש זכויות יוצרים על מה שכתוב בויקיפדיה והיא משוחררת לציבור תחת רישיון שנקרא “ייחוס שיתוף זהה“. תכלס מה שהרישיון הזה אומר, זה שכל בנאדם יכול להשתמש בכל החומר שנמצא בויקיפדיה, כל עוד הוא נותן קרדיט ומשתף את זה הלאה באותו רישיון. אין שם החרגה של שימוש מסחרי. מראש אנחנו מאפשרים לעשות בכל התוכן של ויקיפדיה, שנוצר ע”י מתנדבים ולטובת הציבור, אפשר לעשות בו גם שימוש מסחרי. זה כל היופי בזה שמידע הוא באמת פתוח וניתן לעשות בו כל שימוש. גם על זה יש מחלוקות בקהילה הבינלאומית ויש כאלה שחושבים שאנחנו צריכים לעבוד עם רישיונות אחרים

כמה שזה נשמע מוזר ואפילו שנוי במחלוקת בתוך הקהילה עצמה, כך נראה, אולי זה בדיוק סוד ההצלחה. כולם זה באמת כולם, מילד באפריקה ועד מנכ”ל גוגל, מימון ציבורי שמקבל תרומות גם מגופים מסחריים. ונראה שיש כאן פתרונות מסוג ווין-ווין שבלעדיהם אולי ההיקף וההשפעה של ויקימדיה היו קטנים בהרבה. לאחרונה קרן ויקימדיה ניסחה חזון מפורט ל2030 ואפילו אישרה מיזם טכנולוגי נוסף, חדש יותר. ביקשתי משני לגלות לנו קצת, לאיזה כיוון תתקדם הרשת החופשית לאדם ולבוט בעשור הקרוב

עשינו תהליך אסטרטגי עכשיו שארך כמה שנים והיה חסר תקדים בגודל שלו ובמאמץ שעשינו באמת להגיע לכל פינה ופינה בתנועת ויקימדיה בכל המדינות, בכל הארצות, תארו לכם כמה זה מורכב. והצלחנו להגיע לעשר המלצות למימוש, שאנחנו כבר בתהליך של להתחיל לממש אותן בשנה וחצי הקרובות. אבל יש כמה נקודות במסמך הזה, שבעיני עשויות לעניין את ציבור. קודם כל שיפור חווית המשתמש\ת באתר, על כל המשתמע מכך. זה אומר יותר וידאו, תצוגה אדפטיבית, דרך נוחה יותר לצרוך את ויקיפדיה ומיזמי האחות שלה במובייל. לזהות נושאים שיש להם אימפקט משמעותי לציבור ולוודא שאנחנו עובדים עליהם ומייצרים בהם תוכן. בין היתר אני יכולה לתת דוגמא למה זה אומר, בשיתוף פעולה עם גוגל: רוב האנושות היום עדיין מחפשת דברים בגוגל, ואם הם מחפשים ולא מוצאים את מה שהם רוצים בויקיפדיה, החיפושים האלה חשובים לנו. זה עוזר לנו להבין מה הציבור מחפש ואין לו. ואז אנחנו משתמשים בנתונים האלה שאנחנו מקבלים מגוגל במסגרת שיתופי פעולה, כדי לוודא שאנחנו כותבים ערכים בתחומים האלה, החסרים. לתת לציבור את מה שהוא מחפש, לוודא שיש לנו מידע על מה שהציבור רוצה, בתוך המיזמים שלנו

אני אסיים עם אנקדוטה ומידע חדש חדש, טרי כזה מהתנור: עד עכשיו ויקידאטה הייתה מיזם האחות הצעיר ביותר של ויקיפדיה, אבל השנה אנחנו אישרנו מיזם אחות חדש, שנקרא אבסטרקט ויקיפדיה, ולפעמים עונה גם לשם ויקילאמדה. הוא יאפשר לנו לבטא קשרים מורכבים יותר או עובדות חשובות בצורה שויקידאטה לא הצליחה לבטא, אבל באופן מובנה, שכמו בויקידאטה, גם אנשים וגם מכונות יכולות לקרוא. אז למשל, אם את נכנסת היום לערך של מארי קירי, יהיה לך כתוב בפתיח שהיא זכתה בשני פרסי נובל, גם בכימיה וגם בפיזיקה. דבר גדול ומאד לא טריוויאלי. בויקידאטה כשתכנסי לפריט על מארי קירי, את תראי את זה, אבל לא יהיה שום דבר שעוזר לנו לסמן כמה זה יוצא דופן, כמה זה מיוחד. זה בעצם עוד דרך להצליח למכן עוד חלקים מוויקיפדיה. זה יהיה קריטי לשפות שבהן יש קהילות מאד קטנות או ערכים שיש פחות מתנדבים שעוסקים בתחומי הדעת האלה

בסופו של דבר זה יעזור לנו לתת שירות טוב יותר גם לציבור וגם למכונות, להבין את הידע אנושי. כמה נחמד זה יהיה אם נוכל לראות צירי זמן ומפות אינטראקטיביות וכל מני רשימות, בתוך ויקיפדיה ולא רק בנפרד ממנה. אז בעתיד אני לא אתפלא אם יהיו בוטים שמתרגמים לנו ערכים בעצמם משפה לשפה, או יוצרים ערכים בעצמם על בסיס נתונים. אנחנו חיים בעידן של פייק ניוז ופוסט אמת ודיפ פייק ומכונות שצוברות יותר ויותר כוח, ובתוך כל העולם המורכב הזה, אנחנו צריכים להמשיך להצליח לעשות את מה שאנחנו עושים


פרופ’ יורם רייך מהפרק הקודם בטח היה אומר על ויקימדיה שמדובר בהצלחת עיצוב גדולה, ובאמת ניתן היה לראות איך חלק מעקרונות העיצוב שלו יושמו כאן. אני לומדת מזה שכשנשארים מפוקסים על החזון שלנו בכל תנאי, גם קבוצת דגים קטנה ותמימה שכולם לעגו ליומרה האידאליסטית שלה, יכולה לתפוס מקום של דג גדול ומכובד, לשתף פעולה עם כרישים, ולהפוך ים מזוהם למדי למקום קצת יותר יפה עבור כולנו. זה לא מושלם, זה לא פשוט, אבל כשיש רק קצת יותר אור ובנייה מאשר ברדק ופירוק, ויש כוונה טובה וניסיון תמידי להשתפר, אז יש בידינו סיפור הצלחה, ונראה לי שאין ויכוח על כך שזה המוצר הציבורי הטוב ביותר שהניבה לנו הרשת עד כה. מה שכן, נראה לי שלבוטים יש חלק נכבד בסיפור ההצלחה הזה, כי אולי בעולם גלובלי ומגוון כל כך, אפילו חכמת ההמון לא מספיקה וחייבים מידה של אוטומציה ועזרה של אייג’נט נוסף, כי העידן הפוסט אנושי באמת קצת מורכב בשביל האנושי לבדו

שני היא בנאדם מרתק ויש עוד דברים שיעניינו אתכם לדעת על פועלה ועל קרן ויקימדיה, אז ביום ראשון יתפרסם בעמוד הפייסבוק של הפודקאסט (ומצורף כאן למטה) מוסף לפרק, עם חלקים נוספים מהשיחה שלנו שנותרו על מסך תוכנת העריכה. עד כאן להפעם ונשתמע בפרק הבא

?רוצה לקבל מייל ברגע שהפרק הבא מתפרסם

:מקורות וקריאה נוספת

הובס, תומאס (במקור 1651). לויתן: או החומר, הצורה והשלטון של קהיליה כנסייתית ואזרחית. ירושלים: הוצאת מאגנס, תשכ”ב

בנקלר, יוחאי. (2014) הפינגווין והלוויתן: נצחון שיתוף הפעולה על האנוכיות. תרגמה מאנגלית: אביגיל בורשטיין. הוצאת כנרת זמורה ביתן

Reagle, Jospeh. 2010. Good Faith Collaboration: The Culture of Wikipedia. Cambridge, MA: The MIT Press.

Reagle, Joseph and Koerner, Jackie (editors). 2020. Wikipedia @ 20: Stories of an Incomplete Revolution. Cambridge, MA: The MIT Press.

להרחבה על ויקידאטה: צפו בהרצאה של שני אבנשטיין סיגלוב במסגרת קולוקוויום תרבות דיגיטלית של מכון כהן להיסטוריה ופילוסופיה של המדעים באוניברסיטת ת”א מנובמבר 2019. אפשר גם באנגלית, הרצאה קצרה יותר, שניתנה במוזיאון המדע בלונדון בשיתוף עם אונ’ לונדון באוגוסט 2020 בהקשר של שימור תרבותי

Published by Dr. Carmel Vaisman

חוקרת תרבות דיגיטלית עם מיקוד בשיח, תיאולוגיה ופוסט-אנושיות Digital Culture researcher focusing on discourse, theology and posthumanism

One thought on “פרק 15. עיין ערך בוט: מויקיפדיה לויקידאטה עם שני אבנשטיין סיגלוב

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: