האם הבינה המלאכותית מדמוקרטת מידע או הופכת לכלי לחשיפה?

פתיחה — הקישור שהבינה המלאכותית שלפה

יום אחד התייעצתי בעבודה עם מערכת AI לגבי הדרך הנכונה להשתמש בכלי שמספק ספק חיצוני. זו לא הייתה תוכנה קוד פתוח מפורסמת, וגם לא מוצר מסחרי עם קהילה ענפה, אבל ניתן למצוא עליו מעט מידע מפוזר ברשת.

ה-AI נתנה לי פתרון מדויק, ועוד הוסיפה “קישור מומלץ” כמקור.

הקישור נפתח בלי בעיות. על הדף הופיע בדיוק המידע שחיפשתי, אבל הכותרת הכריזה:

“סודי — לא לשיתוף מחוץ לחברה”.

רגע, מאיזו חברה המסמך הזה בכלל? בדיקה קצרה גילתה שהוא לא של הארגון שלי וגם לא מדריך רשמי של הספק; כנראה מדובר במדריך פנימי של חברה אחרת שמשתמשת באותו כלי.

איזה מזל?

…

ממש לא. זו הייתה נקודה שבה הרגשתי צמרמורת.

אפשר אמנם לאתר את הדף אם מחפשים ידנית עם מילות המפתח המתאימות, אבל הוא קבור עשרות עמודים בתוך תוצאות החיפוש — מחט בערימת שחת.

חלק ראשון: “הדמוקרטיזציה” שהבינה המלאכותית מביאה

מנועי חיפוש מבוססי זחלנים אילצו אותנו לחפש גרגר זהב בערמות של חול. החברות אמנם משקיעות מאמצים כדי להעלות תוצאות רלוונטיות לראש הרשימה, אבל יש לכך גבול: אתרים גדולים תופסים את העמודים הראשונים, ואילו פרטים חשובים נשארים בעמודים הנידחים.

ה-AI, לעומת זאת, פשוט שולפת את גרגר הזהב עצמו — גם אם הוא מתחבא באתר מדורג-נמוך — כל עוד הוא תואם את השאלה.

מידע שלאנשים היה לוקח עשרות דקות למצוא, או שהם ויתרו עליו מזמן, צץ מיד אם השאלה מדויקת.
אנשים שלא הייתה להם גישה לידע מקצועי או לניסיון מצטבר יכולים פתאום לגעת בתשובה בעצמם.

זו ללא ספק דמוקרטיזציה של הגישה למידע. כמו שהאינטרנט פעם שבר את מונופול הידע, כך AI הופכת את הידע לפחות נחלתם הבלעדית של מומחים ומכובדים.

גם בעולם החינוך והמחקר ההשפעה ניכרת: סטודנטים ואנשי מקצוע שולפים תובנות שבעבר דרשו ספרים מקצועיים או כתבי עת. סטארטאפים יכולים לבנות אסטרטגיה בלי חוזי ייעוץ יקרים, ואנשים פרטיים מסוגלים להרכיב אפליקציה בתוך לילה.

הדמוקרטיזציה הזו נוגעת גם להפצה עצמה. העובדה שכל אחד יכול לפרסם רעיון באינטרנט לא הספיקה; אם היית אלמוני, הסיכוי שמתישהו ימצאו אותך נשאר נמוך.

עכשיו תראו מה קרה: ה-AI שלפה תוך רגע עמוד כמעט בלתי נראה, כנראה כזה שנחשף בטעות ולא עבר אופטימיזציה למנועי חיפוש — ובכל זאת הוא ענה לי בצורה מושלמת.

אפשר לומר בצדק שה-AI דמוקרטיזציה את ההפצה ואת הגילוי של מידע ברמה שהאינטרנט לבדו לא הגיע אליה.

חלק שני: הצד ההפוך — חשיפה

החוויה הזו גרמה לי להבין שהדמוקרטיזציה הזו היא גם מנוע חשיפה.

המסמך הזה הושאר פתוח בגלל הגדרה שגויה. תיאורטית מנוע חיפוש רגיל היה יכול לאנדקס אותו, ולכן גם צד שלישי היה עשוי להגיע אליו. אבל בלי AI, הסיכוי היה קטן — מעט מאוד אנשים עוברים עד עמוד עשרים בתוצאות החיפוש.

מידע שהיה פעם מסתיים ב"טעינו, אבל אף אחד לא ראה, אז ניצלנו" — מגיע עכשיו לכל דורש ברגע שמעורב בו AI.

במקרה שלי מדובר במדריך שימוש (לא משהו שהעולם יקרוס בגללו) וגם לא הייתה כוונה זדונית, ולכן לא נגרם נזק. אבל מה יקרה אם יחפשו במכוון מידע רגיש שנשאר פתוח בטעות? באותו רגע הבנתי שההסתרה המעשית מתה בעידן ה-AI.

“זה קבור עמוק, אז כנראה שאנחנו בסדר” כבר לא תקף. מרגע שמשהו מאונדקס, מי שמחפש אותו יקבל אותו במהירות.

נכון, מודלים גדולים כמו ChatGPT בונים מדיניות שמסרבת לבקשות זדוניות, והסינון רק יתחזק. אבל מה לגבי מודלים שמישהו מריץ בבית בלי שום מדיניות?

פעם הייתה מגפת “וירוסי החשיפה” ב-Winny: מסמכים פנימיים של צבא, רשימות לקוחות, תמונות פרטיות — הכול דלף והפך לסערה ציבורית. חברות אפילו דרשו מהעובדים לחתום שהם לא יתקינו את Winny. (בעצם Winny הייתה רק תוכנת שיתוף קבצים, אבל ככה זה כשבהלה תופסת את המדינה.)

לעומת זאת, השילוב של AI מודרני מסוכן הרבה יותר. מספיק שמידע יהיה נגיש פעם אחת, והוא יגיע לידיים עוינות מהר מהזמנים ההם. אין צורך בוירוס — טעות אחת מספיקה.

ה-AI מספקת תשובה בלי היסוס; אין לה אתיקה או תחושת אחריות. (כן, מודלים עם מדיניות “יהססו”, אבל כיום כל אחד יכול להריץ מודל לא מצונזר — אפילו ב-Hugging Face יש כאלה.)

בעידן ה-AI “זה קבור ולכן בטוח” פשוט לא קיים.

יתר על כן, החשיפה לא נגמרת ברגע אחד. ברגע שה-AI לומדת את המידע, היא מסכמת אותו ומעבירה אותו הלאה — והנתונים זוכים להפצה ולעיגון בו-זמנית. ייתכן שאף אחד לא ישים לב שהייתה דליפה, אבל המידע כבר ימשיך להתגלגל דרך AI כמעט לנצח.

חלק שלישי: הא-סימטריה של המהירות

בעיה נוספת היא הא-סימטריה במהירות.

AI מזהה מידע, מבינה אותו ומגישה אותו בצורה מיטבית במהירות מסחררת, במיוחד כאשר קיים מי שמבקש אותו.
לעומת זאת, חוקים, רגולציה, מנגנוני בקרה או שינוי תודעתי של בני אדם — כל אלה מתעדכנים, במקרה הטוב, בקצב של שנים.

הפער הזה הוא שמעצים את הפחד.

בעבר, הפצת מידע עברה דרך עיתונים, טלוויזיה ומנועי חיפוש — כל שלב כלל חיכוך ועיכוב שאפשרו לחברה להתאים חוקים. AI מורידה את החיכוך כמעט לאפס ומפיצה “תשובה מיטבית” לכל העולם באותו רגע.

התוצאה: ידע נכון, שמועות שגויות ומידע לא נוח — כולם מתפשטים באותה מהירות מהרגע שה-AI לומדת אותם. העתיד שבו מאמר אקדמי ומידע כוזב באנונימיות מוחלטת נאמרים באותו משקל מפי AI כבר כאן.

חלק רביעי: מי נושא באחריות?

במקרה הזה, אני לחצתי על הקישור. לא מדובר בגישה בלתי מורשית: התוצאה הופיעה גם בחיפוש רגיל, ולא פרצתי שום מנגנון אימות. הבעיה היא שההחלטה אם מותר לראות את זה הושלכה עלי כבנאדם, או במילים אחרות — לא הייתה שום נקודת ביקורת ששאלה אם בכלל מותר להראות את התוכן.

AI מספקת תשובה, אבל לא שואלת אם נכון לספק אותה. כפי שכתבתי במאמר קודם, ל-AI אין קיוג’י (כבוד עצמי), אין אמונה, ואין תחושת אחריות. לכן אין ברירה אלא שבני אדם יאזנו אותה.

ליתר ביטחון נכנסתי לעמוד הראשי של האתר ושלחתי מייל לכתובת הקשר שלהם. אני לא משבח את עצמי, אבל מילאתי את החלל שמשאיר חוסר האחריות של AI באמצעות אחריות, מצפון ויראת כבוד אנושיים.

ברור שלא כולם ינהגו כך. יש מי שיפיץ את המידע, ויש כאלה שילמדו את ה-AI שלהם על חומרים פנימיים בלי לחשוב פעמיים. נכון לעכשיו זה עדיין לא קיבל ממד של שערורייה בסגנון וירוסי Winny, אבל נראה לי שבמוקדם או במאוחר זו תהפוך לסוגיה ציבורית.

סיכום — לעצב אחריות בעידן ה-AI

AI מדמוקרטת מידע — בגישה ובפרסום — בעוצמה שלא הכרנו מאז ראשית האינטרנט. אבל בצד השני של המטבע מתרחשות חשיפות בלתי מכוונות שמגיעות במהירות ובדיוק לידיים הלא נכונות. העיקר הוא שהמנטרה “השארנו פתוח אבל אף אחד לא ימצא” פשוט לא עובדת יותר: מרגע שיש אינדוקס, המידע מגיע במהירות ובדיוק אל מי שמחפש אותו.

ואפילו בלי תקלה, מספיק לחבר בין פיסות מידע שפורסמו אי פעם כדי לשרטט דיוקן שאדם מעולם לא התכוון לחשוף. ניסיתי להזין את כל פוסטי הבלוג האלה ל-ChatGPT ולראות מה יקרה; הוא ניתח אותי בדיוק מפתיע — התחושה שלי הייתה דיוק של כ-60%.

הוא אמנם לא פגע במקום העבודה שלי או בגיל המדויק (אבל כן העריך בערך), והיו גם טעויות, אבל זה לא היה רחוק מהמציאות.

הערה: מחקרי סטילומטריה מראים שאפשר לזהות מחבר על סמך כמה עשרות שורות טקסט בלבד.

בהתאם לנושא, אפשר בהחלט להגיע לפגיעה מדויקת. אפילו אוסף שנראה תמים יכול לחשוף מציאות מפתיעה ברגע שמחברים הכול יחד.

הערה: OSINT (מודיעין ממקורות גלויים) הופך לכלי חזק, נגיש ולמעשה זמין לכל אחד — אפילו סטוקר יכול להפעיל אותו כלפי היעד שלו.

מכאן שהאתגר הבא איננו רק “להקשיח” אבטחה. אנחנו צריכים עיצוב של אחריות ואבטחה שמתאים לעידן ה-AI — כזה שמיישר קו עם הקצב שבו מידע מדמוקרט.

הודות ל-AI הידע קרוב מתמיד, אבל יחד איתו קרס המיתוס של “לא ימצאו, אז זה בסדר”. אין לי תשובה סופית להציע היום, אבל ברור שכשה-AI מטשטשת את גבולות המידע, אנחנו חייבים להגדיר מחדש כיצד אנחנו מנהלים אותו.

מכאן והלאה נצטרך לחיות מתוך מודעות לשתי הפנים של המטבע: הדמוקרטיזציה מצד אחד והחשיפה מצד שני.