כולם רוצים לתת לסוכן AI להריץ בשבילם הכל, אבל כשהסוכן או ה-Skill הזה מתופעל ע״י ילד בן 14, עם גישה למפתחות SSH ואפשרות להריץ rm -rf זה מתחיל להסתבך.
ארגונים בלחץ היסטרי, חברות סייבר מגייסות מיליונים, ו-
@erans שלנו חושב על הבעיה אחרת.
מה הבעיה? אתה מאשר ״make test״, אבל make היא לא פקודה, זו מערת ארנב, שמריצה סקריפט, ועוד curl, ופתאום ה-API Key שלך באמזון מחתים דרכון בסין.
ה-agentsh של ערן לא סומך על הפקודה, הוא עוקב אחר השרשרת. הוא לא אוסר את הפקודה, הוא מפנה אותה לאזור בטוח. כי מה קורה שסוכן מקבל ״לא״? הוא נהיה יצירתי, הוא מתחיל לעקוף כדי לרצות. אין לי אישור ל-curl? אנסה wget. אין לי wget? אשתמש ב-import urllib. אין לי אפשרות להתקין פייתון? ארים mirror מקומי...
ערן אומר סבבה. תעשה מה שביקשת, אבל דרכי. יש לו wrapperים לפקודות בעייתיות, הוא יודע לעשות soft delete לקבצים שהסוכן ביקש למחוק וגם לפתוח ארגז חול לפקודות בעייתיות.
אז agentsh מבטיח מעקב אחרי כל העץ של ה-processes, ומציע גם מאות חוקים לכל סביבה (פיתוח, CI, בנצ׳מרקים), אבל אף אחד לא רוצה לערוך קובץ חוקים שיתאים לבילד עם עשרים שלבים - אז הוא פיתח discovery. תריץ פעם אחת, אני אצפה, ואז ניצור יחד פוליסה שנועלת.
נחזור לסייבר. חברות מגייסות מיליונים לא כי הן צריכות קוד או פיצ׳רים. ערן וקלוד הצליחו לעשות לבד עבודה של חודשי אדם ארוכים. הן צריכות אמינות, audit חיצוני, bug bounty. הן צריכות עניין מקהילת מפתחים והמון כוכבי github. אחר כן הן צריכות GTM ואנשי sales עם חשבון הוצאות.
מאוד מרשים שבן אחד יכול לעשות היום כל כך הרבה בלי כסף, ולתקוף בעיה בצורה מעניינת, אבל הוא לא לבד:
הרבה כלים חוסמים ברמת הקרנל, או שמציעים לך לנעול הכל בקונטיינר. agentsh חי ב-user-space. הוא מנסה לתפוס תהליכים גם בתוך קונטיינרים, אבל עושה את זה עם shim של shell, מה שלא יעבוד עם בינארים סטטיים. הוא מנסה להיות גם LLM Proxy וגם DLP, גם לדאוג ל-checkpoints וגם לנטר את הרשת.
זה נהיה כבד לבן אדם אחד, אבל ערן לא לבד. יש לו את קלוד.
בהצלחה!
agentsh.org