הבוטים של Claude: מי סורק את האתר שלכם, למה, ומה לעשות עם זה

פורסם על ידי נתי אלימלך ב-15/03/26

מדריך מלא לבוטים של Anthropic - ClaudeBot, Claude-User ו-Claude-SearchBot. מה כל אחד עושה, איך לזהות אותם בלוגים, מתי לחסום ומתי לתת להם להיכנס.

סכם ושאל שאלות עם:
תוכן עניינים

פתחתם לאחרונה את הלוגים של השרת? ייתכן שנתקלתם בשם ClaudeBot.

זהו הבוט של חברת Anthropic, החברה שמפתחת את מודלי Claude. כמו מערכות AI אחרות, גם Claude צריך לגשת לתוכן באינטרנט כדי ללמוד ולספק תשובות למשתמשים.

המשמעות היא שאתרים רבים נסרקים כיום על ידי בוטים של מערכות AI, בנוסף לבוטים של מנועי חיפוש. אם עוד לא קראתם, כתבתי גם מדריך מקיף לבוטים של OpenAI.

הבוטים של Claude

ל‑Anthropic יש שלושה סוגי בוטים עיקריים.

1. ClaudeBot

User-Agent לדוגמה:

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)

ClaudeBot הוא הסורק הראשי של Anthropic.

הוא אוסף תוכן ציבורי מהאינטרנט שעשוי לשמש לאימון מודלים עתידיים של Claude.

חשוב להבין: הסריקה הזו לא אומרת שהתוכן יופיע מיד בתשובות של Claude. מדובר באיסוף נתונים שעשוי לשמש כחלק ממערכי האימון.

2. Claude‑User

User-Agent:

Claude-User

Claude‑User אינו crawler רגיל.

זה user‑agent שמופעל כאשר משתמש מבקש מ‑Claude לקרוא עמוד מסוים מהאינטרנט בזמן אמת.

לדוגמה:

  • משתמש מבקש מ‑Claude לבדוק מאמר
  • Claude פותח את הקישור
  • הבקשה מגיעה לשרת עם user‑agent בשם Claude‑User

זו גישה שמופעלת על ידי משתמשים.

3. Claude‑SearchBot

User-Agent:

Claude-SearchBot

Claude‑SearchBot משמש לאינדוקס תוכן עבור יכולות חיפוש בתוך מוצרי Claude.

הבוט סורק עמודים כדי לבנות אינדקס שמאפשר למערכת למצוא מידע רלוונטי כאשר משתמשים מבקשים חיפוש.

ההבדל בין הבוטים

שלושת הבוטים פועלים בשכבות שונות:

  • ClaudeBot – סריקה ואיסוף תוכן לאימון מודלים
  • Claude‑SearchBot – אינדוקס תוכן עבור חיפוש
  • Claude‑User – שליפה של עמודים בעקבות בקשה של משתמש

איך לזהות את הבוטים בלוגים

אם יש לכם גישה ללוגים של השרת, חפשו את המחרוזות:

ClaudeBot
Claude-User
Claude-SearchBot

מספר הגרסה עשוי להשתנות. לכן עדיף לחפש לפי שם הבוט בלבד.

robots.txt

ניתן לשלוט בבוטים של Claude דרך robots.txt.

לדוגמה:

User-agent: ClaudeBot
Disallow: /

אפשר גם לחסום רק אזורים מסוימים באתר:

User-agent: ClaudeBot
Disallow: /premium/
Disallow: /members/

Anthropic מציינים כי הבוט שלהם מכבד גם את ההנחיה:

Crawl-delay

לדוגמה:

User-agent: ClaudeBot
Crawl-delay: 1

כך ניתן להאט את קצב הסריקה אם יש עומס על השרת.

טווחי IP

בניגוד לחלק מהחברות בתחום, Anthropic לא מפרסמים רשימה קבועה של טווחי IP לבוטים שלהם.

הסיבה היא שהבוטים פועלים לעיתים דרך תשתיות ענן ציבוריות ולכן כתובות ה‑IP עשויות להשתנות.

הדרך המומלצת לשליטה בגישה היא robots.txt.

יצירת קשר עם Anthropic

אם אתם מזהים בעיה עם הסורק שלהם, ניתן ליצור קשר עם Anthropic דרך הכתובת:

claudebot@anthropic.com

בוטים ישנים של Anthropic

בעבר הופיעו גם user‑agents נוספים:

Claude-Web
Anthropic-AI

אלו אינם בשימוש כיום אך עדיין ניתן למצוא אותם בקבצי robots.txt ישנים.

איך לזהות תנועה מ‑Claude באנליטיקס

כאשר Claude פותח עמוד בעקבות בקשה של משתמש, הבקשה תגיע עם user‑agent בשם Claude‑User.

במקרים כאלה ניתן לזהות את התנועה בלוגים של השרת או בכלי אנליטיקס.

חשוב להבין: robots.txt אינו מנגנון הגנה

robots.txt הוא פרוטוקול מבוסס כבוד.

בוטים גדולים כמו ClaudeBot מכבדים אותו, אך אין מנגנון טכני שמונע מבוטים אחרים להתעלם ממנו.

אם יש תוכן רגיש במיוחד כדאי להשתמש באמצעי הגנה נוספים:

  • אימות IP
  • rate limiting
  • חסימה ברמת WAF

מה לקחת מפה

  1. ל‑Anthropic יש שלושה בוטים עיקריים: ClaudeBot, Claude‑SearchBot ו‑Claude‑User
  2. ClaudeBot סורק אתרים ואוסף תוכן ציבורי לאימון מודלים
  3. Claude‑SearchBot משמש לאינדוקס תוכן לחיפוש
  4. Claude‑User ניגש לעמודים כאשר משתמש מבקש מ‑Claude לקרוא אותם
  5. ניתן לשלוט בגישה דרך robots.txt

אם אתם רוצים להבין איך מערכות AI משתמשות בתוכן שלכם באינטרנט, מעקב אחרי הבוטים האלו בלוגים הוא מקום מצוין להתחיל.

אם אתם רוצים להשפיע על מה שמערכות AI אומרות עליכם ולא רק לצפות מהצד, זה בדיוק מה שאני עושה כמומחה GEO.

מחבר
Nati Elimelech
נתי אלימלך
יועץ SEO ו-GEO לאתרים גדולים וארגונים, עם למעלה מ-20 שנות ניסיון. ראש מחלקת SEO ונגישות לשעבר ב-Wix, שם בניתי מערכות SEO המשרתות 250 מיליון אתרים. אני מתמחה בפתרון אתגרי SEO טכניים מורכבים בסקייל ארגוני, באופטימיזציה למנועי AI (ChatGPT, Perplexity, Gemini) ובתרגום דרישות SEO לשפה שצוותי מוצר ופיתוח מבינים. עוד על נתי אלימלך.