מה ההבדל בין GPTBot ל-ChatGPT-User?

GPTBot אוסף תוכן ציבורי שעשוי לשמש לאימון מודלים עתידיים של OpenAI. ChatGPT-User אינו crawler רגיל אלא fetcher. הוא מגיע כאשר משתמש שואל שאלה ו-ChatGPT צריך לשלוף מידע עדכני מהאתר שלכם כדי לענות. GPTBot הוא השקעה לטווח ארוך. ChatGPT-User מביא תנועה בזמן אמת.

האם כדאי לחסום את GPTBot ב-robots.txt?

ברוב המקרים לא. חסימת GPTBot מונעת מ-OpenAI לאסוף תוכן מהאתר שלכם לאימון מודלים עתידיים. אם יש סיבה ספציפית, למשל תוכן בתשלום או קניין רוחני רגיש, אפשר לחסום סלקטיבית. חשוב לדעת שחסימת GPTBot לא משפיעה על OAI-SearchBot או ChatGPT-User.

איך אני יודע אם ChatGPT מצטט את האתר שלי?

כדאי לחפש ChatGPT-User בלוגים של השרת. כל בקשה כזו אומרת שמישהו שאל שאלה ו-ChatGPT שלף את הדף שלכם כדי לענות. אפשר גם לבדוק ב-Cloudflare Analytics אם אתם משתמשים ב-CF.

האם הבוטים של OpenAI מכבדים robots.txt?

GPTBot ו-OAI-SearchBot מכבדים robots.txt, ואפשר לחסום כל אחד בנפרד. לגבי ChatGPT-User, התיעוד של OpenAI מציין שכללי robots.txt לא בהכרח חלים, כי מדובר בפעולות שמשתמש יזם.

כמה בקשות הבוטים של OpenAI שולחים?

זה תלוי בגודל ובפופולריות האתר. באתרים ישראליים רבים הבוטים של OpenAI מהווים בערך שליש מתנועת הבוטים.

מדריך הבוטים של OpenAI: GPTBot, ChatGPT-User ו-OAI-SearchBot

פתחתם את הלוגים של השרת לאחרונה? יש שם שמות שלא היו קיימים לפני כמה שנים: GPTBot, ChatGPT-User, OAI-SearchBot. אלו שלושת הבוטים העיקריים של OpenAI.

בשנים האחרונות נוספה שכבה חדשה של סריקות לאינטרנט. בוטים של מערכות AI מחפשים תוכן כדי לענות על שאלות של משתמשים. OpenAI הם לא היחידים. גם ל-Anthropic יש בוטים משלה שסורקים אתרים בדפוס דומה, ולגוגל יש משפחה שלמה של בוטים שחלקם מזינים את החיפוש וחלקם את Gemini.

אם אתם לא רואים אותם בלוגים לאורך זמן זה לא בהכרח אומר שיש בעיה. ייתכן שהאתר קטן, חדש, או פשוט עדיין לא נכנס לרדאר של מערכות AI.

שלושת הבוטים של OpenAI

ל-OpenAI יש שלושה בוטים עיקריים שתראו בלוגים. כל אחד מהם ממלא תפקיד שונה.

בתיעוד הרשמי מופיע גם בוט רביעי, OAI-AdsBot, שבודק עמודים שהוגשו כמודעות ב-ChatGPT. הוא מבקר רק בעמודים כאלה, כך שרוב האתרים לא יפגשו אותו.

1. GPTBot

User-Agent:

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; GPTBot/1.4; +https://openai.com/gptbot

GPTBot הוא הסורק הראשי של OpenAI. הוא אוסף תוכן ציבורי מהאינטרנט שעשוי לשמש לאימון מודלים עתידיים.

חשוב להבין: זה לא אומר שהתוכן נכנס ישירות ל-ChatGPT. הוא עשוי לשמש כחלק ממערכי האימון של מודלים עתידיים.

2. ChatGPT-User

User-Agent:

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/1.0; +https://openai.com/bot

ChatGPT-User אינו crawler רגיל. זה user-agent שמופעל כאשר משתמש מבקש מ-ChatGPT לפתוח עמוד או לקרוא מידע מהאתר.

כל בקשה כזו אומרת שמישהו שאל שאלה. ChatGPT בחר לשלוף את הדף שלכם כדי לענות.

לפעמים ChatGPT משתמש בעותק שמור או במידע שכבר נאסף. ChatGPT-User מופעל בעיקר כאשר נדרש מידע עדכני.

3. OAI-SearchBot

User-Agent:

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36; compatible; OAI-SearchBot/1.4; +https://openai.com/searchbot

OAI-SearchBot משמש לאינדוקס תוכן עבור החיפוש של ChatGPT.

בניגוד ל-ChatGPT-User שמופעל בעקבות שאלות של משתמשים, OAI-SearchBot מבצע סריקות יזומות כדי לבנות אינדקס חיפוש.

ההבדל הקריטי

רבים מתייחסים לבוטים של OpenAI כאל דבר אחד. זו טעות.

שלושת הבוטים פועלים בשכבות שונות:

GPTBot: אוסף תוכן ציבורי שעשוי לשמש לאימון מודלים עתידיים.
OAI-SearchBot: מאנדקס עמודים עבור מנוע החיפוש של ChatGPT.
ChatGPT-User: ניגש לעמודים כאשר משתמש מבקש מ-ChatGPT לפתוח קישור.

איך לזהות את הבוטים בלוגים

אם יש לכם גישה ללוגים של השרת, כדאי לחפש את המחרוזות:

GPTBot
ChatGPT-User
OAI-SearchBot

מספר הגרסה משתנה לעיתים קרובות. עדיף לחפש לפי שם הבוט בלבד.

טווחי IP רשמיים

OpenAI מפרסמים רשימות IP:

טיפ טכני: user-agent לבדו אינו מספיק לזיהוי בוט אמיתי. תמיד כדאי לאמת גם את כתובת ה-IP.

robots.txt

אפשר לשלוט בכל בוט בנפרד.

User-agent: GPTBot
Disallow: /

User-agent: OAI-SearchBot
Allow: /

כך אפשר לחסום שימוש בתוכן לאימון מודלים ועדיין לאפשר הופעה בתוצאות החיפוש של ChatGPT.

ברגע שקיימת בקובץ קבוצה ספציפית לבוט, למשל User-agent: GPTBot, הבוט הזה מציית רק לקבוצה שלו ומתעלם לגמרי מהכללים שתחת User-agent: *. קבוצה ספציפית וקבוצת כוכבית לא מתמזגות, וזה מפיל גם אתרים גדולים. אז אם חסמתם נתיב רגיש תחת * והוספתם קבוצת GPTBot נפרדת, הנתיב הרגיש פתוח בפני GPTBot עד שתחזרו על החסימה גם בקבוצה שלו.

זה חלק מהתקן של robots.txt מה זה robots.txt? robots.txt הוא קובץ טקסט שיושב בשורש האתר ומגדיר אילו כתובות סורקים רשאים לשלוף. robots.txt שולט בסריקה, לא באינדוקס. להגדרה המלאה של robots.txt וחל על כל הבוטים. ג׳ון מולר מגוגל הזכיר את זה ביולי 2026 בהקשר של Googlebot, והיא חלה בדיוק באותו אופן גם על הבוטים של גוגל ושל Anthropic.

זיהוי תנועה מ-ChatGPT

לעיתים ביקורים מ-ChatGPT יגיעו עם הפרמטר:

utm_source=chatgpt.com

כך ניתן לזהות תנועה שמגיעה מ-ChatGPT באנליטיקס.

מה שלא תראו לפי שם: ChatGPT agent ו-Atlas

שלושת השמות למעלה כבר לא מכסים את כל התנועה של OpenAI.

ChatGPT agent, המוצר שבלע את Operator, גולש עם user-agent שנראה כמו Chrome רגיל. במקום שם בוט, הוא חותם על כל בקשה בחתימה קריפטוגרפית בפרוטוקול web-bot-auth מה זה web-bot-auth? web-bot-auth הוא פרוטוקול מתגבש ב-IETF לאימות בוטים: הבוט חותם קריפטוגרפית על בקשות, והאתר מאמת מי שלח אותן. להגדרה המלאה של web-bot-auth , עם כותרות Signature ו-Signature-Agent שמצביעות על chatgpt.com. מי שמשתמש ב-Cloudflare מקבל את האימות הזה אוטומטית.

ChatGPT Atlas, הדפדפן של OpenAI, הוא סיפור אחר: התנועה שלו יוצאת מהדפדפן של המשתמש עצמו, עם user-agent רגיל של Chrome ומכתובת IP ביתית, בלי חתימה. אין דרך אמינה לזהות אותה בלוגים, וכללי robots.txt לא חלים עליה.

השורה התחתונה: זיהוי לפי שם בוט עובד מצוין לשלושת הסורקים המתועדים, אבל הוא כבר לא כל התמונה.

מה לקחת מפה

ל-OpenAI יש שלושה בוטים מרכזיים שמופיעים בלוגים: GPTBot, OAI-SearchBot ו-ChatGPT-User, ולצידם OAI-AdsBot שרלוונטי רק למודעות.
לכל אחד מהם תפקיד שונה.
GPTBot אוסף תוכן לאימון מודלים עתידיים.
OAI-SearchBot קשור לנראות בתוצאות ChatGPT.
ChatGPT-User מופעל כאשר משתמש מבקש לפתוח עמוד.
תנועה של ChatGPT agent מזוהה בחתימה קריפטוגרפית, ותנועת Atlas לא מזוהה בכלל.

מדריך הבוטים של OpenAI: GPTBot, ChatGPT-User ו-OAI-SearchBot

שלושת הבוטים של OpenAI

1. GPTBot

2. ChatGPT-User

3. OAI-SearchBot

ההבדל הקריטי

איך לזהות את הבוטים בלוגים

טווחי IP רשמיים

robots.txt

זיהוי תנועה מ-ChatGPT

מה שלא תראו לפי שם: ChatGPT agent ו-Atlas

מה לקחת מפה

שאלות נפוצות

לקריאה נוספת

כתובות ה-IP של Googlebot: רשימה מלאה (מתעדכנת מדי יום מה-API הרשמי)

נכסי פלטפורמה ב-Search Console: גוגל מתחילה למדוד נוכחות מעבר לאתר