• נתי אלימלך

איך גוגל מאנדקס קבצי PDF + טיפים לאופטימיזציה

עודכן: 13 בנוב׳

אני בטוח שכבר נתקלתם בקבצי PDF בתוצאות החיפוש במהלך שיטוטים וחיפושים בגוגל ותהיתם הכיצד או למה. במאמר זה אסביר כיצד גוגל קורא קבצי PDF, כיצד ניתן לעשות אופטימיזציה לקבצים כאלו ומדוע כדאי להימנע משימוש בקבצי PDF באתר שלכם ככל הניתן.


איך גוגל מתמודד עם קבצי PDF?

לפני שנדבר על מה ניתן לעשות בהקשר של SEO וקבצי PDF, חשוב שנבין איך גוגלבוט מתמודד עם קבצים כאלה. גוגלבוט יודע לקרוא HTML, זה מה שהוא אוכל. קובץ PDF שהוא סוג קובץ קנייני של אדובי הוא לא HTML. אז איך בכל זאת גוגל יודע לקרוא את תוכן הקובץ ולדרג אותו בהתאם?


דרך ההתמודדות של גוגלבוט במקרה של PDF זהה לדרך ההתמודדות שלו עם סוגי קבצי אחרים (docx, ppt וכו׳) בהם הוא נתקל ומעוניין לקרוא ולאנדקס. בגוגל משתמשים במקודדים של אדובי שיודעים להמיר PDF ל-HTML, שזו כאמור שפת האם של גוגלבוט. לאחר שתוכן הקובץ הומר ל-HTML, גוגל מתייחס ל-HTML שהוא מקבל כמו כל דף HTML אחר בו הוא נתקל ברשת.

קובץ PDF אינו HTML
קובץ PDF אינו HTML

אמרנו שגוגל ממיר PDF ל- HTML, עד כאן הכל טוב. כשאנחנו מקדמים אתר ורוצים לבצע אופטימיזציה לעמוד שנמצא בו, אנחנו נכנסים למערכת הניהול ועורכים את התוכן, תגיות המטא וכו׳. קל, פשוט, חכם. כשמדובר ב-PDF זה פחות פחות פשוט ובטוח לא חכם, אבל אפשרי עד למידה מסוימת.


איך לערוך תגיות מטא בקובץ PDF

המקבילה של עריכת תגיות מטא באמצעות פאנל SEO בקבצי PDF נמצאת בדרך כלל תחת File > Properties > Description, אבל זה עשוי להשתנות מעט מתוכנה לתוכנה. תגיות המטא שתוכלו לערוך הן:

  • טייטל (title)

  • תיאור מטא (meta description)

  • מילות מפתח (meta keywords), אבל למה?

עדכון טייטל ותגיות אחרות בקובץ PDF
עדכון טייטל ותגיות אחרות בקובץ PDF

במידה ולא תזינו טייטל ידידותי, גוגל כנראה ישתמש בשם הקובץ על מנת לייצר טייטל, ואז אתם יכולים לסיים עם טייטל בסגנון ״מרלוזות טריות סופי סופני 2״, אז מאוד ממליץ להזין את השדה הזה או לכל הפחות לשנות את שם הקובץ למשהו קריא יותר.


מדוע כדאי להימנע משימוש בקבצי pdf באתר

אז אפשר להתברג בתוצאות החיפוש של גוגל עם קבצי PDF, ובכל זאת, ישנן סיבות מאוד טובות לנסות להימנע מכך ובמקום, להמיר אותם לטקסט חי שנמצא בעמוד רגיל באתר.


תנועה לקבצי PDF לא מופיעה באנליטיקס

סבירות גבוהה שאתם מדווחים ללקוחות או למנהלים שלכם על הביצועים בגוגל באמצעות אחת מתוכנות האנליטיקס בשוק, וסבירות עוד יותר גבוהה שאתם משתמשים בגוגל אנליטיקס או ב-GA4 ימח שמו וזכרו.


בניגוד לדף HTML שבו ניתן להטמיע קודי מעקב ופיקסלים, בקובץ PDF זה פשוט בלתי אפשרי. אם תקבלו טראפיק לקובץ PDF, זה לא יופיע באנליטיקס. קליקים מדפי תוצאות החיפוש של גוגל יופיעו במקום אחד בלבד - גוגל סרץ׳ קונסול, אבל שם זה מסתיים. לא חבל לא לדווח על טראפיק שהרווחתם בעמל?


הם לא מאפשרים המשך ניווט באתר

פתיחה של קובץ PDF, בייחוד במובייל, מתרחשת לאחר שהקובץ יורד למכשיר שלכם. משתמשת באתר אהבה את מה שקראה ורוצה להמשיך ולצרוך תכנים שלכם? חבל מאוד, כי היא יצאה מהאתר ברגע שנפתח הקובץ. הוסיפו לכך את העובדה שאין תפריט ואין דרך משמעותית להגדיל את צריכת התכנים באתר וקבלתם סיבה נוספת להמנע משימוש ב-PDF באתר.


משתמש אחר אהב את התוכן ורוצה לשתף עם היקרים לו? גם פה זה חבל מאוד, כי מה שיקרה במצב של שיתוף הוא שהקובץ ישלח בתור, ובכן, קובץ. בשיתוף PDF לא נשלח קישור שמוביל לדף באתר שלכם, אלא קובץ מבודד שנפתח עצמאית ולא תורם לטראפיק שלכם יותר מדי (כן כן, חשיפה/מיתוג/מיצוב בלה בלה).


קשה מאוד לערוך אותם

תוכן טוב הוא בדרך כלל תוכן עדכני, אלא אם מדובר בתכנים ירוקי עד. כדי לעדכן קובץ PDF צריך קודם להוריד אותו למחשב, לפתוח ולערוך אותו עם תוכנה (לפעמים בתשלום), ורק אז להעלות אותו מחדש תחת אותה הכתובת בדיוק על מנת להימנע מביצוע הפניה, וזה התרחיש האופטימי.


במקרים פחות אופטימליים תגלו שהקובץ בעצם נסרק/נשמר כתמונה ואי אפשר לערוך את הטקסט שבו, ואז צריך למצוא את הטקסט המקורי ובהצלחה לכם עם זה. בקיצור, כאב ראש רציני.


איך לבדוק האם גוגל אינדקס קבצי PDF באתר מסוים

על מנת לקבל רשימה של קבצי ה-PDF שאונדקסו בגודל באתר מסוים, נשתמש באופרטורים site ו-filetype בתיבת החיפוש. אופרטור site נותן לנו רשימה של כל הדפים המאונדקסים מאתר מסוים (לא אמין ב-100% אבל מספיק טוב למטרתנו) ואופרטור filetype ממקד את התוצאות שנקבל לסוג קובץ ספציפי שנרצה לכלול.


להמחשה, אם נרצה לאתר את כל קבצי ה-PDF שגוגל אינדקס באתר ״המכון למחקרי בטחון לאומי״, נשתמש בחיפוש הבא

site:inss.org.il filetype:pdf

ונקבל את רשימת קבצי ה-PDF המאונדקסים בגוגל


רשימה של קבצי PDF שגוגל אנדקס על ידי שימוש באופרטורים site + filetype
רשימה של קבצי PDF שגוגל אנדקס על ידי שימוש באופרטורים site + filetype

ובכל זאת, אם חייבים, כמה טיפים לאופטימיזציה ועבודה עם קבצי PDF

  1. מכיוון שלאחר המרה גוגל מתייחס לתוכן ה-PDF כאל תוכן בדף רגיל, קישורים מתוך הקובץ נחשבים כקישורים לכל דבר ומעבירים כח!

  2. וודאו שהקובץ נוצר מתוך טקסט חי ושאינו למעשה תמונה שמעמידה פנים שהיא PDF, אחרת גוגל יתקשה לראות את התוכן. כלל האצבע או שאם אתם יכולים לסמן/להעתיק טקסט מתוך הקובץ, הוא כנראה נוצר מטקסט חי ולא תמונה

  3. צמצמו את גודל הקובץ, ובייחוד התמונות שבו, ככל הניתן. כי אינטרנט ומהירות וזה

  4. עדכנו טייטל ושם קובץ קריאים ואינפורמטיבים ממש כמו טייטל בכל דף אחר

  5. בחלק מהתוכנות (כולל של אדובי) ניתן להגדיר alt לתמונות, אז.. תגדירו אלט לתמונות


ועדיין, אם לא חייבים, ההמלצה שלי היא תמיד להמיר קבצי PDF לדפי אינטרנט מודרניים שיאפשרו לכם ולמשתמשים שלכם חוויה טובה יותר. די, זה לא שנות התשעים פה.


בהצלחה.