與客戶代理同步內容來源時,可能會遇到錯誤。以下將介紹如何檢視內容來源的同步狀態,並排除常見錯誤,以確保您的客戶代理使用最新的內容。
檢視新增至客戶代理的內容來源的同步狀態
在排除特定錯誤之前,請檢查所有新增內容來源的同步狀態:
無法擷取內容。如果 URL 回傳404 Not Found 錯誤 、網域名稱無法定位或內容已被刪除,就會發生這種情況。
確認 URL 正確,且網頁可公開存取。
檢查網站的安全設定,例如防火牆,可能會阻擋爬蟲。
如有需要,請與團隊中的開發人員合作,允許在頁面上列出 IP 範圍 54.174.58.224/27。
爬蟲無法載入或呈現網頁。這通常是由網頁上複雜的 JavaScript 所造成。
網站回應的方式爬蟲無法理解。例如,有太多的重定向或不支援的狀態代碼。
請您的網站管理員或開發人員檢查重定向循環或異常狀態代碼。
如有需要,請更正任何重定向設定,並嘗試再次新增內容。
網站的 robots.txt 檔案包含不允許我們的爬蟲存取頁面的規則。 HubSpot爬行器遵循 此標準協議 。
您的網頁HTML 標頭 中的 "noindex "元標籤阻止了網頁被索引或抓取。
移除頁面中的 "noindex" meta 標籤。
爬行器收到 401、403 或類似的錯誤。該頁面可能受到保護、需要登入或被防火牆封鎖。
公開網頁。
如果內容是隱私的,請上傳成 PDF/DOCX 格式。
與您的網站管理員或團隊中的開發人員合作,確保您嘗試新增的頁面上的 IP 範圍 54.174.58.224/27 未被封鎖或過濾。
HubSpot 頁面(網站和登入頁面、部落格文章等)需要有效的 URL,以便系統可以載入它們。連結的 URL 不是空白就是無效。
按照本文的步驟更新 HubSpot 內容的 URL。然後,再次嘗試新增內容。
伺服器回應一般失敗錯誤(500 或 503)。這通常表示網站暫時停機,或伺服器主動阻擋 HubSpot 爬蟲。
您試圖新增的 HubSpot 主機內容目前處於草稿狀態,尚未發佈。
發佈頁面,然後嘗試再次新增內容。 如果您不想讓內容公開存取,請進一步瞭解如何讓內容隱私化。
您嘗試新增的檔案不是支援的格式。客戶代理支援下列檔案類型:
.docx、.htm、.xhtml、.cfg、.pptx、.mpg、.conf、.mpeg、.csv、.json、.html、.text、.txt、.mp4、.pdf、.rst、.avi、.mov、.xml、.md 和 .webm。
將檔案轉換為上述支援的格式之一,然後嘗試再次新增內容。
文件太大。客戶代理支援:
嘗試將檔案分割為兩個或更多較小的檔案,然後再嘗試新增內容。
嘗試建立安全 HTTPS 連線時發生錯誤。伺服器證書可能過期或無效,或伺服器使用過時的 TLS 設定。