免責聲明:這不是 Google 官方產品。
FeedGen 最適合最多 30k 個項目。希望進一步擴大規模?加入Product Studio API alpha (請聯絡 [email protected])或考慮在 BigQuery 中處理您的 Feed。
概述 • 入門 • 它解決什麼問題 • 運作方式 • 如何貢獻 • 社群聚焦
gemini-1.5-pro
和gemini-1.5-flash
的支持structured_title
和structured_description
而不是分別使用title
和description
。有關詳細信息,請參閱這些說明。gemini-1.5-pro-preview-0409
。請注意,型號名稱將來可能會發生(重大)變更。gemini-1.0-pro
和gemini-1.0-pro-vision
gemini-pro
和gemini-pro-vision
)gemini-pro-vision
)v1
並在main
上切換至 JS/TS FeedGen是一款開源工具,它使用 Google Cloud 最先進的大型語言模型 (LLM) 來改進產品標題、產生更全面的描述並填充產品 Feed 中缺少的屬性。它使用生成式人工智慧以簡單且可配置的方式幫助商家和廣告商發現並解決其來源中的品質問題。
該工具依靠 GCP 的 Vertex AI API 在 GCP 的基礎 LLM 上提供零樣本和少樣本推理功能。透過少量提示,您可以使用您自己購物來源中的最佳 3-10 個樣本來自訂模型對您自己的資料的回應,從而實現更高的品質和更一致的輸出。這可以透過使用您自己的專有資料微調基礎模型來進一步優化。在本指南中了解如何使用 Vertex AI 微調模型以及這樣做的好處。
注意:在使用 FeedGen 之前,請檢查您的目標 Feed 語言是否是 Vertex AI 支援的語言之一,如果不是,請聯絡您的 Google Cloud 或客戶代表。
開始使用 FeedGen:
Getting Started
工作表中詳細說明進行操作優化購物 Feed 是每個與 Google Merchant Center (MC) 合作的廣告客戶的目標,以改善查詢匹配、增加覆蓋範圍並最終提高點擊率 (CTR)。然而,在 MC 中篩選不批准的產品或手動修復品質問題很麻煩。
FeedGen 使用生成式 AI 解決了這個問題 - 讓用戶以自動化的方式發現和修復品質問題,並填補提要中的屬性空白。
FeedGen 是一個基於 Apps 腳本的應用程序,在 Google 表格中作為 HTML 側邊欄(有關詳細信息,請參閱 HtmlService)運行。相關的 Google Sheets 試算表範本是所有魔法發生的地方;它保存需要最佳化的輸入來源,以及控制內容產生方式的特定配置值。此電子表格也用於(可選)人工驗證和在 Google Merchant Center (MC) 中設定補充 Feed 。
一般來說,Vertex AI 中的生成語言是一項新興功能/技術。我們強烈建議手動檢查和驗證生成的標題和描述。 FeedGen 透過為標題和描述(以及詳細元件)提供表示產生內容「好」程度的分數,以及透過資料過濾器大量批准產生內容的 Sheets 原生方式,幫助使用者加快這一過程。
首先,複製範本電子表格並按照入門部分中定義的說明進行操作。第一步是透過「初始化」按鈕向 Apps 腳本環境驗證您自己的身份,如下所示。
然後,導覽至配置工作表以配置來源設定、Vertex AI API 設定(包括將產生的成本的估計)以及控制內容產生的設定。
描述產生的工作原理是採用配置表中給出的提示前綴,附加來自輸入的一行資料並將結果作為提示發送給 LLM。這為您提供了極大的靈活性來塑造措辭、風格和您可能有的其他要求。輸入來源中的所有資料都將作為提示的一部分提供。
如果輸入來源中提供了網頁鏈接,您還可以選中Use Landing Page Information
複選框以加載產品網頁的經過清理的內容並將其傳遞到提示中。所有span
和p
標籤均從獲取的 HTML 內容中提取並連接在一起,形成附加的資訊段落,並在提示中傳遞給 LLM,以及有關如何使用此附加資訊的專用說明。 JSON Web 回應將按原樣使用,無需額外解析。此外,使用 Apps Script 的 CacheService 將取得的網頁資訊快取 60 秒,以避免重新取得和重新解析內容以產生標題(這是對 Vertex AI API 的單獨呼叫)。
可選:您也可以在「少量範例」部分中提供描述範例(請參閱下文)。這些也將附加到提示前綴中,並告知模型良好的描述是什麼樣的。
結果直接輸出為產生的描述
由於法學碩士有產生幻覺的傾向,因此可以選擇詢問模型(在同一提示中的後續說明中)產生的描述是否符合您的標準。該模型評估它剛剛產生的描述,並以數字分數和推理進行回應。提供了範例驗證標準和評分,以給出有關如何指示模型評估描述的一些提示 - 例如,它包括標準以及範例評分值。
標題使用少鏡頭提示;一種技術,人們可以從自己的輸入來源中選擇樣本,如下所示,以自訂模型對其資料的回應。為了幫助完成此過程,FeedGen 提供了一個實用的 Google Sheets 公式:
= FEEDGEN_CREATE_CONTEXT_JSON( ' Input Feed ' !A2)
與其他表格公式一樣,它可用於透過向下拖曳來填入幾次提示範例表中的「上下文」資訊欄位。此「上下文」表示來自該專案的輸入來源的整行數據,它將作為提示的一部分傳送到 Vertex AI API。
之後,您必須手動填寫少數提示範例表的剩餘列,這些列定義了 LLM 的預期輸出。這些範例非常重要,因為它們為法學碩士學習如何為其餘輸入來源產生內容提供了基礎。最好的選擇範例是以下產品:
我們建議您在 Feed 中為每個獨特類別至少添加一個範例,尤其是在理想的標題組成有所不同的情況下。
FeedGen 預設使用輸入提要中的屬性而不是產生的屬性值來組成標題,以避免 LLM 幻覺並確保一致性。例如,特定提要項的輸入提要屬性Color中的值Blue
將用於其對應的標題,而不是產生的值Navy
。此行為可以透過「標題提示設定」的「進階設定」部分中的Prefer Generated Values
複選框來覆蓋,並且在輸入來源本身包含錯誤或品質不佳的資料時非常有用。
在同一部分中,您還可以指定可以在生成的標題中輸出的安全詞列表,即使它們之前不存在於您的提要中。例如,如果您想要為Size
屬性的所有值加上前綴(即「Size M」而不是「M」),則可以將單字「Size」新增至此清單。
最後,您也可以使用Use LLM-generated Titles
複選框指定是否希望 LLM 為您產生標題。這允許 LLM 檢查生成的屬性值並選擇將哪些屬性值連接在一起 - 避免重複 - 而不是將所有屬性值縫合在一起的預設邏輯。此功能應該比 PaLM 2 更適合 Gemini 模型,因為 Gemini 模型具有更好的推理功能,使它們能夠比 PaLM 2 模型更好地提示指令。此外,LLM 產生的標題可讓您在提示中指定所需的標題長度(Merchant Center 最多 150 個字元),這在以前是不可能的。
與描述一樣,您也可以選擇從提供的網頁連結加載資訊並將其傳遞給法學碩士以產生更高品質的標題。這可以透過Use Landing Page Information
複選框來完成,選取後,從網頁資料提取的所有功能將列在名為「網站功能」的新屬性下。現有屬性未涵蓋的新單字將會加入到生成的標題中。
現在您已完成設定並準備好優化您的 Feed。使用頂部導覽功能表啟動 FeedGen 側邊欄並開始在生成內容驗證工作表中產生和驗證內容。
您通常會在此視圖中工作,以了解、批准和/或重新產生每個來源項目的內容,如下所示:
完成所有必要的批准並對輸出感到滿意後,按一下匯出至輸出來源將所有核准的來源專案傳輸到輸出來源工作表。
最後一步是將電子表格作為補充來源連接到 MC,這可以按照標準 MC 帳戶的幫助中心文章和多客戶帳戶 (MCA) 的幫助中心文章中的描述來完成。
請注意,輸出提要中有一個att-p-feedgen欄位。此列名稱完全靈活,可以直接在輸出工作表中變更。它將自訂屬性新增至補充提要中,以用於報告和績效衡量目的。
由於 Gemini ( gemini-pro-vision
) 是一個多模式模型,因此我們能夠額外檢查產品圖像並使用它們來產生更高品質的標題和描述。這是透過向現有標題和描述生成提示添加附加指令來完成的,以便從提供的圖像中提取可見的產品特徵。
對於標題,提取的特徵有兩種使用方式:
對於描述,模型使用提取的特徵來產生更全面的描述,突出產品的視覺方面。這對於視覺吸引力至關重要的領域尤其重要;產品的關鍵細節以視覺方式傳達,而不是以提要中的結構化文字格式。其中包括時裝、家居裝飾和家具、香水和珠寶等。
最後,需要注意以下限制(此資訊在 Gemini公共預覽期間有效):
Image Link
列中指定網頁映像和/或 Google Cloud Storage (GCS) 檔案 URI。 GCS URI 按原樣傳遞給 Gemini(因為模型本身支援它們),而首先下載 Web 映像並作為模型輸入的一部分內聯提供。image/png
和image/jpeg
MIME 類型。得分低於Min. Evaluation Approval Score
不會被預先批准。您可以透過篩選「描述分數」並刪除「產生驗證」標籤中的「狀態」值來重新產生這些值。
FeedGen 為產生的標題提供 -1 到 1 之間的分數,作為品質指標。正分錶示不同程度的良好質量,而負分錶示產生內容的不確定性。與描述一樣,您可以指定希望 FeedGen 預先批准的最低分數(預設為 0)。
讓我們仔細看看一些虛構的例子,以便更好地理解標題的評分:
讓我們來看看同一產品的另一個範例:
<Brand> <Gender> <Category> <Product Type>
<Brand> <Gender> <Category> <Product Type> <Size>
Product Type
屬性的組件以更糟糕的方式發生了變化,因此得分為負。FeedGen 的評分比較保守;每當任何單字被刪除時,它都會分配 -0.5 的分數,即使這些單字是促銷短語,例如
get yours now
或while stocks last
,根據Merchant Center (MC) 概述的最佳實踐,這些單字不應成為標題的一部分。
好吧,那麼什麼才是一個好的標題呢?讓我們來看另一個例子:
最後,理想的情況是什麼?讓我們來看最後一個例子:
總而言之,評分系統的工作原理如下:
是否出現幻覺? | 我們刪除了任何文字嗎? | 一點變化都沒有嗎? | 我們優化了標題嗎? | 我們是否填補了缺失的空白或提取了新的屬性? |
---|---|---|---|---|
-1 | -0.5 | 0 | 添加0.5 | 添加0.5 |
FeedGen 也應用一些基本的 MC 合規性檢查,例如標題和描述不得分別超過 150 個和 5000 個字元。如果產生的內容未通過這些檢查,則「狀態」列中將輸出值Failed compliance checks
。如上所述,每當按一下「產生」按鈕時,FeedGen 將首先嘗試重新產生Failed
專案。
FeedGen 不僅可以填補 Feed 中的空白,還可能創建輸入 Feed中未提供的全新屬性。這可以透過配置表中的幾次提示範例進行控制;透過提供這些範例中的輸入中不存在的「新」屬性,FeedGen 將嘗試從輸入 feed 中的其他值中提取這些新屬性的值。讓我們來看一個例子:
原標題 | 原標題中的產品屬性 | 生成標題中的產品屬性 | 產生的屬性值 |
---|---|---|---|
ASICS 女用高績效七分褲緊身褲 | 品牌、性別、產品類型 | 品牌、性別、產品類型、適合度 | ASICS,女用性能,跑步七分褲,緊身 |
請注意這裡Fit屬性是如何從Product Type中提取出來的。 FeedGen 現在將嘗試對 feed 中的所有其他產品執行相同的操作,例如,它將從標題Agave Men's Jeans Waterman Relaxed
中提取值Relaxed
as Fit 。如果您不想建立這些屬性,請確保僅使用輸入提要中存在的屬性來進行幾次提示範例。此外,這些全新的 feed 屬性將在輸出 Feed中以feedgen-為前綴(例如 feedgen-Fit),並將排序到工作表的末尾,以便您在不想使用它們時更容易找到和刪除它們。
我們根據您的業務領域推薦以下標題模式:
領域 | 推薦的標題結構 | 例子 |
---|---|---|
服飾 | 品牌+性別+產品類型+屬性(顏色、尺寸、材質) | Ann Taylor 女式毛衣,黑色(6 碼) |
消耗品 | 品牌+產品類型+屬性(重量、數量) | TwinLab Mega CoQ10,50 毫克,60 粒膠囊 |
硬貨 | 品牌+產品+屬性(尺寸、重量、數量) | Frontgate 柳條露檯椅套裝,棕色,4 件套 |
電子產品 | 品牌+屬性+產品類型 | 三星 88 吋 4K 3D 曲面螢幕智慧 LED 電視 |
圖書 | 標題 + 類型 + 格式(精裝書、電子書)+ 作者 | 1,000 份義大利食譜食譜,精裝本,作者 Michele Scicolone |
您可以依靠這些模式來產生 FeedGen Config
工作表中定義的少量提示範例,這將相應地引導模型產生的值。
我們也提出以下建議:
請參閱 Vertex AI 定價以及配額和限制指南以了解更多資訊。
自 2024 年 4 月 9 日起,根據更新的 Merchant Center 產品資料規範,使用者需要揭露是否使用生成式 AI 來規劃標題和說明的文字內容。這樣做的主要挑戰是,使用者無法在同一個 feed 中同時發送title
和structured_title
,或description
和structured_description
,因為原始列值將始終勝過structured_
變體。因此,在將核准的生成匯出到 FeedGen 的「輸出 Feed」標籤後,使用者需要執行一系列額外的步驟:
title
和description
列分別重新命名為structured_title
和structured_description
。trained_algorithmic_media:
加入所有產生的內容。我們很快就會為您自動執行步驟 #3 和 #4 - 敬請期待!
感謝 Glen Wilson 和 Solutions-8 團隊提供的詳細資訊和圖像。
除了我們的貢獻指南中概述的資訊之外,您還需要遵循以下附加步驟在本機上建立 FeedGen:
npm install
。npx @google/aside init
並點擊提示。Script ID
。您可以透過點擊目標工作表頂部導覽功能表中的Extensions > Apps Script
,然後導覽至產生的「應用程式腳本」視圖中的Project Settings
」(齒輪圖示)來找到此值。npm run deploy
來建置、測試和部署(透過 clasp)所有程式碼到目標電子表格/Apps 腳本專案。